做什麼、怎麼做、做完怎麼量
三件事一次說清楚:哪些已經做了並親自驗過、接下來按什麼順序做(每件附成本)、做完用什麼數字確認有沒有用。不靠感覺,靠可獨立驗證的指標。本頁每個數字後面都標了來源與時間窗。
Worker 量測管道已在 ainews/en 試點上線並親自驗證:AI 爬蟲注入 og:url 帶
?ai_src,真人連抓多次都乾淨(=cloaking-safe),真人帶 ?ai_src 進來則記錄並 301。[來源:Worker 試點親驗,ainews/en,2026-06]
AI 抓取量月 1,540 萬次,但其中能算「引用 / 真人點擊」的只有 194 次。[來源:CF 分析 + DB 歸因,量測窗口內] 兩者不能混算成轉換率(偽漏斗)。正解:3 張分開的 KPI 表,抓取 / 引用 / 訓練各算各的。
owner 策略:往後所有內容一律以「AI 愛的格式」呈現,格式多一點沒關係,寧願多做不要錯過,混搭傳統 SEO + 新 AI 格式低成本測試。你正在看的這頁,就是照這規格做的樣板。
🎯研究目的
為什麼要做這頁?這頁要回答什麼問題?
前兩頁分析了「AI 喜歡什麼格式」和「各家 AI 引擎怎麼抓內容」。這一頁要回答一個更實際的問題:
這頁的目標:給創業家一張帶成本的優先順序清單,不是技術文件,是行動清單。每個建議都標「確定(已實證)」還是「下限/估計」,避免把推測當事實。
含 4 個 ChatGPT 舊 slug 301→200,把流失的引薦接回來 [來源:404 修復實作紀錄]
相對於月抓取量 1,540 萬,這才是真正會導流的數字 [來源:CF + DB 歸因]
抓取量、引用/點擊、訓練 vs 引薦,三件事分開量,不混算
📋計畫
按優先順序排列,從已做到待做,每件事都帶成本,確定的標綠、估計的標黃
✅ 已做(實證有效)
這些已經落地,且有數據或親驗支撐,不需要再花時間討論要不要做。
| 已做的事 | 白話說明 | 實際效果 | 狀態 |
|---|---|---|---|
| 修 21 件 AI 404 斷鏈 | ChatGPT 存的舊網址本來是死路,現在設 301 自動跳轉到正確頁 | 4 個 ChatGPT 舊 slug(網址片段)301→200,回收流失引薦 [來源:404 修復紀錄] | 確定 ✅ |
| 每日數據累積基建 | referer(來源訊號)永久存檔,不再只看當月報表 | 從 2026-06-16 起永久存檔,可回頭比較趨勢 [來源:基建上線紀錄,自 2026-06-16] | 確定 ✅ |
| Worker 量測管道上線(已親驗) | 在 og:url 對 AI 爬蟲注入 ?ai_src;真人連抓多次都乾淨(cloaking-safe),真人帶 ?ai_src 進來→記錄+301。不動 canonical |
ainews/en 試點,已親自驗證行為正確、SEO 安全 [來源:Worker 試點親驗,ainews/en,2026-06] | 確定 ✅ 已親驗 |
Worker 量測管道實際做了什麼(真實 HTML 片段):
P0 · 馬上做(量測管道推廣)
不擴大=大部分流量仍在量測黑洞裡,你看不到 AI 帶來的真實引薦。
| P0 任務 | 白話說明 | 成本(ROI 帶成本) | 驗收方式(可獨立驗證) |
|---|---|---|---|
| 完成量測管道推廣 | 把已試點 OK 的 ?ai_src 管道,從 ainews/en 推到其他內容區 |
低(工程,試點已驗證可複製) | 各區 server log 可讀到帶參數歸因數 |
| 第二量測管道 | 不只靠 og:url 一條路,再加一條獨立量測管道交叉比對,避免單點失準 | 中(工程,需設計第二條歸因) | 兩條管道歸因數可交叉對帳 |
❌ 現在的狀況(只推一區的後果)
ChatGPT 把讀者導到非試點區,referer 是空的,GA 顯示「直接流量」,你以為沒人從 AI 來,其實有。
✅ 推廣完的效果
每一個從 AI 來的讀者,網址裡都帶 ?ai_src=chatgpt,GA 可清楚算出 AI 引薦數,且不影響搜尋排名。
P1 · 累積數據後(有數據再動,帶主成本)
這些效果好,但需要時間累積才看得到 ROI,不急著馬上做。
| P1 任務 | 白話說明 | 主要成本 | 驗收方式 |
|---|---|---|---|
| AEO 內容加事實密度 A/B | 事實密度(Fact Density)=每段加數字、日期、出處。試點 100 件,一半加一半不加,比較被 AI 引用次數 | 內容人力(主成本) | A/B 兩組 AI 引用次數差異 |
| Recency 時效 | 用 IndexNow(即時更新通知),文章發布後 1-2 天內通知引擎有新內容 | 低(工程一次性設定) | IndexNow ping 送出數 |
| 外部 mention 公關 | 去業界媒體、論壇讓別人提到 washinmura。ChatGPT 加權最重的訊號之一就是「外部有人提你」 | 公關工數月(主成本) | 外部 mention 數(可 Google 搜驗證) |
P1.5 · llms.txt + 試混搭格式(低成本卡位)
低成本、可先做的卡位動作,夾在 P1 與 P2 之間。
| P1.5 任務 | 白話說明 | 成本 | 驗收方式 |
|---|---|---|---|
| 做 llms.txt | 放網站根目錄、給 AI 讀的內容導覽檔(詳見下方答案區) | 低 | server log 看 /llms.txt 的 UA(誰真的讀) |
| 試混搭格式 top3 | 挑前 3 種格式組合(傳統 SEO + 新 AI 格式)低成本測試混搭,符合 owner「寧願多做不要錯過」 | 低 | 各格式被引用 / 抓取數對比 |
P2 · 各引擎差異化 + IDA 升級
做完 P0/P1/P1.5 後,有餘裕再做。針對各家 AI 引擎差異化,以及 IDA 大庫套骨架。
| P2 任務 | 白話說明 | 驗收方式(可獨立驗證) |
|---|---|---|
| 各引擎差異化 | 針對 ChatGPT / Perplexity / Gemini / Copilot 各自偏好(時效、schema、JSON-LD)分別補強 | schema.org validator(validator.schema.org)/ W3C JSON-LD validator pass |
| IDA 730K 套 7 層骨架 | 730K 篇 IDA 資料庫,每篇加 HTML + JSON-LD + FAQ + time + sameAs(接地連結),套完整 7 層格式 | 隨機抽 100 篇,每篇 7 層格式都有 |
✅答案
最重要的幾個問題,直接給答案
Worker 量測管道在 ainews/en 已親驗 OK,剩下最緊急的是「把它推到其他內容區」,讓你看得到 AI 帶來的真實流量。沒有量測就沒有決策依據,且試點已證明可複製,成本最低、確定性最高。
量測新規矩:3 張分開的 KPI 表
這是「偽漏斗」——把完全不同的事當同一件算,結論一定錯。例:872 萬個 event 裡 99.998% 是爬蟲,把它當「引薦」就是把抓取誤算成導流。[來源:CF event 分析,量測窗口內]
| KPI 表 | 量什麼 | 本期數字 | 可獨立驗證指標 |
|---|---|---|---|
| 表 ① AI 抓取量 | GPTBot / ClaudeBot 等每月爬你幾次(純抓取,不等於導流) | 1,540 萬次/月 [來源:CF 分析,月量測窗口] | server log bot request 數;404 回收數(可歸零確認) |
| 表 ② AI 引用 / 真人點擊 | ChatGPT / Perplexity 引用後實際帶來的真人點擊 | 194 次 [來源:CF + DB 歸因,量測窗口] | ?ai_src= 帶參數歸因數;GA session(ai_src 篩選) |
| 表 ③ 訓練 vs 引薦 | 分清楚「只抓不導流」的訓練型,和「會帶人來」的引薦型 | 872 萬 event 中 99.998% 為爬蟲 [來源:CF event 分析,量測窗口] | UA 分類;引薦型 vs 訓練型 bot 各自計數 |
同一段「AI 導流」,CF 量到 452、DB 量到 194,差異不是誰錯,是定義不同:
・A = 452:CF 邊緣請求,referer 是 AI host、全 zone。含快取、非真人,偏高。[CF,全 zone]
・B = 194:DB ai_referrer_visits,app 內真人點擊事件。較接近真人但低估(漏快取 + 限流 10/分)。[DB ai_referrer_visits]
同窗口 05-18~06-17 對照:CF 458 vs DB 179(DB/CF=39%)[CF + DB 同窗],差異來自「請求 vs 事件」定義 + 範圍(含 www/guide)+ 限流 + 快取沒到 app。
👉 現在真人導流用 B(194,標低估);未來改用 Worker
?ai_src 歸因(累積 2–4 週後當主 KPI)。🔴 鐵則:A/B 禁互相相除或相加(會變偽漏斗),要三角驗證——三個一起升才算真。
❌ 禁用的假指標(偽漏斗)
- referralTraffic ÷ AI requests = 轉換率
- 把 872 萬 event 當「引薦」(99.998% 是爬蟲)
- 「AI 喜歡度 N%」(無法驗證,LLM 訓練資料凍結 21 個月,真實學不到當下變動)
✅ 可獨立驗證指標
- schema.org validator pass / fail
- W3C JSON-LD validator pass
- 404 回收數(具體數字,可歸零)
- 帶參數歸因數(
?ai_src=帶來幾個) - Wikidata Q 編號 有 / 無;llms.txt 規格遵守度;Lighthouse SEO score
訓練爬蟲取捨:誠實說
引薦型 AI(帶流量給你)
ChatGPT、Perplexity — 會在回答裡附上你的網址,讀者點了就來。本期實際帶來 194 次點擊 [來源:CF + DB 歸因]。這是你現在最在乎的。
積極優化訓練型 AI(只抓資料,不導流)
GPTBot、ClaudeBot — 抓你的內容去訓練下一代 AI 模型,不直接帶流量,但讓未來的模型「認識」你的品牌。
取捨問題owner 親令:要 AI 幫忙宣傳,別為省頻寬全封。被 GPTBot / ClaudeBot 訓練 = 未來的 AI 模型認得你的品牌 = 長期曝光(非 0 效益),只是時間差較長。封鎖是你的選擇,但要清楚代價不是零。
三語言資源策略:主攻 ja、en 待數據、zh 別重押
之前「zh 訓練最大」是近 30 天 artifact(6 月 ClaudeBot 狂打 zh,6/02 單日 19.2 萬 vs 4 月基線 1.3 萬)。拉回全史是 ja 最大。[來源:DB rollup 全史,OS 驗;完整三語言表見完整數據頁 (d)]
| 語言 | 數據事實 | 策略 | 優先 |
|---|---|---|---|
| ja(日文) | 訓練全史最大(196.7 萬)+ 引用最大(47.9%)雙料冠軍 [來源:DB rollup + CF 30 天,OS 驗] | 主攻「被引用」。資源往這壓,雙料最大、確定性最高 | 主攻 ✅ |
| en(英文) | 只在真人導流贏(120 / 195 筆小樣本),訓練 + 引用都第二 [來源:DB ai_referrer_visits 小樣本] | 待數據足再攻:用 Worker ?ai_src 按語言累積 1000+ 筆後再決定加碼 |
待數據 ⚠️ |
| zh(中文) | 訓練 / 引用 / 導流三項全第三;30 天「最大」是一個月假象 [來源:DB rollup 全史,OS 驗] | 別重押:別被一個月高峰誤導。另有 zh-TW/zh-CN 分不開的盲點 | 別重押 |
llms.txt:owner 定調「要做」(低成本卡位)
washinmura.com/llms.txt)。像一份「給 AI 看的目錄」,告訴 AI 我站上哪些頁最值得引用。
誰會讀(已實證 vs 待驗,誠實分清):
| 讀取者 | 狀態 | 說明 |
|---|---|---|
| ClaudeBot / PerplexityBot / TollBit / Amazonbot | 已實證讀 | 我們站歷史約 6 萬 hits 讀過 /llms.txt [來源:前輪 CF 分析,待新 server log 複驗] |
| YouBot / GPTBot(實驗中)/ CCBot | DS 整理待驗 | 此清單為 DeepSeek 整理、尚需我們 server log 驗證,非確定 [來源:DS 整理,待驗] |
washinmura 真實版 llms.txt 範本結構(非洗衣店、非幻覺):
驗證有效的方法:上線後看 server log 裡 /llms.txt 的 UA,確認誰真的讀。[驗證方法:server log UA 分析]
Owner 策略:這份報告本身就是範本(dogfood)
- 格式多一點沒關係,寧願多做不要錯過
- 混搭傳統 SEO + 新 AI 格式,低成本測試,別賭單一格式
- 每篇套 7 層骨架:HTML + JSON-LD + FAQ + time + sameAs + Wikidata + cite-as
- 本報告自己就是 dogfood(自己吃自己做的):你正在看的這頁,就是照這格式做的
這份報告本身做了哪些 AI 友好格式(自我檢查):
| 格式 | 這頁有沒有 | 在哪裡 |
|---|---|---|
| 語意 HTML5(article / h1 唯一 / time) | 有 | <article> 包整頁,h1 唯一 |
| JSON-LD(機器讀標籤) | 有 | <head> 裡的 script[type=ld+json] |
| 具體數字+來源(事實密度) | 有 | 1,540 萬、194、21 件、872 萬、6 萬 hits,皆帶 [來源] |
| 術語首次出現附白話 | 有 | 所有藍色底線字都有 title 白話說明 |
| 確定 vs 估計分清、推測標方法 | 有 | 綠 badge=確定、黃=待驗;🔮 推論框標推法 |
行動清單:按這個順序做
- P0 馬上做:把已親驗 OK 的
?ai_src量測管道從 ainews/en 推到其他內容區 + 上第二量測管道 - 累積數據:建 3 張分開的 KPI 表(抓取量 / 引用點擊 / 訓練 vs 引薦),開始累積
- P1.5 低成本先做:上 washinmura 真實版 llms.txt + 試混搭格式 top3
- P1 有數據後:AEO 事實密度 A/B 試點 100 篇(主成本內容人力)+ IndexNow 時效(1-2 天)
- P1 持續:外部 mention 公關(數月見效,ChatGPT 加權重)
- P2 有餘裕:各引擎差異化 + IDA 730K 套 7 層骨架
- 原則:訓練型爬蟲別全封(owner 定調,長期品牌曝光非 0)