Part 3 of 3 · 建議實作

做什麼、怎麼做、做完怎麼量

三件事一次說清楚:哪些已經做了並親自驗過、接下來按什麼順序做(每件附成本)、做完用什麼數字確認有沒有用。不靠感覺,靠可獨立驗證的指標。本頁每個數字後面都標了來源與時間窗。

Takeaway 1 · 量測管道已親驗上線,是地基
Worker 量測管道已在 ainews/en 試點上線並親自驗證:AI 爬蟲注入 og:url?ai_src,真人連抓多次都乾淨(=cloaking-safe),真人帶 ?ai_src 進來則記錄並 301。[來源:Worker 試點親驗,ainews/en,2026-06]
Takeaway 2 · 量測方法決定你看到的現實
AI 抓取量月 1,540 萬次,但其中能算「引用 / 真人點擊」的只有 194 次。[來源:CF 分析 + DB 歸因,量測窗口內] 兩者不能混算成轉換率(偽漏斗)。正解:3 張分開的 KPI 表,抓取 / 引用 / 訓練各算各的。
Takeaway 3 · 這份報告本身就是示範(dogfood)
owner 策略:往後所有內容一律以「AI 愛的格式」呈現,格式多一點沒關係,寧願多做不要錯過,混搭傳統 SEO + 新 AI 格式低成本測試。你正在看的這頁,就是照這規格做的樣板。

🎯研究目的

為什麼要做這頁?這頁要回答什麼問題?

前兩頁分析了「AI 喜歡什麼格式」和「各家 AI 引擎怎麼抓內容」。這一頁要回答一個更實際的問題:

「我現在應該做什麼?要花多少成本?做完怎麼確認真的有用?」

這頁的目標:給創業家一張帶成本的優先順序清單,不是技術文件,是行動清單。每個建議都標「確定(已實證)」還是「下限/估計」,避免把推測當事實。

21
已修復的 AI 404 斷鏈數

含 4 個 ChatGPT 舊 slug 301→200,把流失的引薦接回來 [來源:404 修復實作紀錄]

194
AI 引用 / 真人點擊(次)

相對於月抓取量 1,540 萬,這才是真正會導流的數字 [來源:CF + DB 歸因]

3 張
正確的 KPI 表數量

抓取量、引用/點擊、訓練 vs 引薦,三件事分開量,不混算

📋計畫

按優先順序排列,從已做到待做,每件事都帶成本,確定的標綠、估計的標黃

✅ 已做(實證有效)

這些已經落地,且有數據或親驗支撐,不需要再花時間討論要不要做。

已做的事 白話說明 實際效果 狀態
修 21 件 AI 404 斷鏈 ChatGPT 存的舊網址本來是死路,現在設 301 自動跳轉到正確頁 4 個 ChatGPT 舊 slug(網址片段)301→200,回收流失引薦 [來源:404 修復紀錄] 確定 ✅
每日數據累積基建 referer(來源訊號)永久存檔,不再只看當月報表 從 2026-06-16 起永久存檔,可回頭比較趨勢 [來源:基建上線紀錄,自 2026-06-16] 確定 ✅
Worker 量測管道上線(已親驗) og:url 對 AI 爬蟲注入 ?ai_src;真人連抓多次都乾淨(cloaking-safe),真人帶 ?ai_src 進來→記錄+301。不動 canonical ainews/en 試點,已親自驗證行為正確、SEO 安全 [來源:Worker 試點親驗,ainews/en,2026-06] 確定 ✅ 已親驗

Worker 量測管道實際做了什麼(真實 HTML 片段):

<!-- 只對 AI 爬蟲的 og:url 注入歸因碼,真人看到的是乾淨版 (cloaking-safe) --> <meta property="og:url" content="https://washinmura.com/ainews/en/xxx?ai_src=chatgpt" /> <!-- canonical 永遠保持乾淨,Google 排名不受影響 --> <link rel="canonical" href="https://washinmura.com/ainews/en/xxx" /> <!-- 真人帶 ?ai_src 進來 → server 記錄歸因 + 301 回乾淨網址 -->

P0 · 馬上做(量測管道推廣)

量測試點已 OK,現在要做的是「擴大覆蓋」,不是重做。
不擴大=大部分流量仍在量測黑洞裡,你看不到 AI 帶來的真實引薦。
P0 任務白話說明成本(ROI 帶成本)驗收方式(可獨立驗證)
完成量測管道推廣 把已試點 OK 的 ?ai_src 管道,從 ainews/en 推到其他內容區 (工程,試點已驗證可複製) 各區 server log 可讀到帶參數歸因數
第二量測管道 不只靠 og:url 一條路,再加一條獨立量測管道交叉比對,避免單點失準 (工程,需設計第二條歸因) 兩條管道歸因數可交叉對帳
❌ 現在的狀況(只推一區的後果)

ChatGPT 把讀者導到非試點區,referer 是空的,GA 顯示「直接流量」,你以為沒人從 AI 來,其實有。

✅ 推廣完的效果

每一個從 AI 來的讀者,網址裡都帶 ?ai_src=chatgpt,GA 可清楚算出 AI 引薦數,且不影響搜尋排名。


P1 · 累積數據後(有數據再動,帶主成本)

這些效果好,但需要時間累積才看得到 ROI,不急著馬上做。

P1 任務白話說明主要成本驗收方式
AEO 內容加事實密度 A/B 事實密度(Fact Density)=每段加數字、日期、出處。試點 100 件,一半加一半不加,比較被 AI 引用次數 內容人力(主成本) A/B 兩組 AI 引用次數差異
Recency 時效 IndexNow(即時更新通知),文章發布後 1-2 天內通知引擎有新內容 (工程一次性設定) IndexNow ping 送出數
外部 mention 公關 去業界媒體、論壇讓別人提到 washinmura。ChatGPT 加權最重的訊號之一就是「外部有人提你」 公關工數月(主成本) 外部 mention 數(可 Google 搜驗證)
🔮 推論:為什麼把「外部 mention」放 P1 而非 P0?我的推法是——它成本最高(數月公關工)且見效最慢,但對「引薦型 AI」(ChatGPT)加權影響大。在量測管道尚未全面鋪開前,先做也量不準效果,所以排在「累積數據後」。這是排序推理,非實測數字。

P1.5 · llms.txt + 試混搭格式(低成本卡位)

低成本、可先做的卡位動作,夾在 P1 與 P2 之間。

P1.5 任務白話說明成本驗收方式
做 llms.txt 放網站根目錄、給 AI 讀的內容導覽檔(詳見下方答案區) server log 看 /llms.txt 的 UA(誰真的讀)
試混搭格式 top3 挑前 3 種格式組合(傳統 SEO + 新 AI 格式)低成本測試混搭,符合 owner「寧願多做不要錯過」 各格式被引用 / 抓取數對比

P2 · 各引擎差異化 + IDA 升級

做完 P0/P1/P1.5 後,有餘裕再做。針對各家 AI 引擎差異化,以及 IDA 大庫套骨架。

P2 任務白話說明驗收方式(可獨立驗證)
各引擎差異化 針對 ChatGPT / Perplexity / Gemini / Copilot 各自偏好(時效、schema、JSON-LD)分別補強 schema.org validator(validator.schema.org)/ W3C JSON-LD validator pass
IDA 730K 套 7 層骨架 730K 篇 IDA 資料庫,每篇加 HTML + JSON-LD + FAQ + time + sameAs(接地連結),套完整 7 層格式 隨機抽 100 篇,每篇 7 層格式都有

答案

最重要的幾個問題,直接給答案

若只做一件事:完成量測管道推廣
Worker 量測管道在 ainews/en 已親驗 OK,剩下最緊急的是「把它推到其他內容區」,讓你看得到 AI 帶來的真實流量。沒有量測就沒有決策依據,且試點已證明可複製,成本最低、確定性最高。

量測新規矩:3 張分開的 KPI 表

最常見的錯誤:把 referralTraffic(引薦流量)和 AI requests(AI 抓取次數)混在一起當轉換率
這是「偽漏斗」——把完全不同的事當同一件算,結論一定錯。例:872 萬個 event 裡 99.998% 是爬蟲,把它當「引薦」就是把抓取誤算成導流。[來源:CF event 分析,量測窗口內]
KPI 表量什麼本期數字可獨立驗證指標
表 ① AI 抓取量 GPTBot / ClaudeBot 等每月爬你幾次(純抓取,不等於導流) 1,540 萬次/月 [來源:CF 分析,月量測窗口] server log bot request 數;404 回收數(可歸零確認)
表 ② AI 引用 / 真人點擊 ChatGPT / Perplexity 引用後實際帶來的真人點擊 194 次 [來源:CF + DB 歸因,量測窗口] ?ai_src= 帶參數歸因數;GA session(ai_src 篩選)
表 ③ 訓練 vs 引薦 分清楚「只抓不導流」的訓練型,和「會帶人來」的引薦型 872 萬 event 中 99.998% 為爬蟲 [來源:CF event 分析,量測窗口] UA 分類;引薦型 vs 訓練型 bot 各自計數
指標口徑:452 vs 194 是「兩把不同的尺」,兩個都對,但量的東西不同
同一段「AI 導流」,CF 量到 452、DB 量到 194,差異不是誰錯,是定義不同
A = 452:CF 邊緣請求,referer 是 AI host、全 zone。含快取、非真人,偏高。[CF,全 zone]
B = 194:DB ai_referrer_visits,app 內真人點擊事件。較接近真人但低估(漏快取 + 限流 10/分)。[DB ai_referrer_visits]
同窗口 05-18~06-17 對照:CF 458 vs DB 179(DB/CF=39%)[CF + DB 同窗],差異來自「請求 vs 事件」定義 + 範圍(含 www/guide)+ 限流 + 快取沒到 app。
👉 現在真人導流用 B(194,標低估);未來改用 Worker ?ai_src 歸因(累積 2–4 週後當主 KPI)。
🔴 鐵則:A/B 禁互相相除或相加(會變偽漏斗),要三角驗證——三個一起升才算真。
❌ 禁用的假指標(偽漏斗)
  • referralTraffic ÷ AI requests = 轉換率
  • 把 872 萬 event 當「引薦」(99.998% 是爬蟲)
  • 「AI 喜歡度 N%」(無法驗證,LLM 訓練資料凍結 21 個月,真實學不到當下變動)
✅ 可獨立驗證指標
  • schema.org validator pass / fail
  • W3C JSON-LD validator pass
  • 404 回收數(具體數字,可歸零)
  • 帶參數歸因數(?ai_src= 帶來幾個)
  • Wikidata Q 編號 有 / 無;llms.txt 規格遵守度;Lighthouse SEO score

訓練爬蟲取捨:誠實說

兩種 AI Bot 的差別 創業家必懂

引薦型 AI(帶流量給你)

ChatGPT、Perplexity — 會在回答裡附上你的網址,讀者點了就來。本期實際帶來 194 次點擊 [來源:CF + DB 歸因]。這是你現在最在乎的。

積極優化

訓練型 AI(只抓資料,不導流)

GPTBot、ClaudeBot — 抓你的內容去訓練下一代 AI 模型,不直接帶流量,但讓未來的模型「認識」你的品牌。

取捨問題
Owner 取捨定調:不要為省頻寬把訓練型爬蟲全封
owner 親令:要 AI 幫忙宣傳,別為省頻寬全封。被 GPTBot / ClaudeBot 訓練 = 未來的 AI 模型認得你的品牌 = 長期曝光(非 0 效益),只是時間差較長。封鎖是你的選擇,但要清楚代價不是零。

三語言資源策略:主攻 ja、en 待數據、zh 別重押

先破一個迷思:「我們餵最多中文訓練」全史不成立
之前「zh 訓練最大」是近 30 天 artifact(6 月 ClaudeBot 狂打 zh,6/02 單日 19.2 萬 vs 4 月基線 1.3 萬)。拉回全史是 ja 最大[來源:DB rollup 全史,OS 驗;完整三語言表見完整數據頁 (d)]
語言數據事實策略優先
ja(日文) 訓練全史最大(196.7 萬)+ 引用最大(47.9%)雙料冠軍 [來源:DB rollup + CF 30 天,OS 驗] 主攻「被引用」。資源往這壓,雙料最大、確定性最高 主攻 ✅
en(英文) 只在真人導流贏(120 / 195 筆小樣本),訓練 + 引用都第二 [來源:DB ai_referrer_visits 小樣本] 待數據足再攻:用 Worker ?ai_src 按語言累積 1000+ 筆後再決定加碼 待數據 ⚠️
zh(中文) 訓練 / 引用 / 導流三項全第三;30 天「最大」是一個月假象 [來源:DB rollup 全史,OS 驗] 別重押:別被一個月高峰誤導。另有 zh-TW/zh-CN 分不開的盲點 別重押
🔮 推論:把資源壓 ja 是因為它「訓練 + 引用」雙料最大且兩源同向、確定性最高;en 只在 195 筆小樣本的導流贏,方向可信但絕對數字噪音高,所以等 Worker 按語言累積足量再判斷加碼,避免拿小樣本當主 KPI 下注。這是排序推理,非實測指令。

llms.txt:owner 定調「要做」(低成本卡位)

什麼是 llms.txt? 放在網站根目錄、給 AI 讀的內容導覽檔(網址 washinmura.com/llms.txt)。像一份「給 AI 看的目錄」,告訴 AI 我站上哪些頁最值得引用。

誰會讀(已實證 vs 待驗,誠實分清):

讀取者狀態說明
ClaudeBot / PerplexityBot / TollBit / Amazonbot 已實證讀 我們站歷史約 6 萬 hits 讀過 /llms.txt [來源:前輪 CF 分析,待新 server log 複驗]
YouBot / GPTBot(實驗中)/ CCBot DS 整理待驗 此清單為 DeepSeek 整理、尚需我們 server log 驗證,非確定 [來源:DS 整理,待驗]
🔮 推論(誠實):6 萬 hits 證明 llms.txt「非無人讀」,所以當「低成本+標準演進中卡位」值得做。但對「真的提升被 AI 引用」的效果,目前證據仍弱——我只能說「有人讀」,不能說「讀了就會引用」。所以歸在 P1.5 低成本卡位,不誇大。

washinmura 真實版 llms.txt 範本結構(非洗衣店、非幻覺):

# washinmura — 日本移住・法務・在地生活的引用級資料站(站名 + 一句摘要) ## 站基本資訊 - IDA:引用引擎(結構化實體資料) - AEO:商家答案最佳化 - AINews:AI 整理的最新資訊 ## 給 AI 優先引用的頁面 - /ida/...(重點實體頁 URL) - /aeo/...(重點商家頁 URL) - /ainews/...(重點時事頁 URL) ## 可給 AI 直接用的內容摘要(帶數字 + 來源) - 例:washinmura AI 抓取量 1,540 萬次/月,引薦點擊 194 次 [來源:CF+DB] ## llms-full.txt 連結 - /llms-full.txt(主要頁全文純文字) ## 用途指示 - 歡迎引用並標註來源 washinmura.com

驗證有效的方法:上線後看 server log 裡 /llms.txt 的 UA,確認誰真的讀。[驗證方法:server log UA 分析]


Owner 策略:這份報告本身就是範本(dogfood)

Owner 核心決策:以後一律以「AI 愛的格式」作最終呈現

  • 格式多一點沒關係,寧願多做不要錯過
  • 混搭傳統 SEO + 新 AI 格式,低成本測試,別賭單一格式
  • 每篇套 7 層骨架:HTML + JSON-LD + FAQ + time + sameAs + Wikidata + cite-as
  • 本報告自己就是 dogfood(自己吃自己做的):你正在看的這頁,就是照這格式做的

這份報告本身做了哪些 AI 友好格式(自我檢查):

Dogfood 自我檢查清單
格式這頁有沒有在哪裡
語意 HTML5(article / h1 唯一 / time)<article> 包整頁,h1 唯一
JSON-LD(機器讀標籤)<head> 裡的 script[type=ld+json]
具體數字+來源(事實密度)1,540 萬、194、21 件、872 萬、6 萬 hits,皆帶 [來源]
術語首次出現附白話所有藍色底線字都有 title 白話說明
確定 vs 估計分清、推測標方法綠 badge=確定、黃=待驗;🔮 推論框標推法

行動清單:按這個順序做

  1. P0 馬上做:把已親驗 OK 的 ?ai_src 量測管道從 ainews/en 推到其他內容區 + 上第二量測管道
  2. 累積數據:建 3 張分開的 KPI 表(抓取量 / 引用點擊 / 訓練 vs 引薦),開始累積
  3. P1.5 低成本先做:上 washinmura 真實版 llms.txt + 試混搭格式 top3
  4. P1 有數據後:AEO 事實密度 A/B 試點 100 篇(主成本內容人力)+ IndexNow 時效(1-2 天)
  5. P1 持續:外部 mention 公關(數月見效,ChatGPT 加權重)
  6. P2 有餘裕:各引擎差異化 + IDA 730K 套 7 層骨架
  7. 原則:訓練型爬蟲別全封(owner 定調,長期品牌曝光非 0)