Part 3 of 3 · 建議實作

做什麼、怎麼做、做完怎麼量

三件事一次說清楚：哪些已經做了並親自驗過、接下來按什麼順序做（每件附成本）、做完用什麼數字確認有沒有用。不靠感覺，靠可獨立驗證的指標。本頁每個數字後面都標了來源與時間窗。

Takeaway 1 · 量測管道已親驗上線，是地基
Worker 量測管道已在 ainews/en 試點上線並親自驗證：AI 爬蟲注入 og:url 帶 ?ai_src，真人連抓多次都乾淨（=cloaking-safe），真人帶 ?ai_src 進來則記錄並 301。[來源：Worker 試點親驗，ainews/en，2026-06]

Takeaway 2 · 量測方法決定你看到的現實
AI 抓取量月 1,540 萬次，但其中能算「引用 / 真人點擊」的只有 194 次。[來源：CF 分析 + DB 歸因，量測窗口內] 兩者不能混算成轉換率（偽漏斗）。正解：3 張分開的 KPI 表，抓取 / 引用 / 訓練各算各的。

Takeaway 3 · 這份報告本身就是示範（dogfood）
owner 策略：往後所有內容一律以「AI 愛的格式」呈現，格式多一點沒關係，寧願多做不要錯過，混搭傳統 SEO + 新 AI 格式低成本測試。你正在看的這頁，就是照這規格做的樣板。

🎯研究目的

為什麼要做這頁？這頁要回答什麼問題？

前兩頁分析了「AI 喜歡什麼格式」和「各家 AI 引擎怎麼抓內容」。這一頁要回答一個更實際的問題：

「我現在應該做什麼？要花多少成本？做完怎麼確認真的有用？」

這頁的目標：給創業家一張帶成本的優先順序清單，不是技術文件，是行動清單。每個建議都標「確定（已實證）」還是「下限／估計」，避免把推測當事實。

已修復的 AI 404 斷鏈數

含 4 個 ChatGPT 舊 slug 301→200，把流失的引薦接回來 [來源：404 修復實作紀錄]

194

AI 引用 / 真人點擊（次）

相對於月抓取量 1,540 萬，這才是真正會導流的數字 [來源：CF + DB 歸因]

3 張

正確的 KPI 表數量

抓取量、引用/點擊、訓練 vs 引薦，三件事分開量，不混算

📋計畫

按優先順序排列，從已做到待做，每件事都帶成本，確定的標綠、估計的標黃

✅ 已做（實證有效）

這些已經落地，且有數據或親驗支撐，不需要再花時間討論要不要做。

已做的事	白話說明	實際效果	狀態
修 21 件 AI 404 斷鏈	ChatGPT 存的舊網址本來是死路，現在設 301 自動跳轉到正確頁	4 個 ChatGPT 舊 slug（網址片段）301→200，回收流失引薦 [來源：404 修復紀錄]	確定 ✅
每日數據累積基建	referer（來源訊號）永久存檔，不再只看當月報表	從 2026-06-16 起永久存檔，可回頭比較趨勢 [來源：基建上線紀錄，自 2026-06-16]	確定 ✅
Worker 量測管道上線（已親驗）	在 og:url 對 AI 爬蟲注入 `?ai_src`；真人連抓多次都乾淨（cloaking-safe），真人帶 `?ai_src` 進來→記錄＋301。不動 canonical	ainews/en 試點，已親自驗證行為正確、SEO 安全 [來源：Worker 試點親驗，ainews/en，2026-06]	確定 ✅ 已親驗

Worker 量測管道實際做了什麼（真實 HTML 片段）：

<meta property="og:url" content="https://washinmura.com/ainews/en/xxx?ai_src=chatgpt" />  <link rel="canonical" href="https://washinmura.com/ainews/en/xxx" />

P0 · 馬上做（量測管道推廣）

量測試點已 OK，現在要做的是「擴大覆蓋」，不是重做。
不擴大＝大部分流量仍在量測黑洞裡，你看不到 AI 帶來的真實引薦。

P0 任務	白話說明	成本（ROI 帶成本）	驗收方式（可獨立驗證）
完成量測管道推廣	把已試點 OK 的 `?ai_src` 管道，從 ainews/en 推到其他內容區	低（工程，試點已驗證可複製）	各區 server log 可讀到帶參數歸因數
第二量測管道	不只靠 og:url 一條路，再加一條獨立量測管道交叉比對，避免單點失準	中（工程，需設計第二條歸因）	兩條管道歸因數可交叉對帳

❌ 現在的狀況（只推一區的後果）

ChatGPT 把讀者導到非試點區，referer 是空的，GA 顯示「直接流量」，你以為沒人從 AI 來，其實有。

✅ 推廣完的效果

每一個從 AI 來的讀者，網址裡都帶 ?ai_src=chatgpt，GA 可清楚算出 AI 引薦數，且不影響搜尋排名。

P1 · 累積數據後（有數據再動，帶主成本）

這些效果好，但需要時間累積才看得到 ROI，不急著馬上做。

P1 任務	白話說明	主要成本	驗收方式
AEO 內容加事實密度 A/B	事實密度（Fact Density）＝每段加數字、日期、出處。試點 100 件，一半加一半不加，比較被 AI 引用次數	內容人力（主成本）	A/B 兩組 AI 引用次數差異
Recency 時效	用 IndexNow（即時更新通知），文章發布後 1-2 天內通知引擎有新內容	低（工程一次性設定）	IndexNow ping 送出數
外部 mention 公關	去業界媒體、論壇讓別人提到 washinmura。ChatGPT 加權最重的訊號之一就是「外部有人提你」	公關工數月（主成本）	外部 mention 數（可 Google 搜驗證）

🔮 推論：為什麼把「外部 mention」放 P1 而非 P0？我的推法是——它成本最高（數月公關工）且見效最慢，但對「引薦型 AI」（ChatGPT）加權影響大。在量測管道尚未全面鋪開前，先做也量不準效果，所以排在「累積數據後」。這是排序推理，非實測數字。

P1.5 · llms.txt + 試混搭格式（低成本卡位）

低成本、可先做的卡位動作，夾在 P1 與 P2 之間。

P1.5 任務	白話說明	成本	驗收方式
做 llms.txt	放網站根目錄、給 AI 讀的內容導覽檔（詳見下方答案區）	低	server log 看 `/llms.txt` 的 UA（誰真的讀）
試混搭格式 top3	挑前 3 種格式組合（傳統 SEO + 新 AI 格式）低成本測試混搭，符合 owner「寧願多做不要錯過」	低	各格式被引用 / 抓取數對比

P2 · 各引擎差異化 + IDA 升級

做完 P0/P1/P1.5 後，有餘裕再做。針對各家 AI 引擎差異化，以及 IDA 大庫套骨架。

P2 任務	白話說明	驗收方式（可獨立驗證）
各引擎差異化	針對 ChatGPT / Perplexity / Gemini / Copilot 各自偏好（時效、schema、JSON-LD）分別補強	schema.org validator（validator.schema.org）/ W3C JSON-LD validator pass
IDA 730K 套 7 層骨架	730K 篇 IDA 資料庫，每篇加 HTML + JSON-LD + FAQ + time + sameAs（接地連結），套完整 7 層格式	隨機抽 100 篇，每篇 7 層格式都有

✅答案

最重要的幾個問題，直接給答案

若只做一件事：完成量測管道推廣
Worker 量測管道在 ainews/en 已親驗 OK，剩下最緊急的是「把它推到其他內容區」，讓你看得到 AI 帶來的真實流量。沒有量測就沒有決策依據，且試點已證明可複製，成本最低、確定性最高。

量測新規矩：3 張分開的 KPI 表

最常見的錯誤：把 referralTraffic（引薦流量）和 AI requests（AI 抓取次數）混在一起當轉換率
這是「偽漏斗」——把完全不同的事當同一件算，結論一定錯。例：872 萬個 event 裡 99.998% 是爬蟲，把它當「引薦」就是把抓取誤算成導流。[來源：CF event 分析，量測窗口內]

KPI 表	量什麼	本期數字	可獨立驗證指標
表 ① AI 抓取量	GPTBot / ClaudeBot 等每月爬你幾次（純抓取，不等於導流）	1,540 萬次／月 [來源：CF 分析，月量測窗口]	server log bot request 數；404 回收數（可歸零確認）
表 ② AI 引用 / 真人點擊	ChatGPT / Perplexity 引用後實際帶來的真人點擊	194 次 [來源：CF + DB 歸因，量測窗口]	`?ai_src=` 帶參數歸因數；GA session（ai_src 篩選）
表 ③ 訓練 vs 引薦	分清楚「只抓不導流」的訓練型，和「會帶人來」的引薦型	872 萬 event 中 99.998% 為爬蟲 [來源：CF event 分析，量測窗口]	UA 分類；引薦型 vs 訓練型 bot 各自計數

指標口徑：452 vs 194 是「兩把不同的尺」，兩個都對，但量的東西不同
同一段「AI 導流」，CF 量到 452、DB 量到 194，差異不是誰錯，是定義不同：
・A = 452：CF 邊緣請求，referer 是 AI host、全 zone。含快取、非真人，偏高。[CF，全 zone]
・B = 194：DB ai_referrer_visits，app 內真人點擊事件。較接近真人但低估（漏快取 + 限流 10/分）。[DB ai_referrer_visits]
同窗口 05-18~06-17 對照：CF 458 vs DB 179（DB/CF=39%）[CF + DB 同窗]，差異來自「請求 vs 事件」定義 + 範圍（含 www/guide）+ 限流 + 快取沒到 app。
👉 現在真人導流用 B（194，標低估）；未來改用 Worker ?ai_src 歸因（累積 2–4 週後當主 KPI）。
🔴 鐵則：A／B 禁互相相除或相加（會變偽漏斗），要三角驗證——三個一起升才算真。

❌ 禁用的假指標（偽漏斗）

referralTraffic ÷ AI requests = 轉換率
把 872 萬 event 當「引薦」（99.998% 是爬蟲）
「AI 喜歡度 N%」（無法驗證，LLM 訓練資料凍結 21 個月，真實學不到當下變動）

✅ 可獨立驗證指標

schema.org validator pass / fail
W3C JSON-LD validator pass
404 回收數（具體數字，可歸零）
帶參數歸因數（?ai_src= 帶來幾個）
Wikidata Q 編號有 / 無；llms.txt 規格遵守度；Lighthouse SEO score

訓練爬蟲取捨：誠實說

兩種 AI Bot 的差別創業家必懂

引薦型 AI（帶流量給你）

ChatGPT、Perplexity — 會在回答裡附上你的網址，讀者點了就來。本期實際帶來 194 次點擊 [來源：CF + DB 歸因]。這是你現在最在乎的。

積極優化

訓練型 AI（只抓資料，不導流）

GPTBot、ClaudeBot — 抓你的內容去訓練下一代 AI 模型，不直接帶流量，但讓未來的模型「認識」你的品牌。

取捨問題

Owner 取捨定調：不要為省頻寬把訓練型爬蟲全封
owner 親令：要 AI 幫忙宣傳，別為省頻寬全封。被 GPTBot / ClaudeBot 訓練 = 未來的 AI 模型認得你的品牌 = 長期曝光（非 0 效益），只是時間差較長。封鎖是你的選擇，但要清楚代價不是零。

三語言資源策略：主攻 ja、en 待數據、zh 別重押

先破一個迷思：「我們餵最多中文訓練」全史不成立
之前「zh 訓練最大」是近 30 天 artifact（6 月 ClaudeBot 狂打 zh，6/02 單日 19.2 萬 vs 4 月基線 1.3 萬）。拉回全史是 ja 最大。[來源：DB rollup 全史，OS 驗；完整三語言表見完整數據頁 (d)]

語言	數據事實	策略	優先
ja（日文）	訓練全史最大（196.7 萬）+ 引用最大（47.9%）雙料冠軍 [來源：DB rollup + CF 30 天，OS 驗]	主攻「被引用」。資源往這壓，雙料最大、確定性最高	主攻 ✅
en（英文）	只在真人導流贏（120 / 195 筆小樣本），訓練 + 引用都第二 [來源：DB ai_referrer_visits 小樣本]	待數據足再攻：用 Worker `?ai_src` 按語言累積 1000+ 筆後再決定加碼	待數據 ⚠️
zh（中文）	訓練 / 引用 / 導流三項全第三；30 天「最大」是一個月假象 [來源：DB rollup 全史，OS 驗]	別重押：別被一個月高峰誤導。另有 zh-TW/zh-CN 分不開的盲點	別重押

🔮 推論：把資源壓 ja 是因為它「訓練 + 引用」雙料最大且兩源同向、確定性最高；en 只在 195 筆小樣本的導流贏，方向可信但絕對數字噪音高，所以等 Worker 按語言累積足量再判斷加碼，避免拿小樣本當主 KPI 下注。這是排序推理，非實測指令。

llms.txt：owner 定調「要做」（低成本卡位）

什麼是 llms.txt？ 放在網站根目錄、給 AI 讀的內容導覽檔（網址 washinmura.com/llms.txt）。像一份「給 AI 看的目錄」，告訴 AI 我站上哪些頁最值得引用。

誰會讀（已實證 vs 待驗，誠實分清）：

讀取者	狀態	說明
ClaudeBot / PerplexityBot / TollBit / Amazonbot	已實證讀	我們站歷史約 6 萬 hits 讀過 `/llms.txt` [來源：前輪 CF 分析，待新 server log 複驗]
YouBot / GPTBot（實驗中）/ CCBot	DS 整理待驗	此清單為 DeepSeek 整理、尚需我們 server log 驗證，非確定 [來源：DS 整理，待驗]

🔮 推論（誠實）：6 萬 hits 證明 llms.txt「非無人讀」，所以當「低成本＋標準演進中卡位」值得做。但對「真的提升被 AI 引用」的效果，目前證據仍弱——我只能說「有人讀」，不能說「讀了就會引用」。所以歸在 P1.5 低成本卡位，不誇大。

washinmura 真實版 llms.txt 範本結構（非洗衣店、非幻覺）：

# washinmura — 日本移住・法務・在地生活的引用級資料站（站名 + 一句摘要） ## 站基本資訊 - IDA：引用引擎（結構化實體資料） - AEO：商家答案最佳化 - AINews：AI 整理的最新資訊 ## 給 AI 優先引用的頁面 - /ida/...（重點實體頁 URL） - /aeo/...（重點商家頁 URL） - /ainews/...（重點時事頁 URL） ## 可給 AI 直接用的內容摘要（帶數字 + 來源） - 例：washinmura AI 抓取量 1,540 萬次/月，引薦點擊 194 次 [來源：CF+DB] ## llms-full.txt 連結 - /llms-full.txt（主要頁全文純文字） ## 用途指示 - 歡迎引用並標註來源 washinmura.com

驗證有效的方法：上線後看 server log 裡 /llms.txt 的 UA，確認誰真的讀。[驗證方法：server log UA 分析]

Owner 策略：這份報告本身就是範本（dogfood）

Owner 核心決策：以後一律以「AI 愛的格式」作最終呈現

格式多一點沒關係，寧願多做不要錯過
混搭傳統 SEO + 新 AI 格式，低成本測試，別賭單一格式
每篇套 7 層骨架：HTML + JSON-LD + FAQ + time + sameAs + Wikidata + cite-as
本報告自己就是 dogfood（自己吃自己做的）：你正在看的這頁，就是照這格式做的

這份報告本身做了哪些 AI 友好格式（自我檢查）：

Dogfood 自我檢查清單

格式	這頁有沒有	在哪裡
語意 HTML5（article / h1 唯一 / time）	有	<article> 包整頁，h1 唯一
JSON-LD（機器讀標籤）	有	<head> 裡的 script[type=ld+json]
具體數字＋來源（事實密度）	有	1,540 萬、194、21 件、872 萬、6 萬 hits，皆帶 [來源]
術語首次出現附白話	有	所有藍色底線字都有 title 白話說明
確定 vs 估計分清、推測標方法	有	綠 badge＝確定、黃＝待驗；🔮 推論框標推法

行動清單：按這個順序做

P0 馬上做：把已親驗 OK 的 ?ai_src 量測管道從 ainews/en 推到其他內容區＋上第二量測管道
累積數據：建 3 張分開的 KPI 表（抓取量 / 引用點擊 / 訓練 vs 引薦），開始累積
P1.5 低成本先做：上 washinmura 真實版 llms.txt ＋試混搭格式 top3
P1 有數據後：AEO 事實密度 A/B 試點 100 篇（主成本內容人力）＋ IndexNow 時效（1-2 天）
P1 持續：外部 mention 公關（數月見效，ChatGPT 加權重）
P2 有餘裕：各引擎差異化＋ IDA 730K 套 7 層骨架
原則：訓練型爬蟲別全封（owner 定調，長期品牌曝光非 0）