這份 V3 把每一個數字都重新核對:由 Opus 第三方獨立複算,後面都附上 [來源]。沒有來源的數字不採用、不杜撰。看到任何數字,你都可以往回追它從哪來。
讓 AI 願意引用你,三件事:內容寫在人類肉眼就看得到的 HTML 文字裡(不是藏在圖片或要點按鈕才出現)、有具體數字與日期(不是「很多」「最近」)、而且夠新。Part1 會展開講。
ChatGPT 這類引擎多半不送 referer(不告訴網站訪客從哪點來),所以「有多少人從 AI 點進來」我們只能拿到下限,誠實標 下限・估計 ⚠️。為了把這個黑洞補起來,我們已經上線一條量測管道(Worker)。
🎯研究目的:我們到底想搞清楚什麼?
一句話:怎麼寫內容,才能讓 AI 引擎願意引用我們、並把真人讀者帶到我們網站。
現在愈來愈多人不再 Google,而是直接問 ChatGPT、Claude、Perplexity。問完之後,AI 會引用某些網站當答案來源,有時還會附連結把人導過去。對 washinmura 來說,問題就變成:
- AI 喜歡什麼樣的內容格式? 同樣一段資訊,怎麼包裝 AI 才看得懂、才願意拿去當答案。
- 哪些 AI 引擎值得我們特別顧? 有的只來「抓內容餵自己的模型」(不會帶人來),有的會「真的把讀者導到你網站」。兩種要分開看。
- 我們現在到底被引用/被導流多少? 這件事最難量,但也最該誠實。
它幫你避免「拿一個聽起來很猛、其實是猜的數字」去下注。每個建議背後都有驗證過的數據撐著,你可以放心拿去做內容決策。
📋計畫/方法:數據怎麼來、怎麼驗
三條獨立管線取數,再加一輪第三方獨立複算對帳。三邊兜得起來,數字才敢用。
| 步驟 | 怎麼做 | 性質 |
|---|---|---|
| ① CF GraphQL (Cloudflare) |
透過 Cloudflare GraphQL API,直接拉 zone 層級的請求紀錄與各 AI 爬蟲抓取量。這是「誰來抓、抓幾次」最可信的來源。 | 確定 ✅ |
| ② DB(pgbouncer) (PostgreSQL) |
從資料庫(經 pgbouncer 連線)撈更早的歷史與引薦事件。日期是真的,但數字嚴重低估,只能看趨勢、不能拿來比大小。 | 下限・估計 ⚠️ |
| ③ Opus 獨立複算 (第三方對帳) |
不另外取數,而是把上面兩條管線的關鍵數字重算一遍對帳。本報告最核心的「總請求 54,361,090」就是這樣複算出來的。 | 第三方複算 |
就像對帳——一個人記帳可能抄錯,兩個人各自記、再請第三個人拿計算機重算一遍,三邊兜得起來,數字才敢拿去做決策。這份報告所有標 確定 ✅ 的數字,都走過這道手續。
名詞白話:爬蟲 = AI 公司派來自動抓網頁內容的程式;引薦型 AI = 會把人導流到你網站(如 ChatGPT、Perplexity);訓練型 AI = 只來抓內容餵模型、不導流(如 GPTBot、ClaudeBot)。
✅答案:全局結論(每個數字都帶來源)
先給你最重要的四個全局結論。細節在後面四頁,這裡先讓你抓到地基。
開站至今總請求
2026-02-12~06-17 共 126 天 確定 ✅
[CF httpRequests1dGroups;Opus 獨立複算]
AI 爬蟲 30 天抓取
已知 AI 爬蟲合計 確定 ✅
[CF Adaptive 2026-05-18~06-17,30 天]
真人乾淨點擊
真正從 AI 點進來的人 下限 ⚠️
[DB ai_referrer_visits,下限]
🗺️5 章導覽:這份報告怎麼讀
不用從頭讀到尾。看你關心什麼,直接跳。
怎麼讀
全局結論、數據怎麼驗、術語白話。先讀這頁,再決定要深入哪一塊。
你正在這頁 ↓完整數據
所有結論的地基。總請求、每個爬蟲分別抓幾次、請求 vs 驗證 vs 引用,每個數字都標來源與時間窗。
看完整數據 →Part1 · 內容格式
AI 到底愛什麼格式:語意化 HTML、JSON-LD、具體數字與日期。好寫法 vs 壞寫法對照。
看格式建議 →Part2 · 各引擎
ClaudeBot、GPTBot、ChatGPT-User、Perplexity… 一個一個拆:哪些只抓不導流、哪些會帶人來。
看各引擎 →Part3 · 建議
把前面的發現變成可執行的待辦:內容怎麼改、量測管道怎麼補、優先順序怎麼排。
看行動建議 →📰給完全不懂的人:把 AI 想成一個記者
不懂技術也沒關係。一個比喻就能抓到全部重點。
想像 AI(ChatGPT、Claude、Perplexity)是一個很忙的記者。讀者問他問題,他要趕快給答案,還要附上「這資訊我從哪家看來的」。對 washinmura 來說,目標就是:讓這位記者願意引用我們、還把讀者導到我們這來。
📖 記者喜歡好引用的素材
數字明確、日期清楚、白紙黑字寫在文章裡——記者複製貼上就能用、敢用。這就是 AI 愛的格式。
🙈 記者討厭含糊的素材
「很多」「最近」「據說」、資訊藏在圖片或要點半天才出現——記者沒法引用,只好跳過你。
📚白話術語表:看到不懂的詞回來查
這份報告會用到一些詞。第一次出現都會附白話,這裡是完整對照。
| 術語 | 白話解釋 |
|---|---|
| JSON-LD | 藏在網頁裡、專門給機器讀的「資訊標籤」。人看不到,但 AI 一讀就懂這頁在講什麼。 |
| cite-as | 網頁主動告訴 AI「要引用我,請用這個正式網址」,等於替自己準備好「引用格式」。 |
| 事實密度 | 一段內容裡「數字+日期+出處」有多密。密度高,AI 愈敢拿去當答案。 |
| referer | 瀏覽器告訴網站「我從哪個頁面點過來的」。ChatGPT 多半不送,所以網站看不到誰是從 AI 來的——這就是「referer 黑洞」。 |
| 引薦型 AI | 會把真人讀者導流到你網站的 AI(如 ChatGPT、Perplexity)。這種最有價值。 |
| 訓練型 AI | 只來抓內容餵自己模型、不會把人帶來的 AI(如 GPTBot、ClaudeBot)。抓得再多也不等於帶人來。 |
| llms.txt | 放在網站根目錄、專門寫給 AI 看的一份「導覽說明」,告訴 AI 這站有什麼、該怎麼讀。 |
| cloaking-safe | 量測管道的一個安全要求:給 AI 看的內容和給人看的必須一致,不能「對 AI 演一套、對人演另一套」。我們的 Worker 已親驗符合。 |
| 下限・估計 | 「至少這麼多,但真值更高、現在測不到」。凡是導流/引用類數字都這樣標,誠實不誇大。 |
名詞白話:本頁 <head> 自己就嵌了一段 JSON-LD,每個數字都帶 <span class="src"> 來源——這正是我們在 Part1 會詳細說明、AI 引擎最愛的格式(dogfood:自己先示範一次)。