Part 2 · 各 AI 引擎專屬格式 — washinmura AI 內容格式報告 V3

Takeaway 1｜引薦型會帶流量，訓練型只抓不帶
ChatGPT-User（即時搜尋）、Perplexity、Google AI Overviews、Copilot、Meta AI 屬於引薦型 AI（會把讀者導流給你）；GPTBot、ClaudeBot、CCBot 屬於訓練型 AI（只抓資料餵訓練、不帶流量）。優先為引薦型優化，但兩者寫法不衝突。[來源：本頁 grounding 引擎設計表（DS 設計），2026-06-17]

Takeaway 2｜能直接量測的只有 2 個，別白費力氣猜其他
只有 Google（GSC AI Overviews 報表 / UTM） 與 Copilot / Bing（Bing Webmaster 聊天流量報表） 能直接量測 AI 帶來多少流量。其餘引擎多數不送 referer，只能靠品牌搜尋、網址自訂參數等間接訊號推測。[來源：本頁 grounding 引擎設計表 d 欄（DS 設計），2026-06-17]

Takeaway 3｜一份好 HTML 能同時餵 7 個引擎
語意 HTML5（唯一 h1）＋人看得到的事實（數字＋日期＋出處）＋ JSON-LD（Gemini / Copilot 必需）＋完整 og 標籤＋明確發布更新時間＋乾淨可爬，是所有引擎的公約數。各引擎細部調整是「加分項」，不是重造輪子。[來源：本頁 grounding「共通必做」（DS 設計），2026-06-17]

🎯 研究目的

為什麼要逐一搞清楚每個引擎的脾氣？

你花時間寫了一篇好文章，發布後最想知道三件事：哪個 AI 會引用我？它會把讀者帶來嗎？我怎麼知道帶了多少？

麻煩在於：7 大 AI 引擎對內容的需求差很多 —— 有的只認最新時事、有的只讀機器標籤、有的根本不帶流量也無法量測。若用同一套方式硬碰所有引擎，等於對每個引擎都只做了一半。這頁把 7 個引擎拆開，逐一講「怎麼引用你 / 偏好什麼 / 給你的 3 條建議 / 能不能量測」。

個 AI 引擎逐一解析 [grounding 引擎表]

個引擎可直接量測導流（Google、Copilot）[grounding d 欄]

條量身建議（7 引擎 × 每引擎 3 條 ★）[grounding c 欄]

名詞速查（首次出現統一在這裡解釋）

引薦型 AI：會把讀者導流給你的 AI（顯示來源連結讓人點，如 ChatGPT、Perplexity）
訓練型 AI：只抓你的資料餵模型訓練、不帶流量（如 GPTBot、ClaudeBot、CCBot）
JSON-LD：藏在網頁裡給機器讀的標籤（人看不到、AI 看得到）
cite-as：告訴 AI「引用這頁時請用這個網址」
事實密度：內容裡數字＋日期＋出處的密集程度（AI 愛引用密度高的）
recency（時效）：內容夠不夠新，Perplexity 特別重視
referer：瀏覽器告訴網站「這位訪客從哪來」；ChatGPT 不送，所以你看不到誰從 AI 點進來
og:url：網頁給 AI / 社群看的正式網址；canonical：這頁的正版網址
sameAs：這個實體在維基 / 官網是同一個的連結；llms.txt：放網站根目錄給 AI 讀的內容導覽檔

📋 計畫：7 引擎一覽地圖

先看整體格局，再逐一鑽進每個引擎

引擎	類型	能量測導流？	最重視什麼
ChatGPT / OpenAI	引薦型（部分）	否（不送 referer）	高密度事實 HTML、時事、英文財務數字、旅遊
Perplexity	引薦型	難測（靠網址參數）	極重 recency 時效、簡潔摘要、唯一穩定引繁中
Google（Gemini / AI Overviews）	引薦型	可（GSC / UTM）	唯一正確讀 schema.org、重事實密度
Copilot / Bing	引薦型	可（Bing Webmaster）	JSON-LD（Article / WebPage）＋語意 HTML
Claude / Anthropic	訓練型	否（純訓練）	純 HTML 長文、結構清晰、無 JS 可讀
Meta AI	引薦型（即時回答）	否（缺 referer 驗證）	Open Graph、行動友善
Amazon / Apple / CCBot	多為訓練型	多為否	Amazon 愛產品＋FAQ／Apple 重結構乾淨／CCBot 爬所有公開文本

[來源：本頁 grounding 引擎設計表（DS 設計，各引擎 a 引用方式 / b 偏好 / d 量測），2026-06-17]

🔮 推論：上表的「類型」與「能否量測」是依各引擎官方爬蟲行為（送不送 referer、是否回填來源連結）歸類；引薦型＝會回傳含來源連結的答案、訓練型＝只抓文本入訓練集。歸類方法寫在每張卡片的「量測」欄，方便你逐項核對。

✅ 答案：7 大引擎逐一拆解

每張卡片：怎麼引用你／偏好什麼／ ★ 3 條量身建議／能否量測

① ChatGPT / OpenAI 引薦型（部分）量測：否

怎麼引用你

三隻爬蟲分工：ChatGPT-User 是使用者問問題時的即時搜尋，會附來源；GPTBot 是純訓練爬蟲；OAI-SearchBot 負責建索引。[grounding ChatGPT a 欄]

偏好什麼

偏好高密度事實 HTML，尤其時事、英文財務數字、旅遊類內容。[grounding ChatGPT b 欄]

★ 3 條量身建議

用 <article> 密集放數字＋日期＋出處
用 <meta property="article:published_time"> 標時效
每個統計數字旁邊放一條來源連結

[grounding ChatGPT c 欄 ①②③]

<article> <p>2026 年 5 月日本入境旅客 330 萬人次 <a href="https://jnto.go.jp/...">（來源：JNTO）</a>，年增 18%。</p> </article> <meta property="article:published_time" content="2026-06-17">

能否量測

否不送 referer，看不到誰從 ChatGPT 點進來，只能靠品牌搜尋量上升間接推測。[grounding ChatGPT d 欄]

② Perplexity 引薦型量測：難

怎麼引用你

即時爬取並附來源，是唯一穩定引用繁體中文的引擎。[grounding Perplexity a 欄]

偏好什麼

極重 recency 時效，偏好簡潔摘要。[grounding Perplexity b 欄]

★ 3 條量身建議

開頭 30 字放 TL;DR（一句話先給答案）
用 <time datetime> 標更新時間
每段獨立、句末放出處 <a>

[grounding Perplexity c 欄 ①②③]

❌ 反例（段落綁在一起、沒出處）

<p>我們覺得這個市場很大，未來成長空間可觀，建議大家多加留意相關動向。</p>

✅ 正例（TL;DR＋獨立段＋出處）

<p><b>一句話：</b>日本和牛出口 2026 年增 22%。</p> <p>主因外食需求回升 <a href="...">（農水省）</a>。 <time datetime="2026-06-17"> 6/17 更新</time></p>

能否量測

難不直接送 referer，只能靠在分享出去的網址加自訂參數來間接追蹤。[grounding Perplexity d 欄]

③ Google（Gemini / AI Overviews）引薦型量測：可

怎麼引用你

Googlebot 索引你的頁，Gemini 從你的 schema 提取資訊並附連結，Google-Extended 控制要不要拿去訓練。[grounding Google a 欄]

偏好什麼

唯一能正確讀 schema.org 的引擎，重事實密度。[grounding Google b 欄]

★ 3 條量身建議

<head> 放 JSON-LD（Article / NewsArticle / FAQPage）
精確的 title ＋ meta description
唯一的 h1，每個數字都附時間與來源

[grounding Google c 欄 ①②③]

能否量測

可用 Google Search Console 的 AI Overviews 報表，或在連結加 UTM 參數追蹤。[grounding Google d 欄]

④ Copilot / Bing 引薦型量測：可

怎麼引用你

Bingbot 索引，Copilot 主動讀 JSON-LD 來引用你。[grounding Copilot a 欄]

偏好什麼

偏好 JSON-LD（Article / WebPage）＋語意 HTML。[grounding Copilot b 欄]

★ 3 條量身建議

完整 JSON-LD，填好 author / datePublished / headline
段落簡潔，每段一個事實，用 <cite> 標來源
圖片帶 alt 文字

[grounding Copilot c 欄 ①②③]

<p>和牛出口年增 22% <cite>農林水產省 2026/06</cite>。</p> <img src="wagyu.jpg" alt="日本和牛冷藏出口包裝">

能否量測

可用 Bing Webmaster Tools 的聊天流量報表。[grounding Copilot d 欄]

⑤ Claude / Anthropic 訓練型量測：否

怎麼引用你

ClaudeBot 純訓練；Claude-User 尚未大規模引用。[grounding Claude a 欄]

偏好什麼

偏好純 HTML 長文、結構清晰。[grounding Claude b 欄]

★ 3 條量身建議

不靠 JS 就能讀到完整文字（用 article / section）
關鍵資訊別只藏在圖表裡，要有文字版
robots.txt 明確允許或禁止 ClaudeBot

[grounding Claude c 欄 ①②③]

提醒：Claude 屬訓練型，現階段「不會帶流量也無法量測」。為它優化主要是為了長期被模型記住、未來若開放引用時佔位，不是短期導流。[grounding Claude d 欄]

能否量測

否純訓練無點擊。[grounding Claude d 欄]

⑥ Meta AI 引薦型（即時回答）量測：否

怎麼引用你

meta-externalagent 爬取你的內容，供 Meta AI 即時回答。[grounding Meta a 欄]

偏好什麼

重 Open Graph 標籤＋行動友善。[grounding Meta b 欄]

★ 3 條量身建議

完善 og:title / og:description / og:image
首段就包含「何事、何時、何地、多少」
行動版要極快

[grounding Meta c 欄 ①②③]

能否量測

否無法直接量測；可加 UTM，但缺 referer 驗證。[grounding Meta d 欄]

⑦ Amazon / Apple / CCBot 多為訓練型量測：多為否

怎麼引用你

Amazonbot（供 Alexa）／Applebot（供 Siri）／CCBot（CommonCrawl，供各家模型訓練用）。[grounding Amazon/Apple/CCBot a 欄]

偏好什麼

Amazon 愛產品＋FAQ；Apple 重結構化、乾淨 HTML；CCBot 爬所有公開文本。[grounding Amazon/Apple/CCBot b 欄]

★ 3 條量身建議

Amazonbot：<main> 內放產品表＋問答 schema（Product）
Applebot：清晰的 h1 → h2 層次＋meta description
CCBot：保持可爬、別加阻擋 JS

[grounding Amazon/Apple/CCBot c 欄 ①②③]

能否量測

多為否這三隻多半不帶可量測的導流。[grounding Amazon/Apple/CCBot d 欄]

🧩 共通必做：一份 HTML 餵 7 引擎的公約數

把這 6 項做齊，等於同時討好所有引擎；各引擎細節是加分

共通必做	誰特別需要	白話說明
語意 HTML5（唯一 h1）	全引擎	article / section / time 結構清楚，機器才讀得懂層次
人看得到的事實（數字＋日期＋出處）	全引擎	事實密度高才被引用，別只藏在圖表裡
JSON-LD	Gemini / Copilot 必需	給機器讀的標籤，Google 與 Copilot 直接靠它引用
明確發布 / 更新時間	Perplexity / ChatGPT 看重	`article:published_time` 或 `<time datetime>`
乾淨可爬（不靠 JS 才出文字）	Claude / CCBot 看重	純文字就能讀到全文，別讓爬蟲撞牆
完整 og 標籤	Meta AI 看重	og:title / description / image / url 補齊
＋引薦型額外：前 30% 直接答案＋recency	ChatGPT / Perplexity	開頭先給答案、內容夠新，引薦型才願意引你

[來源：本頁 grounding「共通必做」（DS 設計），2026-06-17]

結論（本頁可複製樣板）：先把上表 6 項公約數＋引薦型那條做齊，就涵蓋了 7 引擎的最大交集；再依各卡片 ★ 建議微調。
停止條件：當你的頁面已具備「唯一 h1＋密集帶來源的事實＋ JSON-LD ＋完整 og ＋明確時間＋無 JS 可讀全文」六件事，本階段格式工作即完成，不需再追加更多標籤。下一步的實作清單請見 Part 3 · 建議。

🔮 推論：本頁屬於對既有引擎行為的整理與映射，不含對「AI 喜歡度 %」之類無法獨立驗證的假指標。是否做到位請用可獨立驗證的方式檢查：schema.org validator、JSON-LD validator、og 標籤檢查、robots.txt 是否明確標 ClaudeBot 規則 pass / fail。