ChatGPT-User(即時搜尋)、Perplexity、Google AI Overviews、Copilot、Meta AI 屬於引薦型 AI(會把讀者導流給你);GPTBot、ClaudeBot、CCBot 屬於訓練型 AI(只抓資料餵訓練、不帶流量)。優先為引薦型優化,但兩者寫法不衝突。[來源:本頁 grounding 引擎設計表(DS 設計),2026-06-17]
只有 Google(GSC AI Overviews 報表 / UTM) 與 Copilot / Bing(Bing Webmaster 聊天流量報表) 能直接量測 AI 帶來多少流量。其餘引擎多數不送 referer,只能靠品牌搜尋、網址自訂參數等間接訊號推測。[來源:本頁 grounding 引擎設計表 d 欄(DS 設計),2026-06-17]
語意 HTML5(唯一
h1)+ 人看得到的事實(數字+日期+出處)+ JSON-LD(Gemini / Copilot 必需)+ 完整 og 標籤 + 明確發布更新時間 + 乾淨可爬,是所有引擎的公約數。各引擎細部調整是「加分項」,不是重造輪子。[來源:本頁 grounding「共通必做」(DS 設計),2026-06-17]
🎯 研究目的
為什麼要逐一搞清楚每個引擎的脾氣?
你花時間寫了一篇好文章,發布後最想知道三件事:哪個 AI 會引用我?它會把讀者帶來嗎?我怎麼知道帶了多少?
麻煩在於:7 大 AI 引擎對內容的需求差很多 —— 有的只認最新時事、有的只讀機器標籤、有的根本不帶流量也無法量測。若用同一套方式硬碰所有引擎,等於對每個引擎都只做了一半。這頁把 7 個引擎拆開,逐一講「怎麼引用你 / 偏好什麼 / 給你的 3 條建議 / 能不能量測」。
- 引薦型 AI:會把讀者導流給你的 AI(顯示來源連結讓人點,如 ChatGPT、Perplexity)
- 訓練型 AI:只抓你的資料餵模型訓練、不帶流量(如 GPTBot、ClaudeBot、CCBot)
- JSON-LD:藏在網頁裡給機器讀的標籤(人看不到、AI 看得到)
- cite-as:告訴 AI「引用這頁時請用這個網址」
- 事實密度:內容裡數字+日期+出處的密集程度(AI 愛引用密度高的)
- recency(時效):內容夠不夠新,Perplexity 特別重視
- referer:瀏覽器告訴網站「這位訪客從哪來」;ChatGPT 不送,所以你看不到誰從 AI 點進來
- og:url:網頁給 AI / 社群看的正式網址;canonical:這頁的正版網址
- sameAs:這個實體在維基 / 官網是同一個的連結;llms.txt:放網站根目錄給 AI 讀的內容導覽檔
📋 計畫:7 引擎一覽地圖
先看整體格局,再逐一鑽進每個引擎
| 引擎 | 類型 | 能量測導流? | 最重視什麼 |
|---|---|---|---|
| ChatGPT / OpenAI | 引薦型(部分) | 否(不送 referer) | 高密度事實 HTML、時事、英文財務數字、旅遊 |
| Perplexity | 引薦型 | 難測(靠網址參數) | 極重 recency 時效、簡潔摘要、唯一穩定引繁中 |
| Google(Gemini / AI Overviews) | 引薦型 | 可(GSC / UTM) | 唯一正確讀 schema.org、重事實密度 |
| Copilot / Bing | 引薦型 | 可(Bing Webmaster) | JSON-LD(Article / WebPage)+語意 HTML |
| Claude / Anthropic | 訓練型 | 否(純訓練) | 純 HTML 長文、結構清晰、無 JS 可讀 |
| Meta AI | 引薦型(即時回答) | 否(缺 referer 驗證) | Open Graph、行動友善 |
| Amazon / Apple / CCBot | 多為訓練型 | 多為否 | Amazon 愛產品+FAQ/Apple 重結構乾淨/CCBot 爬所有公開文本 |
[來源:本頁 grounding 引擎設計表(DS 設計,各引擎 a 引用方式 / b 偏好 / d 量測),2026-06-17]
✅ 答案:7 大引擎逐一拆解
每張卡片:怎麼引用你 / 偏好什麼 / ★ 3 條量身建議 / 能否量測
三隻爬蟲分工:ChatGPT-User 是使用者問問題時的即時搜尋,會附來源;GPTBot 是純訓練爬蟲;OAI-SearchBot 負責建索引。[grounding ChatGPT a 欄]
偏好高密度事實 HTML,尤其時事、英文財務數字、旅遊類內容。[grounding ChatGPT b 欄]
- 用
<article>密集放數字+日期+出處 - 用
<meta property="article:published_time">標時效 - 每個統計數字旁邊放一條來源連結
[grounding ChatGPT c 欄 ①②③]
否 不送 referer,看不到誰從 ChatGPT 點進來,只能靠品牌搜尋量上升間接推測。[grounding ChatGPT d 欄]
即時爬取並附來源,是唯一穩定引用繁體中文的引擎。[grounding Perplexity a 欄]
極重 recency 時效,偏好簡潔摘要。[grounding Perplexity b 欄]
- 開頭 30 字放 TL;DR(一句話先給答案)
- 用
<time datetime>標更新時間 - 每段獨立、句末放出處
<a>
[grounding Perplexity c 欄 ①②③]
❌ 反例(段落綁在一起、沒出處)
✅ 正例(TL;DR+獨立段+出處)
難 不直接送 referer,只能靠在分享出去的網址加自訂參數來間接追蹤。[grounding Perplexity d 欄]
Googlebot 索引你的頁,Gemini 從你的 schema 提取資訊並附連結,Google-Extended 控制要不要拿去訓練。[grounding Google a 欄]
唯一能正確讀 schema.org 的引擎,重事實密度。[grounding Google b 欄]
<head>放 JSON-LD(Article / NewsArticle / FAQPage)- 精確的 title + meta description
- 唯一的 h1,每個數字都附時間與來源
[grounding Google c 欄 ①②③]
可 用 Google Search Console 的 AI Overviews 報表,或在連結加 UTM 參數追蹤。[grounding Google d 欄]
Bingbot 索引,Copilot 主動讀 JSON-LD 來引用你。[grounding Copilot a 欄]
偏好 JSON-LD(Article / WebPage)+語意 HTML。[grounding Copilot b 欄]
- 完整 JSON-LD,填好 author / datePublished / headline
- 段落簡潔,每段一個事實,用
<cite>標來源 - 圖片帶 alt 文字
[grounding Copilot c 欄 ①②③]
可 用 Bing Webmaster Tools 的聊天流量報表。[grounding Copilot d 欄]
ClaudeBot 純訓練;Claude-User 尚未大規模引用。[grounding Claude a 欄]
偏好純 HTML 長文、結構清晰。[grounding Claude b 欄]
- 不靠 JS 就能讀到完整文字(用
article/section) - 關鍵資訊別只藏在圖表裡,要有文字版
- robots.txt 明確允許或禁止 ClaudeBot
[grounding Claude c 欄 ①②③]
否 純訓練無點擊。[grounding Claude d 欄]
meta-externalagent 爬取你的內容,供 Meta AI 即時回答。[grounding Meta a 欄]
重 Open Graph 標籤+行動友善。[grounding Meta b 欄]
- 完善 og:title / og:description / og:image
- 首段就包含「何事、何時、何地、多少」
- 行動版要極快
[grounding Meta c 欄 ①②③]
否 無法直接量測;可加 UTM,但缺 referer 驗證。[grounding Meta d 欄]
Amazonbot(供 Alexa)/Applebot(供 Siri)/CCBot(CommonCrawl,供各家模型訓練用)。[grounding Amazon/Apple/CCBot a 欄]
Amazon 愛產品+FAQ;Apple 重結構化、乾淨 HTML;CCBot 爬所有公開文本。[grounding Amazon/Apple/CCBot b 欄]
- Amazonbot:
<main>內放產品表+問答 schema(Product) - Applebot:清晰的 h1 → h2 層次+meta description
- CCBot:保持可爬、別加阻擋 JS
[grounding Amazon/Apple/CCBot c 欄 ①②③]
多為否 這三隻多半不帶可量測的導流。[grounding Amazon/Apple/CCBot d 欄]
🧩 共通必做:一份 HTML 餵 7 引擎的公約數
把這 6 項做齊,等於同時討好所有引擎;各引擎細節是加分
| 共通必做 | 誰特別需要 | 白話說明 |
|---|---|---|
| 語意 HTML5(唯一 h1) | 全引擎 | article / section / time 結構清楚,機器才讀得懂層次 |
| 人看得到的事實(數字+日期+出處) | 全引擎 | 事實密度高才被引用,別只藏在圖表裡 |
| JSON-LD | Gemini / Copilot 必需 | 給機器讀的標籤,Google 與 Copilot 直接靠它引用 |
| 明確發布 / 更新時間 | Perplexity / ChatGPT 看重 | article:published_time 或 <time datetime> |
| 乾淨可爬(不靠 JS 才出文字) | Claude / CCBot 看重 | 純文字就能讀到全文,別讓爬蟲撞牆 |
| 完整 og 標籤 | Meta AI 看重 | og:title / description / image / url 補齊 |
| + 引薦型額外:前 30% 直接答案+recency | ChatGPT / Perplexity | 開頭先給答案、內容夠新,引薦型才願意引你 |
[來源:本頁 grounding「共通必做」(DS 設計),2026-06-17]
停止條件:當你的頁面已具備「唯一 h1+密集帶來源的事實+ JSON-LD + 完整 og + 明確時間 + 無 JS 可讀全文」六件事,本階段格式工作即完成,不需再追加更多標籤。下一步的實作清單請見 Part 3 · 建議。