AI検索拒否の完全ガイド【2026年版】：Google公式オプトアウトからrobots.txt設定まで徹底解説

2026年6月6日

「自分のサイトがAIに引用されているけど、止めたい」「robots.txtで設定したのに効果があるのかわからない」——そんな疑問を持つサイト運営者が急増しています。

「AI検索拒否」とは、Google AI Overviews・ChatGPT Search・PerplexityなどのAI検索サービスが自サイトのコンテンツを引用・要約することを制限する設定の総称です。robots.txtのクローラー別Disallow、Search Consoleのオプトアウトトグル、metaタグなど複数の手段があり、目的によって使い分けが必要です。

ただし、この記事を読む前に一点お伝えしておきたいことがあります。AI検索への引用を拒否することが、すべてのサイトにとって正解ではありません。2026年6月時点で月間25億人以上が使うAI検索から除外されることの機会損失は、想定より大きい可能性があります。どう判断するかは、この記事の後半で詳しく説明します。

この記事でわかること：

「AI学習拒否」と「AI検索引用拒否」の違い： 目的が違えば必要な設定も異なります。この2軸の整理が、すべての出発点です。
2026年版の正確な設定方法： robots.txtのクローラー別コード、Google公式オプトアウトトグル（2026年6月発表）、metaタグ・llms.txtの組み合わせを体系的に解説します。
拒否した場合のSEOへの影響： 通常検索順位への直接影響はないものの、AI検索からの流入機会を失うことの実態を、データをもとに正直に伝えます。

編集者

この記事を書いた人

株式会社アイダイム CEO ｜臨床検査技師×デジタルマーケ勘ではなく「エビデンス」に基づくデータ主導の実力派集団｜ 7領域（SEO/MEO/PPC/サイト制作/amazon/youtube/等）をワンストップ支援｜台湾・タイでSEO1位・国内EC売上高2位の実績

masayukiのプロフィール

AI検索拒否とは？「学習拒否」と「引用拒否」2つの意味を整理する

「AI検索拒否」という言葉は、実際には2つのまったく異なる概念を指しています。混同したまま設定を進めると、やりたいことができていない、あるいは不必要な制限をかけてしまうことになります。まず、この2軸の違いを整理します。

① AIモデルの学習データへの利用拒否

自社コンテンツがChatGPTやGeminiなどのAIモデルを訓練するための素材として使われることを拒否するものです。対象は「GPTBot」（OpenAI学習用）や「Google-Extended」（Google AI学習用）など、モデル訓練目的で動くクローラーです。robots.txtのDisallow設定が主な手段になります。

② AI検索での引用・表示拒否

AI Overviews・AI Mode・ChatGPT Searchなど、ユーザーが検索したときにAIが生成する回答に自サイトのコンテンツが引用・要約されることを拒否するものです。2026年6月に正式発表されたGoogle Search Consoleのオプトアウトトグルが、現時点で最も公式な手段です。

この2つは目的もツールも異なります。「学習には使わせたくないが、AI検索に引用されて認知を広げることは歓迎する」というスタンスも成立します。自分が何を拒否したいのかを明確にしてから設定に進むことが重要です。

Q. AI検索拒否とAI学習拒否は何が違うの？

A. AI学習拒否はモデルの訓練データへの利用を止めるもの（GPTBot・Google-Extendedのブロック等）、AI検索拒否はAI Overviewsなど検索回答への引用・表示を止めるもの（GSCオプトアウト等）です。目的が違えば必要な設定も異なります。

2軸の違いを理解したところで、次はrobots.txtによる具体的なクローラー別設定を見ていきます。

robots.txtによるAIクローラー別ブロック設定（2026年版コード付き）

robots.txtとは、サイトのルートディレクトリに設置するテキストファイルで、クローラー（自動巡回プログラム）に対して「どのページにアクセスしてよいか・してはいけないか」を伝えるものです。AI各社は独自のUser-agentを公開しており、学習用クローラーと検索引用用クローラーを分離して制御できます。

2026年時点で主要なAIクローラーと設定の対応関係は以下のとおりです。

クローラー名	運営	用途	ブロック時のrobots.txt記述	通常検索への影響
GPTBot	OpenAI	モデル学習	User-agent: GPTBot Disallow: /	なし
OAI-SearchBot	OpenAI	ChatGPT Search引用	User-agent: OAI-SearchBot Disallow: /	なし（ChatGPT Searchからは除外）
Google-Extended	Google	AI学習・Gemini	User-agent: Google-Extended Disallow: /	なし（Googlebotとは独立）
ClaudeBot	Anthropic	モデル学習	User-agent: ClaudeBot Disallow: /	なし
PerplexityBot	Perplexity	AI検索引用	User-agent: PerplexityBot Disallow: /	なし
CCBot	Common Crawl	汎用学習データ収集	User-agent: CCBot Disallow: /	なし

重要な前提：robots.txtは「紳士協定」です。 OpenAIやGoogleなど主要な事業者は概ね尊重していますが、法的な強制力はありません。Tollbit社の調査データによると、2025年第4四半期時点でAIボット全体の約30%がrobots.txtの拒否設定を無視してコンテンツを取得しており、特にRAG（検索拡張生成）に使われる一部のエージェントは無視率が約42%に達するという報告があります。また2024年末時点では無視率が3.3%程度だったことを考えると、この1〜2年で急増していることがわかります。

完全なブロックを目的とするのであれば、認証壁（会員制コンテンツ）やIPフィルタリングが現実的な手段ですが、SEOとの両立は困難になります。

Q. robots.txtで拒否すれば確実に止められる？

A. 確実ではありません。robots.txtは紳士協定であり、法的強制力はありません。大手（OpenAI・Google）は概ね尊重しますが、悪質なスクレイパーや一部のエージェントは無視する可能性があります。Tollbit社の調査では2025年Q4時点でAIボット全体の約30%が拒否設定を無視していると報告されています。

技術的なrobots.txt設定の限界を理解したうえで、次はGoogleが公式に用意した最新の手段を確認します。

Google公式：Search ConsoleのAIオプトアウトトグル設定方法

2026年6月3日、Google Search Centralが正式に「Search Console AIオプトアウトトグル」を発表しました。これはCMA（英国競争・市場庁）がDigital Markets Competition and Consumers Act 2024に基づいてGoogleに課した初の行動要件を受けた対応であり、実質的な義務の施行は2026年12月3日が予定されています。現在は英国を中心とした一部サイトでの先行テスト段階です。

この設定の最大の特徴は、「通常のGoogle検索順位への影響なしに、AI機能への表示のみを制御できる」点です。オプトアウトを選択した場合、AI Overviews・AI Mode・Discover AIフィーチャーからのインプレッションおよびトラフィックはゼロになりますが、通常の検索結果への表示はそのまま維持されます。

設定対象のAI機能：

AI Overviews（AI による概要）
AI Mode（AIモード）
AI Overviews in Discover（Discoverのアイオーバービュー）

なお、GeminiアプリはこのSearch Console設定の対象外です。Gemini経由の引用を制限したい場合は、robots.txtのGoogle-Extendedブロックを別途設定する必要があります。

また、Search ConsoleのAIオプトアウトトグルは「AI検索への表示拒否」を制御するものであり、「モデルの学習データへの利用拒否」は対象外です。モデル訓練への利用を止めたい場合は、前述のrobots.txt設定（Google-Extendedのブロック）が引き続き必要です。

詳しいGoogle検索の変化の背景については「【図解】「ググる」からAIエージェントへ｜Google検索が変わる時代の集客対策【2026】」で解説しています。

Q. Google-Extendedをブロックすると通常の検索順位に影響する？

A. Googleが公式に「通常検索への影響なし」と明言しています。Google-ExtendedはAI学習・Gemini用の専用クローラーであり、検索インデックスを担うGooglebotとは完全に独立しています。安心してブロック設定を実施できます。

Q. Search Consoleのオプトアウトはいつ使えるの？

A. 2026年6月3日発表、現在は英国を中心とした先行テスト段階です。全サイトへの展開はCMAの行動要件施行（2026年12月3日）に合わせて進む見込みですが、正式なスケジュールは未発表です。

Search Consoleで対応できない部分を補うのが、次に説明するmetaタグとllms.txtです。

集客にお困りのサイトは
エレベストSEOにおまかせください

エベレストSEO

＼ご質問やオンライン商談を希望の方はこちら／

お問い合わせ・資料請求

＼サイトの弱点を知りたい方はこちら／

サイトの無料スピード診断

metaタグとllms.txtで補完するAI拒否設定

robots.txtとSearch Consoleの設定に加えて、補完的な手段として2つの方法があります。

① metaタグ（noai / noimageai）

HTMLのheadセクションに以下を記述することで、AIクローラーへの意思表示ができます。

<meta name="robots" content="noai, noimageai">

noaiはテキストコンテンツ全般、noimageaiは画像のAI学習への利用を拒否する意思を示します。ただし、これはrobots.txtと同様に紳士協定の範囲にとどまり、すべてのAIクローラーが必ずしも尊重するわけではありません。対応しているサービスは2026年時点ではまだ限られています。

② llms.txt

llms.txtはAI拒否ではなく、むしろ逆の発想のファイルです。サイトルートに設置し、AIエージェントに対して「このサイトで読むべきページはどこか」を案内するためのものです。AIフレンドリーな運用を選択した場合に有効で、重要なページへの誘導や要約用のMarkdownファイルへのリンクを記述します。

Ahrefsの調査によると、2026年時点でllms.txtを導入しているドメインは全体の約10%程度とされています。導入コストが低く、SEOへのリスクがないため、AI検索への引用を積極的に活用したいサイトには有効な手段です。

Q. llms.txtとrobots.txtは何が違うの？

A. robots.txtはクローラーのアクセスを「制御する」もの、llms.txtはAIエージェントに「読んでほしいページを案内する」ためのファイルです。目的がほぼ逆向きで、前者が拒否系・後者が歓迎系の設定です。AI検索への引用を積極活用したい場合はllms.txtが有効です。

llms.txtを含むLLMO対策の全体像については「LLMO対策｜アイダイム」でまとめています。

AI検索を拒否すると何が起きる？SEOへのトレードオフを正直に解説

「AI検索を拒否すれば安心」と考える前に、失うものを把握しておく必要があります。

2026年6月時点でGoogle AI Overviewsの月間アクティブユーザーは25億人以上、AI Modeは10億人を超えています。これらのAI機能から除外されることは、単に「AIに引用されなくなる」ではなく、「数十億人規模のユーザーが使う機能への露出がゼロになる」を意味します。

また、AI検索経由の流入はコンバージョン品質が高いという実務データも出ています。2025年1月から2026年1月の1年間でAI検索からの参照トラフィックは約975%増加したという報告（※確認中）もあり、AI検索からの流入はSEO流入の4.4倍のコンバージョン率を記録するというデータも存在します（※確認中）。数値の精査は必要ですが、AI検索流入の商業的価値が高まっていること自体は業界の共通認識です。

一方、Googleが明言しているとおり、AI Overviewsのオプトアウトは通常の検索順位への直接的な影響はありません。 robots.txtのGPTBotブロックも、複数の業界分析において「通常検索順位への測定可能な影響なし」とされています。

つまり、拒否設定のトレードオフは以下のように整理できます。

失うもの： AI検索からの引用機会・認知拡大・流入（ただし通常検索流入は維持）
守れるもの： コンテンツの無断学習データ化（ただし完全保証ではない）
変わらないもの： 通常Google検索の順位・Googlebotによるインデックス

Q. AI検索を拒否するとSEOへの悪影響はある？

A. 通常検索への直接影響はありません。ただしAI Overviews・AI Modeは月間25億人超のユーザーが使う機能であり、オプトアウトするとこれらからの引用・流入機会がゼロになります。コンテンツを守ることと、AI検索からの認知を失うことはトレードオフの関係にあります。

📌 AI検索との向き合い方をLLMO戦略として整理したい方はこちら
→ LLMO対策｜アイダイム

設定後の確認方法：ブロックが機能しているかチェックする

robots.txtを設置しても、それが実際に機能しているかどうかは自動ではわかりません。以下の方法で確認できます。

① サーバーログの確認

レンタルサーバーのアクセスログ（access_log）をUser-agentでフィルタリングし、GPTBot・ClaudeBotなどのアクセスが記録されているかを確認します。記録がなければブロックが機能している可能性が高いです。

② Google Search Consoleのクロール統計

Search Console → 設定 → クロールの統計情報で、Googlebotの動きを確認できます。Google-Extendedについては現時点では個別確認の手段が限られます。

③ 専用ツールの活用

xSeekなどのAIクローラー監視ツールを使うと、GPTBot・ClaudeBot・PerplexityBotなどが実際にどのページをクロールしているかを可視化できます。robots.txtの設定が意図通りに機能しているかの検証に有効です。

Q. AI拒否を実装した後、本当にブロックできているか確認できる？

A. サーバーログのUser-agent確認、CloudflareのBot Analyticsレポート、xSeek等の専用ツールで補完確認できます。robots.txtを設置するだけでは確認できないため、ログ監視やツール導入を組み合わせた運用が推奨されます。

設定の確認ができたら、最後にアイダイムとしての戦略的な考え方を共有します。

アイダイムが考えるAI検索拒否の判断基準

（アイダイム分析）AI検索への拒否設定を検討する前に、まず「自分は何を守りたいのか」を明確にすることが最重要です。

当社がクライアントに対して現時点で推奨している基本方針は、「原則AIフレンドリーで先行者利益を高める、ただし有料・独自コンテンツのみ選択的にクローズド化する」というものです。

その理由は明確です。AI検索は今後もユーザー数・利用頻度が増加する方向にあり、AI Overviewsに引用されることはブランド認知の拡大につながります。現時点でAI検索からの引用機会を積極的に獲得しておくことが、中長期的な集客において先行者優位を生みます。AIフレンドリーな状態からクローズドな運用に切り替えることは後からでも可能ですが、一度AI検索の文脈から外れた認知を取り戻すのは容易ではありません。

一方、有料コンテンツ・会員限定コンテンツ・競合に知られたくない独自データについては、robots.txtによる学習拒否を組み合わせることに合理性があります。無料公開のコンテンツをAIに学習・引用されることを「損」と感じるのは、多くの場合、誤解です。引用されること自体がLLMO（AI検索最適化）の成果であり、AI検索からの引用は読者の検索行動を通じてサイトへの流入にもつながります。

まとめると、判断基準は以下のように整理できます。

公開・無料コンテンツ → AIフレンドリー推奨（llms.txtも活用）
有料・クローズドコンテンツ → robots.txtで学習クローラーをブロック
AI検索への表示 → 原則オプトイン（引用歓迎）。Search ConsoleオプトアウトはGSCデータで引用インプレッションを確認してから判断

「ひとまず拒否しておく」という判断は、戦略上もったいない選択になりがちです。AI検索の恩恵を受けながら、必要な部分だけをクローズド化するという段階的な設計を当社は推奨しています。

参考情報

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！