robots.txt
検索エンジンのクローラーにクロールを許可・禁止するURLを指示するテキストファイル。サイトルートに設置し、管理画面や重複コンテンツのインデックスを防ぐ。
robots.txtとは?
robots.txtは、Webサーバーのルートディレクトリに設置するテキストファイルです。Googlebot等のクローラーに「どのURLをクロールしてよいか・してはいけないか」を伝えます。
基本的な書き方
User-agent: *
Disallow: /admin/
Disallow: /private/
Allow: /
Sitemap: https://example.com/sitemap.xml
- User-agent: 対象クローラー(
*は全クローラー) - Disallow: クロール禁止のパス
- Allow: Disallowより優先して許可するパス
よくある用途
| 用途 | 設定例 |
|---|---|
| 管理画面を隠す | Disallow: /admin/ |
| 検索結果ページを除外 | Disallow: /search? |
| 全クロール禁止(開発中) | Disallow: / |
| XMLサイトマップを伝える | Sitemap: https://example.com/sitemap.xml |
注意点
- robots.txtはクローラーへの「お願い」であり強制力はない(悪意あるボットは無視する)
- インデックスを確実に防ぐには
noindexメタタグまたはX-Robots-Tagヘッダーを使う - 誤ってサイト全体をDisallowするとSEOに壊滅的な影響を与える
まとめ
robots.txtはシンプルですが、設定ミスがSEO事故につながることがあります。変更後はGoogle Search ConsoleのURLテストツールで動作確認を必ず行いましょう。
関連する用語 (Webマーケティング)
全45件を見るGA4(Google アナリティクス 4)
Googleが提供する次世代のアクセス解析ツール。イベントベースの計測モデルを採用し、WebとアプリのデータをUAより柔軟に統合・分析できる。
OGP (Open Graph Protocol)
Twitter(X)やFacebookなどのSNSでWebサイトのURLをシェアした際に、「タイトル」「画像」「説明文」を魅力的なカードとして表示させるための仕組み・設定。
CPC(クリック単価)
広告がクリックされるたびに発生するコスト。CPC = 広告費 ÷ クリック数で算出。リスティング広告(Google広告)の主要課金方式でもある。
バックリンク(被リンク)
外部サイトから自サイトへ向けられたリンク。SEOにおいて被リンクの質と量はドメインの信頼性・権威性を高める重要なシグナルとなる。
Core Web Vitals(コアウェブバイタル)
Googleが定めるユーザー体験の品質指標。LCP・INP・CLSの3指標でページのパフォーマンスを評価し、SEOのランキング要因にも影響する。
CPA(顧客獲得単価)
1件のコンバージョン(購入・申し込み・問い合わせ等)を獲得するためにかかった広告費用。CPA = 広告費 ÷ コンバージョン数で算出し、LTVとのバランスで事業健全性を評価する。