robots.txt
検索エンジンのクローラーにクロールを許可・禁止するURLを指示するテキストファイル。サイトルートに設置し、管理画面や重複コンテンツのインデックスを防ぐ。
robots.txtとは?
robots.txtは、Webサーバーのルートディレクトリに設置するテキストファイルです。Googlebot等のクローラーに「どのURLをクロールしてよいか・してはいけないか」を伝えます。
基本的な書き方
User-agent: *
Disallow: /admin/
Disallow: /private/
Allow: /
Sitemap: https://example.com/sitemap.xml
- User-agent: 対象クローラー(
*は全クローラー) - Disallow: クロール禁止のパス
- Allow: Disallowより優先して許可するパス
よくある用途
| 用途 | 設定例 |
|---|---|
| 管理画面を隠す | Disallow: /admin/ |
| 検索結果ページを除外 | Disallow: /search? |
| 全クロール禁止(開発中) | Disallow: / |
| XMLサイトマップを伝える | Sitemap: https://example.com/sitemap.xml |
注意点
- robots.txtはクローラーへの「お願い」であり強制力はない(悪意あるボットは無視する)
- インデックスを確実に防ぐには
noindexメタタグまたはX-Robots-Tagヘッダーを使う - 誤ってサイト全体をDisallowするとSEOに壊滅的な影響を与える
まとめ
robots.txtはシンプルですが、設定ミスがSEO事故につながることがあります。変更後はGoogle Search ConsoleのURLテストツールで動作確認を必ず行いましょう。
関連する用語 (Webマーケティング)
全45件を見るA/Bテスト(スプリットテスト)
Webページや機能の2つのバリアントをランダムに分けたユーザーに表示し、どちらがより高いCVRやKPIを達成するかを統計的に比較する手法。データに基づく意思決定の基本。
バックリンク(被リンク)
外部サイトから自サイトへ向けられたリンク。SEOにおいて被リンクの質と量はドメインの信頼性・権威性を高める重要なシグナルとなる。
SEM (検索エンジンマーケティング)
Googleなどの検索エンジンを使った「集客・マーケティング活動のすべて」を指す言葉。SEOとWeb広告(リスティング広告)を合わせた総称。
IT用語: ランディングページ(LP)とは|広告流入を成果に変えるページ設計
広告やSNSからの流入を特定の行動(購入・登録)に誘導するランディングページの構造と設計原則を解説。
IT用語: SNSマーケティングとは|各プラットフォームの特性と活用戦略
X・Instagram・YouTube・TikTok等を活用したSNSマーケティングの特性比較とアルゴリズム対策を解説。
IT用語: ヒートマップとは|ユーザーの行動を色で可視化する分析ツール
Webページのどこがクリックされ・どこまで読まれているかを色で可視化するヒートマップ分析ツールを解説。