Google｜技術関連のガイドライン

この記事は2008年6月30日に書かれたものです。既に内容が古い可能性があります。

Lynx などのテキストブラウザを使用してサイトを確認する。ほとんどの検索エンジンスパイダーがサイトを認識する場合、Lynx と同様の形式で認識しています。テキストブラウザで、JavaScript、cookie、セッション ID、フレーム、DHTML、Flash などの特殊な機能を使用して作成されたサイトの一部が表示されない場合は、検索エンジンスパイダーがサイトをクロールするときに問題が発生する可能性があります。

セッション ID やサイト内のパスを追跡する引数がなくても、検索ロボットがサイトをクロールできるようにする。これらの技術は個々のユーザーの行動を追跡する場合には便利ですが、ロボットがアクセスするパターンとはまったく異なります。これらの技術を使用すると、実際は同じページにリンクしている、異なる URL をロボットが排除できず、そのサイトのインデックスが不完全なものになる可能性があります。

ウェブサーバーが If-Modified-Since HTTP ヘッダーに対応していることを確認する。この機能を使用すると、Google が前回サイトをクロールした後にコンテンツが変更されたかどうかをサーバーから Google に通知し、帯域幅や負荷を軽減できます。

ウェブサーバーの robots.txt ファイルを活用する。このファイルでは、クロールを実行するディレクトリと実行しないディレクトリを指定できます。誤って Googlebot クローラがブロックされることのないよう、このファイルにサイトの最新の状態が反映されていることを確認してください。サイトへのロボットのアクセスを制御する方法については、次の URL (英語) をご覧ください。
http://www.robotstxt.org/wc/faq.htmlGoogle ウェブマスターツールのrobots.txt 分析ツールを使用して、robots.txt ファイルを正しく使用しているかテストできます。

コンテンツ管理システムを導入する場合は、検索エンジンスパイダーがサイトをクロールできるように、システムからコンテンツをエクスポートできることを確認する。

robots.txt を使用して、検索結果ページや、検索エンジンからアクセスしたユーザーにとってあまり価値のない他の自動生成ページをクロールしないよう制御します。

2008年6月30日 | カテゴリー

タグ: Google, seo

ホームページ制作島根県

高品質で低価格なホームページ制作

Google｜技術関連のガイドライン