以下はGoogleのウェブマスター向けガイドラインの引用文です。
- 検索エンジンではなく、ユーザーの利便性を考慮してページを作成する。ユーザーを騙すようなコンテンツや、「クローキング」を行って検索エンジン用とは異なるコンテンツを表示しないでください。
- 検索エンジンでの掲載位置を上げるための不正行為を行わない。ユーザーや、ランクを競っているサイトに対して自分が行った対策を明確に説明できるかを判断の目安としてください。その他にも、ユーザーにとって役立つかどうか、 検索エンジンがなくても同じことをするかどうか、などのポイントを確認してみてください。
- サイトの順位や PageRank を上げるように設計されたリンク プログラムに参加しない。特にウェブスパマーや不正なウェブサイトへのリンクは行わないでください。これらのリンクにより、サイトのランクが下がることがあります。
- プログラムの送信や掲載順位の確認に不正なコンピュータ プログラムを使用しない。このようなプログラムはリソースを消費し、Google の利用規約に違反します。 Google は、自動化またはプログラム化されたクエリを Google に送信する WebPosition Gold™ のような製品の使用は推奨していません。
具体的なガイドライン
隠しテキストや隠しリンクを使用しない。
コンテンツに隠しテキストや隠しリンクが含まれていると、ユーザーに対するものと異なる情報が検索エンジンに提示されるため、信頼できないサイトと見なされる可能性があります。過度のキーワードといったテキストは、以下のような複数の方法で隠すことができます。
- 白の背景で白のテキストを使用する
- テキストを画像の後ろに含める
- CSS を使用してテキストを隠す
- フォント サイズを 0 に設定する
隠しリンクとは、Googlebot でクロールされることを意図しているが、下記のようにユーザーからは読み取れないリンクのことです。
- リンクが隠しテキストで構成されている (たとえば、テキストの色と背景色が同じ)。
- CSS を使用して、高さが 1 ピクセル程度の非常に小さいハイパーリンクが作成されている。
- リンクが小さな文字 (たとえば、段落中のハイフン) に組み込まれている。
偽装目的の隠しテキストや隠しリンクが含まれていると判断されたサイトは、Google のインデックスから削除され、検索結果ページに表示されなくなります。隠しテキストや隠しリンクが含まれていないかを評価する際は、サイトのユーザーから見にくい部分がないかをご確認ください。また、ユーザーではなく検索エンジンだけを対象としたテキストやリンクがないかどうかもご覧ください。
テキストを使用して、JavaScript、画像、Flash ファイルといった、検索エンジンがアクセスできないコンテンツを記述する場合は、スクリーン リーダー、携帯電話のブラウザ、プラグインのないブラウザ、低速の回線を使用するユーザーの多くがそのコンテンツを表示できないことにご注意ください。これらのアイテムについて説明テキストを使用すると、サイトのアクセス性は向上します。アクセス性のテストは、JavaScript、Flash、画像をオフにしたり、Lynx などのテキスト ブラウザを使用して行えます。サイトのアクセス性を高めるためのヒントを以下に示します。
- 画像: alt 属性を使用して説明テキストを含めます。また、画像の近くにわかりやすいキャプションや説明テキストを入れることもお勧めします。
- JavaScript: JavaScript と同じ内容を noscript タグに含めます。 この方法を使用する場合は、タグの内容が JavaScript とまったく同じであり、ブラウザで JavaScript を無効にしているユーザーに表示されることを確認してください。
- Flash: 説明テキストとサイト ナビゲーションを Flash の外側に配置します。
- 動画: 動画の説明テキストを HTML に含めます。 キャプションや字幕を含めることもできます。
サイトで隠しテキストや隠しリンクを見つけた場合は、削除してください。サイトのユーザーに関連する場合は、見やすくしてください。サイトが検索結果から削除された場合は、Google のウェブマスター向けガイドラインで詳細をご覧ください。 変更を加え、サイトが Google のウェブマスター向けガイドラインに従っていることを確認できたら、再審査用にサイトを送信します。
クローキング、JavaScript リダイレクト、誘導ページ
クローキング
クローキングとは、ユーザーと検索エンジンとで異なるコンテンツや URL を表示することです。user-agent に基づいて異なる結果を表示するサイトは、偽装の意図があると見なされ、Google インデックスから削除される場合があります。
クローキングの例を以下に示します。
- 検索ページには HTML テキストのページを表示し、ユーザーには画像や Flash のページを表示する。
- ユーザーに対するものとは異なるコンテンツを検索エンジンに表示する。
Flash、JavaScript、画像など、検索エンジンがクロールできない要素がサイトに含まれている場合、クローキング コンテンツを検索エンジンに提供するのではなく、サイトのユーザーにもそれらの要素を表示できない可能性があることを考慮して対応してください。たとえば、下記のように対応します。
- スクリーン リーダーを使用したりブラウザで画像をオフにしているユーザーのため、画像を説明する alt テキストを含める。
- JavaScript のテキスト内容を noscript タグに含める。
JavaScript と noscript タグに同じテキストを含めるなど、両方の要素に同じ内容を含めるよう、注意してください。実質的に異なる内容が代替要素に含まれている場合は、Google がそのサイトに対して処置を取る可能性があります。
不正な JavaScript リダイレクト
Googlebot は JavaScript を含んでいるページもインデックスに登録しますが、JavaScript そのものに含まれているリンクをたどったりインデックスに登録することはできません。JavaScript の使用は完全に正当なウェブ処理ですが、検索エンジンをだます目的で JavaScript を使用することはそうではありません。たとえば、JavaScript と noscript タグとに異なるテキストを含めることは、ユーザー (JavaScript ベースのテキストを見る) と検索エンジン (noscript ベースのテキストを見る) とで異なるコンテンツが表示されるため、Google のウェブマスター向けのガイドラインに対する違反になります。同様に、検索エンジンに対するものとは異なるページをユーザーに表示する目的でユーザーを別のページにリダイレクトするリンクを JavaScript に埋め込むことは、ウェブマスター向けのガイドラインに対する違反となります。リダイレクト リンクが JavaScript に埋め込まれている場合、検索エンジンは元のページをインデックスに登録し、リンクをたどることはありませんが、ユーザーはリダイレクト先に移動します。クローキングと同様、ユーザーと Googlebot に異なるコンテンツが表示され、ユーザーが意図しない場所に移動することになるため、これは偽装行為となります。
ただし、JavaScript 内にリンクを入れること自体は偽装行為ではありません。サイト上の JavaScript が Google のガイドラインに従っているかどうかを検証する際は、目的を考慮してください。
一般に、検索エンジンは JavaScript の内容にアクセスできないため、JavaScript 内の正当なリンクにもアクセスできない可能性があります。これは、JavaScript に対応していないブラウザを使用するユーザーにも当てはまります。リンクは JavaScript の外部に配置するか、noscript タグ内に複製することができます。
誘導ページ
誘導ページは、特に検索エンジン用に作成されたページです。このページには、ユーザーにとってほとんどまたはまったく役に立たない、しばしば数百に及ぶ多数のリンクが含まれ、価値のある内容が含まれることはありません。HTML サイトマップはユーザーにとって価値のあるリソースですが、これらのリンク ページはユーザーにとって移動しやすいものにする必要があります。多数のリンクを含める場合は、カテゴリに分類するか複数のページに分けることができます。その場合も、単に検索エンジンを対象としたものではなく、ユーザーがサイトのセクションを移動するのに役立つページにしてください。
Google の目標は、最も関連性の高い、価値のある検索結果をユーザーに提供することです。そのため、検索エンジンを操作したり、ユーザーをだまして意図しないサイトにリダイレクトする処理や、検索エンジンだけを対象にしたコンテンツを提供する処理などには反対しています。こういった処理を行うサイトは Google インデックスから削除され、Google 検索結果に表示されなくなる可能性があります。
サイトが検索結果から削除された場合は、Google のウェブマスター向けのガイドラインで詳細をご覧ください。変更を加え、サイトが Google のウェブマスター向けのガイドラインに従っていることを確認できたら、再審査用にサイトを送信します。
キーワードの乱用
「キーワードの乱用」とは、Google の検索結果におけるサイトのランキングを操作する目的で、ウェブページにキーワードを詰め込むことです。ページにキーワードを詰め込むと、ユーザーの利便性が低下し、サイトのランキングに悪影響が及ぶ可能性があります。情報に富んだ有用なコンテンツの作成に焦点を合わせ、キーワードは文脈に合わせて適切に使用してください。
この問題を修正するには、サイトで乱用されているキーワードがないかどうかを調べます。通常、これはキーワードのリストや段落で、ランダムに繰り返されています。キーワードはしばしば隠しテキストの形式になっていたり、title タグや alt 属性に含まれていることがありますので、注意して確認してください。
重複するコンテンツ
一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。 多くの場合、偽装を意図したものではありません。 悪意のない重複するコンテンツの例には、以下のものがあります。
- 通常ページと携帯デバイス用の簡易ページの両方を生成するディスカッションフォーラム
- 複数の異なる URL で表示またはリンクされる商品ページ
- ウェブ ページの印刷用バージョン
しかし、検索エンジンの操作やトラフィックの増大を意図して、コンテンツが複数ドメインにまたがって複製されることもあります。この種の偽装行為は、ユーザーが検索結果で実質的に同じコンテンツを何度も見ることになり、利便性の低下につながります。
Google は、固有の情報を持つページをインデックスに登録して表示するよう努めています。 たとえば、サイトの各記事に「通常」バージョンと「印刷用」バージョンがあり、そのどちらも robots.txt でブロックされておらずnoindexメタ タグも設定されていなければ、フィルタリングによっていずれか 1 つがリストに登録されます。ごくまれなケースとして、Google でのランキングの操作やユーザーへの偽装を意図した重複コンテンツが表示される可能性が認識された場合も、Google では関係するサイトのインデックス登録とランキングに対して適切な調整を行います。その場合、該当するサイトはランキングが低下するか、Google インデックスから完全に削除されて検索結果に表示されなくなる可能性があります。
重複するコンテンツに関する事前の対策を行い、ユーザーに意図したとおりのコンテンツが表示されるようにするための手順を以下に示します。
- ページがインデックスに登録されないようにする: Google のアルゴリズムに文書の「最善の」バージョンを判断させる代わりに、優先するバージョンを Google が判別しやすくすることができます。 たとえば、サイトの記事の印刷用バージョンがインデックスに登録されないようにするには、該当するディレクトリを除外するか、robots.txtファイルで正規表現を活用します。
- 301 を使用する: サイトの構造を変更した場合は、301 リダイレクト (“RedirectPermanent”) を .htaccess ファイルで使用して、ユーザー、Googlebot、他のスパイダーを適切にリダイレクトすることができます (Apache の場合は .htaccess ファイルを使用し、IIS の場合は管理コンソールを使用します)。
- 一貫性を保つ: 内部リンクの一貫性を保つように努力します。 たとえば、http://www.example.com/page/、http://www.example.com/page、http://www.example.com/page/index.htm の中から、どれか 1 つに絞ってリンクします。
- トップレベル ドメインを使用する: Google で文書の最も適切なバージョンが表示されるよう、国別のコンテンツを扱う場合は可能な限りトップレベル ドメインを使用します。 たとえば、www.example.de を使用すれば、www.example.com/de や de.example.com の場合よりも、ドイツを対象としたコンテンツが含まれることを Google で認識できる可能性が高くなります。
- シンジケーションは注意して行う: コンテンツを他のサイトでシンジケーション提供している場合、お客様の判断とは無関係に、Google で最適と判断されたバージョンが常に表示されます。 ただし、コンテンツがシンジケーション提供される各サイトに元記事へのリンクを含めると、役に立ちます。また、シンジケーション提供されたコンテンツを使用するユーザーに、自身のサイト上のバージョンを robots.txt でブロックするように依頼することもできます。
- ウェブマスターツールを使用して、サイトをインデックスに登録する方法を Google に伝える: www.example.com と http://example.com のどちらを使用するかなど、使用するドメインを Google に伝えることができます。
- 決まりきった内容の繰り返しをできるだけ少なくする: たとえば、著作権に関する説明をすべてのページの下部に含める代わりに、短い要約文を含め、詳細情報のページにリンクします。
- スタブの公開を避ける: ユーザーは「空の」ページが表示されることを好まないので、プレースホルダーはできるだけ使わないようにします。たとえば、実際のコンテンツがまだ存在しないページは公開しません。プレースホルダー ページを作成した場合はrobots.txt を使用してクロールをブロックします。
- コンテンツ管理システムについて理解する: コンテンツがウェブ サイトで表示される仕組みをよく理解しておきます。ブログ、フォーラムなどのシステムでは、同じコンテンツがしばしば複数のフォーマットで表示されます。たとえば、ブログのエントリはブログのホームページ、アーカイブ ページ、および同じラベルを持つ他のエントリのページに表示されることがあります。
- 類似する内容をできるだけ少なくする: 類似するページが多数存在する場合は、各ページに内容を追加するか、1 つにまとめます。たとえば、旅行サイトで 2 つの都市を別々のページで紹介しているが、ページ内の情報は同じである場合は、両方の都市を紹介する 1 つのページにまとめるか、各ページに内容を追加して、それぞれの都市に関する独自のコンテンツを含めます。
サイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の根拠とはなりません。重複するコンテンツが問題になっていて、上記のアドバイスが適用されていない場合、Google の検索結果に表示されるコンテンツのバージョンは Google で選択されます。