皆さんこんにちは、CPチームの小泉です。
4月、新年度になり、新たなスタートを迎えられている方もいらっしゃると思います。

全研本社でも新卒の新たな人材を迎え、
CPチームとしてパワーアップをしていきます。

そんな折に、とても基本的な話題になりますが…。
今日は「検索の仕組みについて」をお話させていただきます。

…というのも私が偉そうに書かせていただくことではないのですが、
少し前の記事で、
Googleが「検索の仕組み(How Search Works)」をインフォグラフィックで公開しましたので
その内容に簡単に触れてみたいと思います。
内容的には新鮮なものではないのですが、
HTML5を使い感覚的に捉えるような内容だったので取り上げてみます。
※すごく縦長になるので完成形はURLをご参照下さい。
http://www.google.com/insidesearch/howsearchworks/thestory/ 

検索の仕組み(How Search Works)

サイトの運営者は、サービスや自社商材に関するキーワードにおける検索エンジンの評価ということには
常に関心を持っておく必要があります。
そしてその検索エンジンがどのような仕組みでサイトを評価していくか、ということを知っておく事も大切です。
Googleの検索エンジンが、どのようにページを見つけて認識(インデックス)し検索結果に反映させるのか、
最適な検索結果を素早く提供する為のページランクの仕組み、
不要な情報に対するスパム対策などを解説してくれているので順を追って触れていきます。

クロールとインデックス

「クロールとインデックス」
Googleでは「Googlebot」と呼ばれるウェブクローラーがウェブページをクロール(情報を取得)します。
クローラーはページ内情報を得るためにリンクを辿りウェブページ上のデータを蓄積し、
検索可能な状態に整理し登録する「インデックス」を作成します。

クロールのプロセスは、過去のクロールのリストとサイト所有者が提供するサイトマップから始まり、
その訪れたサイトから他ページへのリンクを探し、新しいサイトの情報などを確認してきます。
さらに、Googleのインデックス登録システムでは、公開された時期、写真や動画の有無など、
ページの様々な特性に着目し、
ナレッジグラフにより単なるキーワードマッチング以上の検索結果を提供することに取り組んでいます。

アルゴリズム

「アルゴリズム」
検索する人にとって本当に必要とされている情報を精度高く提供するために、
200を超える独自のシグナル「手がかり」を用いてページをランキングしています。
その仕組みを「アルゴリズム」といいます。
このランキングでは、ウェブサイト上の語句、コンテンツの更新性や信頼性、品質などが影響しています。
「アルゴリズム」は検索する人にとって、
より適切な検索結果を提供するために絶えず変化しています。

スパム対策

「スパム対策」
日々大量に作成されているスパムページに対して
アルゴリズムと手動による対策を組み合わせ、スパムを排除しています。
隠しテキストやPageRankの転送する目的のリンクを大量に張ったり、キーワードを何度も繰り返したり、
検索結果に悪影響を与える事がスパム行為です。
スパム行為により検索する人にとって有益なサイトを表示できず、信頼性が下がるだけでなく、
サイト所有者にとっても、関連性の高い正当なウェブサイトが表示されないことは不利益をもたらします。

スパムサイトの検出は大半が自動で行いますが、
自動で対応できないものについては手動でサイトを確認しインデックス削除を行っています。
サイトが手動によってインデックス削除された場合、サイト所有者へ通告されます。

その意図としては、サイト所有者には
「サイトを健全な状態にするために必要な情報を持っていただきたい」
と考えているからです。

そのサイトの所有者は再審査をGoogleにリクエストすることができます。
サイトのクリーンアップを実施し、スパム行為のあるコンテンツを削除したら
再審査リクエストをGoogleに依頼することができます。
Googleでは受け取った全ての再審査リクエストを処理し、その過程でサイトの所有者に進捗状況を連絡しています。

まとめ

「まとめ」
Googleの検索に対する考え方としては、以下があります。

・情報へのアクセスを最優先
・手動による対策よりもアルゴリズムを優先する
・例外リスト
・スパム及び不正なソフトウェア対策
・ウェブマスターに対する情報開示
・IDの窃盗防止
・法的な理由による削除
・児童ポルノ対策
・刺激の強いコンテンツ
・セーフサーチ

Googleでは世界中の情報を体系化し、
検索する人にとって最適な検索結果を提供するために、日々進化を続けていることが見受けられます。
SEOを行っている我々にとっても、
ユーザー目線に立ち、Googleの考え方を認識し、理解していく事
これからもずっと重要な課題となっていきます。

【本記事の参考URL】
http://www.google.com/insidesearch/howsearchworks/thestory/ 「How Search Works」

この様な内容ですが、着目したいのは
HTML5を使ったインフォグラフィックで出来ていることです。
このようなインフォグラフィックが今後増えていくと考えられます。
ビジュアル重視だったインフォグラフィックがテキスト要素を持ち、
コンテンツとして意味のある情報となります。
さらに推奨するレスポンシブWebデザインを取り入れていることにも注目です。

参考までに、レスポンシブWebデザインを使い非常に良く出来たサイトがありますので下記にURLを記載します。
是非、お手元のブラウザで伸ばしたり縮めたりしてみて下さい。
※ブラウザは「Google Chrome」を使用して下さい。

【レスポンシブWebデザインの参考サイト】
http://www.nhk.or.jp/studiopark/ 「NHKスタジオパーク」
http://www.recruit-sumai.co.jp/ 「リクルート住まいカンパニー」
http://ise.jr-central.co.jp/index.html「参りましょう伊勢」
http://mamiko-bridal.com/ 「Mamiko Brida Studio」
http://studio.midori.so/ 「Studio Midori」

本日は以上です。
CP小泉でした。