検索エンジンの仕組み

検索エンジンの種類

検索エンジンには、ディレクトリ型とロボット型の2種類があります。Yahoo!とGoogleがその代表と言えます。

ディレクトリ型は、サイトの内容を判断して、カテゴリに分類されてページが登録されます。人間の判断で分類・登録するため、信頼度は高いですが登録数が少ないといった欠点があります。サイトの自薦または登録者の発見がなければ登録されないという欠点もあります。

ロボット型は、検索ロボットと呼ばれるプログラムがサイトの情報を集めて自動的に解析を行って登録を行うものです。登録サイトの数は非常に多いですが、解析が自動で行われるため、信頼度が多少下がります。SEOでは、主にこのロボット型に対しての対策を考えます。

最近では、この両者の2つを融合させたハイブリット型が主流となっています。Yahoo!では両方の検索結果が表示されます。

検索ロボットの動き

ロボット型検索サイトとして代表的なGoogleを取り上げてみます。

Googleの検索ロボットは、クローラーとインデクサという2種類があります。クローラーは、ウェブページを巡回し、情報を集めてきます。集められた情報は、Googleがキャッシュとして保持し、インデクサによりページが解析されて、インデックスが付けられ検索されるようになります。

スニペット

検索結果には、スニペット(snipet)と呼ばれるサイトの説明文が表示されます。

InfoseekやYahoo!では<meta>要素のdiscriptionに記述された文章が表示されます。discriptionは以下のように記述します。説明文は、サイトの内容がわかるように80文字くらいで記述します。

<meta name="description" content="説明文">

Googleでは、description内に検索キーワードが記述されていない場合に、検索キーワードが含まれる前後の文章が表示されます。

リンクポピュラリティ

リンクポピュラリティ(link popularity)とは、被リンクで計算されるページの人気度です。被リンクの数と質(リンクしているページ自体の評価)から計算されます。採算方法は検索サイトごと独自の方法で行っています。リンクポピュラリティが高ければ検索順位が上に上がりやすくなりますが、それだけではないので注意が必要です。

Googleでは、Googleツールバーをインストールすると10段階評価のページランクとして表示されます。

例 常磐大学ホームページのページランク

常磐大学ウェブページのページランクは5ですね。