中学生でもわかるGoogleのPageRankの仕組み

4月1日に日記で何か書いてもまるで真実味を帯びないので、それならばと、テキトーに書こうと思うのだ。


今日書くのは、GooglePageRankの仕組みである。これを限りなくわかりやすく、それこそ中学生にでもわかるように書くのが今日の目標だ。


近年、blogがさかんになってきて、PageRankの意味自体が崩壊しようとしている。ちなみに、このページはPageRank3だ。ときどき、5になったりする日もあるがたいていは3だ。ニュース記事をコピペして、ひとことコメントを書いているだけのサイトが5だったりするのを見るとちょっと悔しい。


PageRankの仕組みは、線形代数を学んだ人ならば
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
を見れば意味がわかると思うので、そういう人は今日の対象にはしない。


PageRankの考え方とかは上記のページを見てもらえればいいので、まずは、そのページを見て、意味がわからなくなったところらへんで、こっちに戻ってきて欲しい。


以下、中学生にもわかるPageRankの計算方法。


いま、インターネット上に、A,B,Cというページがあるとしよう。


Aから、BとCにリンクがはられている。
Bからは、Aにリンクがはられている。
CからはAとBにリンクがはられている。


A,B,Cに、最初、100のちからをあげよう。


A = 100 , B = 100 , C = 100


AからはBとCにリンクがはられているので、Aの持ってるちから(100)を半分ずつBとCにわけよう。BとCに50ずつ力がいくよね。


BからはAにだけリンクがはられているので、Bの持ってるちから(100)をぜんぶAにあげよう。Aに100追加ね。


Cからは、AとBにリンクがはられているので、Cの持ってるちから(100)をAとBに半分ずつわたそう。AとBに50追加ね。


この結果、Aは、Bから100,Cから50ちからをもらって、Aのちからは150になる。BはAから50、Cから50もらうので100。CはAから50もらうので50になる。以上で1回目が終了。


いまA,B,Cの持つちからは、
A = 150 , B = 100 , C = 50
になったね。


うえでやったのと同じ操作をもういちどやってみよう。


AからAのもってるちから(150)を、B,Cに75ずつわたす。
BからBのもってるちから(100)をぜんぶAに100わたす。
CからCのもってるちから(50)をA,Bに25ずつわたす。


そうすると
A = 125 , B = 100 , C = 75
になったね。これで2回目終了。


こういう計算を、くりかえすわけ。ここでは3つのページに対して2回計算してみたけど、この計算をインターネットでつながってるページすべてに対して、えんえんとくりかえすのよ。


そうすると、それぞれのページのちからはいくらになりますか?っていうのが求まるよね。このときのちからが大きいページほどPageRankが大きいんだ。


つまり、たくさんのページからリンクがはられているページにはちからが集まりやすくてPageRankが高くなるというわけなの。


良い子のみんな、わかったカナ?