中学生でもわかるGoogleのPageRankの仕組み
4月1日に日記で何か書いてもまるで真実味を帯びないので、それならばと、テキトーに書こうと思うのだ。
今日書くのは、GoogleのPageRankの仕組みである。これを限りなくわかりやすく、それこそ中学生にでもわかるように書くのが今日の目標だ。
近年、blogがさかんになってきて、PageRankの意味自体が崩壊しようとしている。ちなみに、このページはPageRank3だ。ときどき、5になったりする日もあるがたいていは3だ。ニュース記事をコピペして、ひとことコメントを書いているだけのサイトが5だったりするのを見るとちょっと悔しい。
PageRankの仕組みは、線形代数を学んだ人ならば
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
を見れば意味がわかると思うので、そういう人は今日の対象にはしない。
PageRankの考え方とかは上記のページを見てもらえればいいので、まずは、そのページを見て、意味がわからなくなったところらへんで、こっちに戻ってきて欲しい。
以下、中学生にもわかるPageRankの計算方法。
いま、インターネット上に、A,B,Cというページがあるとしよう。
Aから、BとCにリンクがはられている。
Bからは、Aにリンクがはられている。
CからはAとBにリンクがはられている。
A,B,Cに、最初、100のちからをあげよう。
A = 100 , B = 100 , C = 100
AからはBとCにリンクがはられているので、Aの持ってるちから(100)を半分ずつBとCにわけよう。BとCに50ずつ力がいくよね。
BからはAにだけリンクがはられているので、Bの持ってるちから(100)をぜんぶAにあげよう。Aに100追加ね。
Cからは、AとBにリンクがはられているので、Cの持ってるちから(100)をAとBに半分ずつわたそう。AとBに50追加ね。
この結果、Aは、Bから100,Cから50ちからをもらって、Aのちからは150になる。BはAから50、Cから50もらうので100。CはAから50もらうので50になる。以上で1回目が終了。
いまA,B,Cの持つちからは、
A = 150 , B = 100 , C = 50
になったね。
うえでやったのと同じ操作をもういちどやってみよう。
AからAのもってるちから(150)を、B,Cに75ずつわたす。
BからBのもってるちから(100)をぜんぶAに100わたす。
CからCのもってるちから(50)をA,Bに25ずつわたす。
そうすると
A = 125 , B = 100 , C = 75
になったね。これで2回目終了。
こういう計算を、くりかえすわけ。ここでは3つのページに対して2回計算してみたけど、この計算をインターネットでつながってるページすべてに対して、えんえんとくりかえすのよ。
そうすると、それぞれのページのちからはいくらになりますか?っていうのが求まるよね。このときのちからが大きいページほどPageRankが大きいんだ。
つまり、たくさんのページからリンクがはられているページにはちからが集まりやすくてPageRankが高くなるというわけなの。
良い子のみんな、わかったカナ?