何ホップで戻って来るか?

2005-01-29 で書いたように,2005-01-22 の記事が「某氏」さんとたつをさんを介して戻って来た (かもしれない).そして,2005-01-29 の TB にあるように,buchilog さんからみると,いろいろ,某氏さん,たつをさん,の少なくとも 3 ホップで話題が戻って来た (かもしれない) ことになる (某氏さん周りが複数人の可能性はあるが).

SNS や blog を語る時,よく「6 ホップ目で世界中のほとんどの人に行き着く」という "six degrees of inner t seperation" という話が引き合いに出される (以下の記事がよくまとまってるんだけど,なんで第 1 回で打ち切られてるんですかね?).

で,気になったのは,だいたい何ホップくらいで話が戻って来るものなんだろう? ということ.FOAF なんかを使ってノード情報を可視化すると何か見えて来るのかな?Brown 運動の場合,1,2 次元であれば確率 1 で元の所に戻って来るが,3 次元以上の場合はそうならない (例えば 3 次元の場合は元のところに戻る確率は 0.34).単純に 4 近傍モデルを 2 次元と考えれば,交友関係はまあだいたい 4 本よりもっと腕があるはずだから,トピックがウェブ上で Brown 運動をするとすれば,わりと簡単に無限の彼方に行ってしまいそうなもんである.



だけど実際のウェブの人間関係は完全なフラットフィールドではなくて,アルファブロガーをハブとした小さな社会がいくつもスター型に寄り集まっているものとかなんとかそんなものだと思われる.小さな社会は,突発的に他の社会と交信することはあっても,まあ閉じた世界と思っていいかも知れない.特にうちが属しているような社会はわりと閉じた宇宙になっている気がする.



ちなみに有限 (自分+N 個) のノードがある閉じた完全グラフ世界で,投げたトピックはどうなるだろうか.k 個のノードを経由して戻って来る場合,その辿り方は k! 通り.その k 個のノードの選び方は C(N,k) 通り.だから自分のところに戻って来る経路は Σk!・C(N,k) 通りある.その時のホップ数の期待値 E(h) は Σk!・C(N,k)・k / Σk!・C(N,k) となる.h(1) = 1,h(2) = 1.5,h(3) = 2.2,…でわりとすぐに N-1 に近付く.しかし実際は,各ノードがトピックを引用するとは限らない (そもそも読んでくれない).ここで,そのトピックが引用される確率を P としよう.ホップ数が k ならトピックは P^k 倍に減衰する.だから E(h) は Σk!・C(N,k)・k・P^k / Σk!・C(N,k) となるはず.ちょっとやってみると,P=0.9 のとき,ノード数 10 くらいで最大値 3.5 ホップとなる.よほど魅力的なネタで,コミュニティが 10 数名程度であれば,3.5 ホップくらいで返ってくるということか.なんかホップ数が多い程,トピックが返って来ると嬉しくなるよね.ちなみに,証明はしてないけど 0.5<P<1 であれば必ずピークはあるような感じで,P=0.99 の場合,90 ノードあたりで最大ホップ 36.6 となる.

hop

黒体輻射みたいな図が出てきてしまった.さあ,トンデモな感じになってきた.所詮お遊びなので,実態をまるで表してないし,ハブまで考え始めたら到底手に追えないしね.