26a6ef62.jpgクリス・アンダーソン

早川書房

このアイテムの詳細を見る

先日、紹介した本の訳本が間もなく出る(アマゾンでは予約受付中)。内容の紹介はそこで書いたが、学問的には疑問も多い。最大の問題は(一般書だからしょうがないが)、原データがなくてアバウトなグラフしか描いてないので、どこまで厳密にベキ分布に従っているのかよくわからないこと、もう一つは、なぜベキ分布になるのかについて、ほとんど説明がないことだ。

後者については、スケールフリー・ネットワークなどで「複雑性」の概念を使った説明が行われているが、実はこれはもっと簡単に導ける。たとえばランダムにキーボードをたたいて、その単語長をとればよいのである。アルファベット26字とスペースの合計27字をランダムに打つとすると、アルファベットがn字続く(スペースがn+1字目に初めて出現する)確率は、(26/27)n×1/27(*)という指数分布になる。一般に指数分布は、ベキ分布に変換できる(cf. Li)。つまりベキ分布は「複雑性の法則」ではなく、単なる「変換の法則」なのである。

(*)コメントで指摘を受けて修正した。

追記:変数の「変換」というのはちょっとわかりにくいが、この場合は単語長を頻度のランクに変換すること(Mitzenmacher: pp.238-9)。