日本語トップ> 解説記事>
  「ランダムウォークとくりこみ群」>
 「統計と確率の基礎」>
日本語トップ> 講義> 確率的順位付け,集中講義>   数理統計学,集中講義>

「Amazonランキングの謎を解く−確率的な順位付けが教える売上の構造」化学同人,2011年5月刊行 1,700円+税 服部哲弥


「Amazonランキングの謎を解く−確率的な順位付けが教える売上の構造」服部哲弥著
「Amazonランキングの謎を解く−確率的な順位付けが教える売上の構造」 服部哲弥 著,化学同人, DOJIN選書 039, 2011.5,1700円+税,B6,224頁, ISBN 978-4-7598-1339-5

5年の歳月をかけた研究の成果を2千円でおつりの来る値段でお手元に
「確率的な順位付けが教える売上の構造」補足と訂正 (update 2011/06/15)

【ページ内リンク】

  1. この辺り(ページ初めの表題,訂正,目次)

  2. 記録と雑記

  3. 背景研究の紹介

【ネット注文用リンク】
7&Y    紀伊國屋    Amazon    bk1    楽天ブックス    e-hon    boople    本やタウン   

丸善&ジュンク堂

【書評】 2011年6月上旬,店頭やネットに並び始めて1週間ほどで,早々に読み終えて くださって,ネット上で書いてくださった初期の書評や感想. 買ったけどまだ読んでないかた,ご購入を検討してくださっている方は, 参考にしていただければさいわいです.

ツイッターは文字数が足りないのでまとまった書評や感想は ほとんどありませんが, @takahashim (高橋征義) さんが,連投してくださいました. 早々に読んでくださった上に,ていねいで高い評価,どうもありがとうございました!

2011年6月下旬には, 独自の視点でじっくり読んでくださった方々のメッセージも見え始めました. 特に「プロ」の方々がご購入を検討される場合のご参考に.

マーケティングのご専門のかたからも,ご自身の研究に関連させて 紹介していただきました.たいへんありがたいことです.

ツイッター経由で見つけ損なっていた早期のブログを2011年6月下旬に見つけたので, 2点追加します.



【本書の紹介】  確率的な順位付けの,もっとも簡単な数理モデルについて 2006年末頃から続けている研究を,縦書きの本にしました. 本にしてくださった化学同人さんは, ビジネス上の判断を支援するビジネス書として売り込んでくださる様子ですが, 著者は,地味な数学の一つの成果を 小説または随筆風に読んでいただくことを期待して書きました.

以上を堅苦しく言い換えると, 先頭に跳ぶ規則の流体力学的極限についての縦書きの本と, ロングテールビジネスの採算性判断を公開情報から求めるビジネス支援書との, 緊張関係が本書の成り立ちです.

数学が現実について教えてくれる,ということと,しかし限られた情報から 数学の助けを借りて答えを知るのだから数学部分はやさしい話とはいかない, ということの調和に著者は苦労しました. (読みやすさの調和だけでない独特の苦労がありますが,それは伏せます.) 編集の津留貴彰さんも苦労されたものと思います. DOJIN選書のシリーズの中に収まることを祈ってます.

背景となる研究については, 数学(確率論)から統計学(データへの当てはめ)を経て現実社会まで, (隠れテーマとして,順位とは何かという哲学的なことまで,) 細い線を一本引いたつもりです.数学に近い側はすっきりした舗装道路に 近づいていますが,先のほうは点線になっています. ただ,線はまっすぐ引けた,と思います. それぞれの分野を志す方々が深いことを見つけてくだされば,とひそかに願います.

あと,このウェブページの下記の記事では紹介し損ねましたが, 某巨大掲示板のまじめな分析も直接関わっていて, 本書で紹介しています.

【出版社が用意してくださった概要:あちこちでお目にかかる文面と思いますが, 著者は一切関与していませんので,力点の置き方が全く違います. その緊張関係をお楽しみください!】  インターネット時代における、ロングテール・ビジネスモデルの先駆けとされる Amazon。本書では、そこに公開されている書籍ランキングの順位変動の動きに注目。 古くから知られていた「先頭に跳ぶ規則」を、時々刻々変化する巨大な数値変動に あてはめて追いかけると何が見えてくるか。確率論などの数学を駆使した分析に よって、ロングテールからの売上への貢献度合いや、昼夜における人びとの ネット活動の様子を大胆に予測し、限られたデータだけから現実の社会現象を 鮮やかに照らし出す。



5年の歳月をかけた研究の成果と,ひそかにちりばめたエピソードを, 2千円でおつりの来る値段でお手元に.


主要な結論をデータ解析とシミュレーションで検証されたかたから,ツイッターで 「@tetshattori Amazonランキング本に書いてある通りやってみたブログ記事が人気に。」との連絡をいただきました. ブログ記事はこちら です.ご本人の著書 (内容の関係上,こちらのページにて引用します) のAmazonランキングの変化を1ヶ月追いかけて拙著に紹介した時間変化の公式に 当てはめ,もう一つ,シミュレーションも公開しています.

これまでも含めて,いろいろな方々に内容を理解していただいて 先に進んで下さってることを知ると,本を書いて良かったと思います.


Amazonランキングの実際のアルゴリズムに興味の中心があるかたは 「Amazonランキングの謎を解く」や このページのずっと下のほう背景研究の紹介 (つまり,本来のこのページの出自)の説明に驚く(有り体に言うと, 『その説明,おかしいだろ』と思う)ことを知りました.

実際のアルゴリズムはもちろん興味もあるしこの研究にとっても意味がありますが, 私の本書や下記の説明は,ぶっちゃけ,『Amazonさんが,本書やこの説明を 読んで,意地悪をしてわざと外すようにアルゴリズムを変えたとしても どうしても成り立ってしまう,数学的事実は何か』に興味があり, 現在のAmazonアルゴリズムが何であるか,については,意識的に見ないように しています.

そういう立場(強調点)の違いと,それにもかかわらず共通する認識をツイッター上 で議論して下さるかた(@FoD5さん)が います.まとめ(togetter)はこちら. @FoD5さん,ならびに,あいだを取り持って下さった @j8takagi さん, どうもありがとうございました!

もちろん,同じ一つの現象を見ているので, アルゴリズムを推測する立場と本やここでの説明と 共通する結論は多数です. というよりも,その共通基礎が全ての出発点です. 上記まとめを ご覧頂いて,その辺りの,『いろんな視点で理屈を考えることのおもしろさ』も 見て頂ければさいわいです.


週刊東洋経済12月1日号表紙 週刊東洋経済12月1日号に 「Amazonランキングの謎を解く」を紹介していただきました!

週刊東洋経済12月1日号は,通販サイトAmazon.co.jpの特集号で, 特集の最後のほう,せどり(中古本業者)の記事の直前に, ランキングの仕組みについての短めの記事があります.

週間東洋経済副編集長の大野和幸さんが, 多忙なお仕事の間を縫って,取材においでにくださいました. たいへんありがたいことです!



ジュンク堂新宿店は「Amazonランキングの謎を解く」刊行時に大々的に展開して くださったことをこのページの下のほう(2011年6月)に 紹介しましたが,そのジュンク堂新宿店が,2012年3月末をもって閉店するそうです.
ジュンク堂新宿店閉店 統計と確率の基礎 ジュンク堂新宿店閉店 アマゾンランキングの謎を解く
「統計と確率の基礎」(学術図書) 最後まで置いて下さいました! 「ランダムウォークとくりこみ群」(共立出版) 最後まで置いて下さいました!
 
「Amazonランキングの謎を解く」は売り切れていました!
 
ジュンク堂新宿店閉店 人文書担当
人文書担当は閉店を祭りにすべく思いを表現
ジュンク堂新宿店閉店 社会書担当
社会科学書担当も閉店を祭りにすべく思いを表現
ジュンク堂新宿店閉店 児童書担当
児童書担当は閉店を期に著者への気持ちを表現
ジュンク堂新宿店閉店 自然書担当
自然科学書担当は常にその時売ってる本が本当に売りたかった本


数学セミナー 2012年3月号に解説記事「確率的順位付け」を 掲載させていただきました.


MONOQLO 2011年11月号表紙 自分たちでテストして評価することがコンセプトの商品情報誌 MONOQLO 2011年11月号(9月19日発行,コンビニ・書店にて発売)に 「Amazonランキングの謎を解く」を紹介していただきました!

11月号は,通販サイトAmazon.co.jpの入門ガイドの特集号で, その中に,見開き2ページで「続アマゾンランキング仕組み検証」 という記事があります. 1年半前のNONOQLOで一度アマゾンランキングに挑戦したそうですが, 根強い興味があるらしく,さらに詳しい検証を行った記事です.

2011年5月刊行の拙著「Amazonランキングの謎を解く」の関わりは, 同書の内容に基づいて前回のMONOQLOの結論を補足した上で 今回のMONOQLO 11月号の出発点とする,という関係にあります. 出版社(晋遊舎) 編集部の澤原昇さんが, 多忙なお仕事の間を縫ってお盆開け早々に,取材にみえました.

私の研究は,『見通しの良い数学的原理と数学的議論の展開』の視点に重点があって, 実用上は,ランキングで 10万位単位という,ロングテール側(よく言えば,大多数を占める普通の本, 実も蓋も無く言い換えれば,売れない本)のランキングの謎を解きました. これに対して澤原さんは,もう少し上位, 2千位前後のランキングがどのように実現するかを, 実際にMONOQLOのバックナンバーを購入する実験によって検討しています.

10万位以降は私の研究で単純な数学的原理が有効なこととその理由を示しました. 他方, いわゆるベスト10はAmazonに見に行かなくても世間の評判でわかります. 中間の数百位から数万位の間がAmazonランキングの中ではいちばん興味深い わけですが,変化の要因が複雑な順位領域でもあります. そこに切り込んだ研究というわけです. (1時間に1冊売れないと実現しない2千位前後の様子は スポンサーのいないサラリーマン研究者には実験しづらいものです. 公的な研究費は使途のチェックがうるさくて, 同じ本を何冊も買うのは騒ぎを起こす….)

ご自身で企画・立案された実験と思いますが,興味深い結論を得ています. さすが,MONOQLO編集の職を自ら選んだ気鋭の編集者です. 実験結果は販売開始した MONOQLO 11月号をどうぞ! (ちなみに,澤原さん ツイッターのアイコンの印象よりもさらにお若い,意欲あふれる青年です.)


三田評論2011年8・9月合併号表紙 三田評論 No.1148(2011年8・9月合併号)の「執筆ノート」に 「Amazonランキングの謎を解く」の紹介を載せていただきました. この号が購読者に届いたと思われる 7月末から8月初めの週末,Amazon書店で前後の期間に比べて 2倍の(時間あたりの)注文がありました. この時期「三田評論」以外にこれだけ顕著な注文増の原因が見あたらないので, 「三田評論」の効果かと憶測しています.さすが慶應義塾. (ただし,効果がとても限定的なので,著者としては少し残念.)

「執筆ノート」の執筆には池田年穂先生にたいへんお世話になりました. 移民文学などのご研究で,その方面の多数の洋書を翻訳しておられます. 私と全く違う分野(!)の研究者なので,興味深いお話をいろいろ聞かせて いただいています. 三田評論は1頁の短い文なので,池田先生への謝辞を入れる余裕がありませんでした. ここに謝意を表しておきたいと思います.


8月に入って,新たな詳しい書評をいただきました. 腎臓がご専門のお医者さまとお見受けしました.

興味を持ってくださったこと,ならびに詳しい推薦,どうもありがとうございました! ご自身の著書のランキングが気になるようですが,ご安心ください. このようなこと(在庫切れとランキングの3-4桁間の乱高下)は 一定の評判のある新刊書で起きています.

数理モデルともアマゾン書店とも関係ない「社会的事情」によるもので, この期間のランキングは残念ながら実際の売上を反映しません. (研究成果を「Amazonランキングの謎を解く」に著して以来, いろんな話を小耳に挟むようになり, おかげさまで好評(★著者本人比)の「Amazonランキングの謎を解く」 自体のランキングの動きと合わせることで, 本には書けないことも勉強するようになりました.) 在庫切れは,出版社や取次が対応次第,解消しますが, この順位帯のランキングが実売上を反映しないことは, ロングテールの利益が薄いことが遠因となる「難病」なので, 著者の方々には,アマゾン以外の書店にも潜在的読者を誘導していただいて, 透析のように息長く考えて売っていただくのが唯一の解決策と思います.


化学同人本社 京都来ました (集中講義「確率的順位付け」於京都大学理学部)

京都と言えば株式会社化学同人. (注:祇園祭が終わった直後の週です.)

京都駅から大学への,行きがけのあわただしい中でしたが, 「Amazonランキングの謎を解く」を担当してくださった編集部の津留さんと, 東京の営業を担当されている吉原さんにお会いできました. (予告無く押しかけてお騒がせしました!)

ちなみに東京都文京区について,本郷と言えば 学術図書出版社, そして,茗荷谷と言えば 共立出版株式会社

 

京都大学生協,数学書コーナーに「Amazonランキングの謎を解く」が14冊平積み! さすが京都大学 m(_ _)m (集中講義では本に書かなかったこと・書けなかったこと を中心にお話ししましたので,「Amazonランキングの謎を解く」を合わせて お読みいただければなお興味が増すかと思います.宜しくごひいきのほどを.)

 

京都では大勢のかたの聴講,どうもありがとうございました. また,研究者の方々には毎日入れ替わり議論と雑談にお付き合いいただきました. たいへんな歓待.さすが京都,どうもありがとうございました m(_ _)m .


(2011年7月下旬)

6月上旬6月中旬に 書いたように,横浜駅周辺の大きめの書店も, 東京にやや遅れながらも大きく展開してくださっていて, その後毎週順調に売れている様子でしたが, 1ヶ月以上を経て現在も順調にお買い求めいただいているようです.

有隣堂(駅ビルLumine6階,西口Diamond地下街)は順調に減らしていたので, そのままDojin選書シリーズの1冊体制に移行するのかな,と思っていたら, 7月半ばにLUMINE店にて平積みを復活してくださいました! (7月下旬追記:集中講義で京都に行っていた間に平積み分が消えていました! 売れたならすごいけど!?Dojin選書シリーズの棚にはしっかりあります.)

そごう7階紀伊國屋は入口真正面ベストセラー・話題書コーナーを含めて大々的に 置いてくださっていて,やはり順調に売れていましたが, さらに10冊ほど増やしてくださいました! 両店とも夏休みを意識してくださってのことか,売れ行き好調と見てくださったか, ありがたいことです.着実にお買い求めいただいている模様.

他の店舗も引き続き置いてくださっています. そごうと横浜駅の間にある東口地下街にある丸善は, 文庫・漫画・ベストセラー中心の 書店になっていますが,なんと,入口から一番遠い所,経営書の棚にひっそり 置いてありました! 駅から少し南西,ダイエーの上にあるあおい書店はDojin選書シリーズの1冊として 置いてくださっているので長くそのままかと思います. (以上2011年7月中旬) (7月下旬追記:丸善のひっそり置いてあった1冊が消えていました. 売れたならすごいけど!?)


@j8takagiさんが, アマゾンのランキングの時間変化を自動取得し自動グラフ化するプログラムを 作成・公開してくださいました: 

『Amazonランキングの謎を解く』、すごく面白いです。触発されて私もグラフを作ってみました。データはRuby+Amazon APIで自動取得、グラフはRで作成しています。

とのことで,グラフの例はこちら(「Amazonランキングの謎を解く」のグラフは上下逆で,下ほど「上位」なことにご注意!).プログラムとその解説はこちら. (2011年6月下旬)

(2011年7月下旬追記:)グラフの上下を逆にできるようにしてくださいました!下のほうが好順位 になるのが私の本と同じ方向です. 上のほうが好順位なのが世間一般のグラフの書き方. 天地逆にするだけでずいぶん印象が変わるのが興味深いです.


ネット上では私の本の分野を越えて,異なる立場からの研究と関連させた 書評・感想も見え始めました.

そして,@makmiz さんの主張(上記最後の引用)について, アマゾン書店だけではなくて,町なか実在の大型書店も (多数の本を置くことのコストにもかかわらず)アマゾン書店と同等以上に 健闘していることを拙著の最後のほうで,データに基づいて示唆しました. (2011年6月下旬)


神保町三省堂では5月下旬から6月上旬, 5階(自然)で売上2位だったそうですが, 東京八重洲ブックセンターも6月12日の週,3階(自然)で 「Amazonランキングの謎を解く」の売上15位となったようです ( 一覧表のpdf). 早くから大展開してくださった店の一つなので,何とかこけなかったようで, 少しほっとしました. (2011年6月下旬)


このページの下のほうに(上記にも同じリンク) 同じ早々に読み終えてくださって,ネット上で書いてくださった初期の書評や感想を 紹介しましたが,独自の視点でじっくり読んでくださった方々のメッセージも 見え始めました.以下いずれも,読者向けの参考資料としてよりも,むしろ 著者としての今後の精進の方向の参考になる貴重なご意見・ご連絡として, ありがたくお受けします.

さらにさらに. 安易にツイッター経由でブログを検索していたら, 2011年6月下旬時点で既にかなり取りこぼしがあるらしいことを発見. ブログをされているかたはツイッターも使っていることが多いように思いますが, ツイッターだけで検索すると取りこぼします. Google検索で新たに見つかった最初の2点でご勘弁ください. (2011年6月下旬)


2011年7月の横浜に続く.)

配本即大々的に展開してくださった東京の各書店には 2週間ほど先行されましたが 横浜駅東口 そごう 7階 紀伊國屋 も,大好評 (★著者本人比)に対応して,展開を大きくしてくださいました.
横浜駅東口 そごう 7階 紀伊國屋 入口 ベストセラー棚!
横浜東口 そごう 7階 紀伊國屋

↑ ついに横浜駅でも書店入口ベストセラーコーナーに登場!

→ 数学棚 F07-10前に平積み開始!

↓ 科学一般棚 E07-03 Dojin選書シリーズ前には,6月上旬から平積み!

右下 6月上旬の科学一般棚(再掲)
横浜駅東口 そごう 7階 紀伊國屋 数学棚
横浜駅東口 そごう 7階 紀伊國屋 科学一般棚 Dojin選書列 6月中旬 横浜駅東口 そごう 7階 紀伊國屋 科学一般棚 Dojin選書列 6月上旬
2011年06上旬に書いたように, 横浜駅の有隣堂Lumine駅ビル店,有隣堂Diamond地下街店とも,刊行後すぐ 置いてくれていましたが,毎週順調に売れている様子です(2011年6月中旬).


刊行後2週間目,2011年6月14日頃から約半月, ネット上で話題沸騰(★著者本人比)したため,ネット上で品薄となり, Amazonウェブ書店で「出品者扱い」しか表示されず, Amazon書店で絶版のような扱いになりました. (6月下旬追記:その後手違いのため「約 2週間」と,こっそり書き換えねば ならなくなりました.重ねて申し訳ありません.) 出版社営業部が町なかの書店での大展開に最大限対応した結果, ネット上の急激な需要を支えるだけの出版社在庫を用意できなかったようです. (相場で,買い占めによって急騰した状態….) 増刷次第通常に戻ります.

@TOMOL_さんがツイッター上で6月16日頃の状況を教えてくださいました: 『二子玉川の紀伊國屋で購入できましたが、残り2冊程度だったので市中にも 少なくなってきているのかもしれません。たまたま科学同人の営業さんがいらして 話をしたのですが、ビジネスマンを中心によく売れているとのことでした。』 詳しい情報ありがとうございました!

この間も町なかの書店や, 実店舗書店系の,たとえば 丸善&ジュンク堂 はネット上で注文できます. 出版社も需要の集中に応える増刷を急遽決めてくれました. 今後とも「Amazonランキングの謎を解く」をどうぞごひいきにお願いします. (2011年6月中旬)

(2011年6月下旬追記:) もちろん,大きい書店を中心に町なかの書店では 大々的に展開してくださっています. (下記横浜東京1東京2など参照.)

実在の書店の展開を手厚くした結果なので, 出版社に頒布を委託している著者としてはつらいところですが, 出版社営業部の在庫管理判断に甘さがあった可能性は高いと思います.

応援してくださる方々にご迷惑をおかけして申し訳ありません. また,一部ツイートから,心配してくださっている方々がおいでと感じましたが, Amazon書店上での出鼻をくじくかのような長期品切れは 同書店が拙著を握りつぶしているのではないことは強調します.

そうだったらもっとおもしろかったけど.

各位にご迷惑をおかけしました. 増刷され次第,あらためてよろしくお願い申し上げます.

町なかではしっかり置いてくれています. @1738310 さんからは,リブロ池袋店, @higuchill さんからは,紀伊國屋流山おおたかの森店, @SASAKIMasatoHKD さんからは,函館市中央図書館と同千歳図書室, の情報をいただきました.

この機会に,ネットではなく町なかの書店もご覧いただいて, 地味で古いが手堅く伝統的な仕組みに 新しい可能性を見いだしていただければさいわいです. (以上,2011年6月下旬追記)

(2011年6月末追記:) 増刷できたそうです. 2週間ほど在庫切れになっていましたAmazon書店ですが,在庫が復活しました. 引き続きどうぞよろしくお願い申し上げます.


早々に読み終えてくださって,ネット上(ブログ)で まとまった書評や感想を書いてくださった方々がいます. (見つけることができたものだけですみません.) 買ったけどまだ読んでないかた,ご購入を検討してくださっている方は, 参考にしていただければさいわいです.

ツイッターは文字数が足りないのでまとまった書評や感想は ほとんどありませんが, @takahashim (高橋征義) さんが,連投してくださいました. 早々に読んでくださってどうもありがとうございました! (2011年6月上旬)


7月19日-22日の京都大学での集中講義の間にある談話会の場所が こちらに 発表になっています. (2011年6月上旬)


2011年6月中旬の横浜に続く.)

東京のスピードにはワンテンポ遅れていますが, 横浜駅の大きい書店も「Amazonランキングの謎を解く」を 置いてくれるようになりました. (2011年6月上旬)

y横浜駅駅ビルLumine 有隣堂 理学書棚 横浜駅駅ビルLumine 有隣堂 理学書/科学・環境棚 Dojin選書シリーズ列
↑ 横浜駅駅ビルLumine 有隣堂 理学書棚C 平積み. 最初の1週間で1部売れた?

右上 Lumine有隣堂は 理学書の中の科学・環境棚C-10-4 にDojin選書シリーズ.

→ 横浜東口 そごう 7階 紀伊國屋 科学一般棚E07-03 にDojin選書シリーズ.

↓ 横浜西口 Diamond地下街 有隣堂 一番奥の 理学書区画の 科学一般 新書棚J-70-2 にDojin選書シリーズ.最初の1週間で2部売れた?

右下 横浜西口 南西に少し歩いたところにダイエーがあり,その別館 6階 にあおい書店. 科学棚U110 にDojin選書シリーズ.その1冊としてひっそり.
横浜駅東口 そごう 7階 紀伊國屋 科学一般棚 Dojin選書列
横浜駅西口 Diamond地下街 理学書/科学一般新書棚 Dojin選書列 横浜駅西口 Diamond地下街 理学書/科学一般新書棚 Dojin選書列


東京の大きい書店といえども,大々的な展開を してくださるのはせいぜい最初の1週間と見て,急遽,短い時間でたくさん 回れそうな,渋谷・新宿・池袋・神保町・お茶の水・秋葉原を偵察.

以下,個人的記録,ご容赦. (2011年6月上旬)


渋谷
渋谷岡本太郎の壁画 鯨を曳航する捕鯨船を鯨に凧揚げされる少女に変形してまでエスカレータに合わせることを優先するタイプの作品が騒動に? 渋谷文化村通り
渋谷駅京王井の頭線への連絡通路. エスカレータ脇の空いた長方形部分に加えた落書きパネルで 有名になった岡本太郎原作の『明日への神話』. 岡本太郎を見ながら駅を降りて北西(ハチ公)側. 109を挟む道路のうち右のほうが文化村通り. かなたに見えるのが丸善&ジュンク堂渋谷店のある東急本店.
渋谷丸善&ジュンク堂 レジ前新刊 渋谷丸善&ジュンク堂 理工書 科学シリーズ
東急本店玄関入って右手のエレベータで上り, 出てすぐのレジ前新刊書コーナー 理工書の 科学シリーズ棚
渋谷丸善&ジュンク堂は「ランダムウォークとくりこみ群」「統計と確率の基礎」を常備 ←おまけ:渋谷丸善&ジュンク堂は,「 ランダムウォークとくりこみ群」(共立出版)と「 統計と確率の基礎」(学術図書)を常備(数学/確率論・統計学 の棚).

さすがジュンク堂の懐の広さは桁違い
Book 1st 渋谷 109向かい B2階入口 Book 1st 渋谷 109向かい マーケティング戦略棚
文化村通りの「付け根」渋谷109近くの地下2階Book 1st渋谷文化村通り店入口 Book 1st渋谷文化村通り店はビジネスのマーケティング戦略棚F7 に面出し
渋谷 東急プラザ 紀伊國屋 数学棚 ←渋谷駅南西(109/ハチ公から井の頭線を挟んで反対側) 東急プラザ紀伊國屋は 数学棚B03-04前に平積み


新宿

下記のうち,ジュンク堂新宿店は建て替えに伴い(その後の再入居の交渉が 整わなかったらしく)2012年3月末に閉店します (このページの上のほう参照).
新宿 三越内 ジュンク堂 新宿ジュンク堂 理学/数学棚
新宿ジュンク堂 確率・統計棚「ランダムウォークとくりこみ群」「統計と確率の基礎」 左上 新宿ジュンク堂は駅の北東徒歩数分,三越の上の階. 手前のTAKA-Qの看板のほうが見つけやすい.

↑ 6階.数学の列に面出し

←おまけ:新宿ジュンク堂は,「 ランダムウォークとくりこみ群」(共立出版) と「統計と確率の基礎」(学術図書)を常備 さすがジュンク堂の懐の広さは桁違い
新宿ジュンク堂 6階下りエスカレータ真正面 ← 6階,下りエスカレータ真正面の理工話題書コーナーに平積み!

左下 話題書から折れ曲がって,エスカレータ脇の柱を見ると アーマーゾーンと壁にテープで. その前に強烈に平積み! 5月のうちにツイッターで @yutakashinoさんが教えてくださったのをようやく確認

↓ そして,その隣,エスカレータ横のフェア棚に面出し!

近いうちに三越のビルは取り壊すと聞きました. 見納めに,ぜひ新宿ジュンク堂アーマーゾーンを よろしくお願いします!
新宿ジュンク堂 6階下りエスカレータ近くの柱 新宿ジュンク堂 6階下りエスカレータ横
新宿紀伊國屋はジュンク堂の向かい 新宿紀伊國屋 1階レジ横新刊書棚
紀伊國屋はジュンク堂の向かい. 「Amazonランキングの謎を解く」の配置では, 紀伊國屋もジュンク堂に負けない 1階,入口から直進通路,レジ横の新刊書棚に2列で平積み!!
新宿紀伊國屋 3階 E13 マーケティング棚 新宿紀伊國屋 1階レジ横新刊書棚
3階 社会,マーケティング 棚E13に面出し! 4階 自然,数学一般 棚F12に平積み (4階は階段脇の数学シリーズにDojin選書があるので, 将来的にはこちらに並ぶか?)
新宿紀伊國屋 4階 E14 統計・確率棚に「統計と確率の基礎」 紀伊國屋 4階 E12 数学シリーズ棚に「ランダムウォークとくりこみ群」
4階には,「統計と確率の基礎」が 統計・確率 棚E14に! 4階には,「ランダムウォークとくりこみ群」を含む, 共立出版「 新しい解析学の流れ」シリーズも 数学シリーズ 棚E12に!!
新宿西口 地下街 スバルビル「新宿の目」 新宿西口 地下街 Book 1st B2F区画G
新宿西口へ移動.都庁方面への地下通路の起点にあるスバルビルの新宿の目 Book 1st は,地下通路右手に.駅から書店の一番遠い側の通路をB2階に降りて, G区画へ.
新宿西口 Book 1st科学シリーズ棚G5 新宿西口 Book 1st科学シリーズ棚G5
Book 1st レジ前 科学シリーズ棚G5 面出し 理学棚G18 2列平積み. 私は新宿に縁が少なくて初めてでしたが,よく知られた書店らしく,twitter上で @hyokoto さんと @Rahatchy さんから早々に連絡を頂きました. @hyokotoによると,取次から本が届いたばかりと思われる5月25日に, 早くも写真の状態で配置が済んでいたそうです. 副都心のスピード感が伝わります.ようやく確認.


池袋
池袋 東口 駅前通り南下 ジュンク堂へ 池袋 ジュンク堂
ジュンク堂は池袋駅東口から駅前の通りを南へ数分 南池袋1丁目交差点左手(東側)にジュンク堂.
池袋 ジュンク堂 1階レジ真正面 新刊話題書 ←  ジュンク堂 1階 レジ真正面 新刊話題書棚 面出し

左下 7階 下りエスカレータ降り口 窓際 科学選書棚 平積み (並んでいるのは,同じDojin選書シリーズで1つ前に出た @takey_yさんの「日常に生かす数学的思考法」)

↓ とどめは,7階 統計学/経済統計棚 面出し

ジュンク堂は池袋も新宿や渋谷と同様に大部で仕入れてくださっています. さすがジュンク堂
池袋 ジュンク堂 7階理系 下りエスカレータ降り口窓際 Dojin選書 池袋 ジュンク堂 7階理系 統計学/経済統計棚
ジュンク堂と同じ南池袋1丁目交差点のJR寄りに 西武のLibro (池袋は前世紀から,東に西武,西に東武,で有名) 池袋 南池袋1丁目交差点から西武 Libroへ
池袋 Libro 2階 数学棚 平積み!

← 西武Libro2階数学棚

(西武Libroの東口から東武旭屋の池袋西口へは, Libro最南端,ジュンク堂と同じ南池袋1丁目交差点近くの通りを東へ, びっくりガード下なる地下道を利用)

Tobu7階旭屋自然科学棚E45 →
池袋 Tobu 7階 旭屋 自然科学棚


神保町
神保町 書泉グランデ 神保町 書泉グランデ 5階 数学コーナー
地下鉄神保町駅から東に最寄りの大書店が書泉グランデ 書泉グランデ 5階階段またはエレベータ出てすぐ左手の数学コーナーの 中央に平積み!
書泉グランデから東に進むと三省堂書店神保町本店 →

↓ 三省堂書店 3階社会 マーケティング棚G22-05 に面出し

右下 三省堂書店 5階理工 なんと,上りエスカレーターを降りたところに 単台平積み!! @kshara2009 さんや @SASAKIMasatoHKDさんがツイートしてくださったのをやっと確認. @kshara2009さんによると,配本が届いただろう翌日5月26日には単台平積み! @SASAKIMasatoHKD さんによると,5月下旬期5階の売り上げ第2位. @kshara2009 さんによると,6月上旬期も第2位. 表示確認し忘れました(泣)

原啓介訳「 世界を変えた手紙」,佐々木将人著「 国際法からはじめよう」もごひいきに!
神保町 三省堂
神保町 三省堂 3階社会 マーケティング棚G22-05 神保町 三省堂 5階理工 上りエスカレーターを降りたところに「Amazonランキングの謎を解く」単台平積み!


お茶の水 丸善
神保町から北に徒歩圏, JR御茶ノ水駅からJRの南に沿って東に進むと右手に丸善. その一番奥のまさに入口新刊書話題書の棚に,なんとなんと, 「Amazonランキングの謎を解く」!!!
お茶の水 丸善 入口新刊書話題書棚に「Amazonランキングの謎を解く」!
お茶の水 丸善 自動ドアの向こうに「Amazonランキングの謎を解く」!
お茶の水 丸善 経営書 新刊・話題書コーナー お茶の水 丸善 確率・統計棚
入口から直進,左手経営書の新刊・話題書コーナーに平積み! そのさらに左手奥,確率・統計棚にひっそりと1冊. 近くに Dojin選書シリーズのある棚もあるがそちらには無い. いずれどちらかが定位置になるのだろう.
書籍検索機の分類名の誤植(確立ではなく確率が正しい) 書籍検索機の分類名の誤植は修正された
おまけ. 某書店の検索機で,確率・統計の棚の表示に誤植発見. レジのお兄様に訂正を進言申し上げましたが, 「理数系書籍おタクがマニアックなことを」と思われただろうなあ (「マニアック」は,「Amazonランキングの謎を解く」のキーワードです!) (2011年7月下旬追記:)2ヶ月ぶりに確認したところ,直っていました. (すぐ対処したということは,5月まで,誰も指摘しなかったか, 誰も確率・統計関係の検索をしなかった,ということ….)


秋葉原 有隣堂
→ JR秋葉原駅の北東(第1象限)にあるヨドバシカメラ 7階に 有隣堂ヨドバシAKIBA店.

↓ 理学/科学棚F-15-05 に面出し(ポップで隠れてしまう…). 書店に並んだ翌日頃,5月27日に @ryuhdoh さんが見つけてくださったのをようやく確認.

右下  @SASAKIMasatoHKDさん曰く 『有隣堂秋葉原店では科学のところに面出しされていました。 (隣の本が「え?」って感じの本だった。)』
秋葉原 有隣堂ヨドバシAKIBA店
秋葉原 有隣堂ヨドバシAKIBA店 理学/科学棚 秋葉原 有隣堂ヨドバシAKIBA店 理学/科学棚 拡大

ツイッターで情報を頂いたのに回りきれなかった東京の大きい書店

(2011年6月上旬)


多くのかたにツイートやリツイートしていただいているということを,全く気づいて いませんでした.既に追い切れません.皆様どうもありがとうございます!!! 刊行前から期待があったことを知らなかったので,なぜ書店で大々的に展開して くださっているのかわからず,見に行って,その壮観に,数行下では,ただ奇跡と 書いていました.しかし,刊行前から期待があったことはもっと奇跡です. (2011年5月下旬)


5月26日(木).大きい書店に並び始めました. 限られた時間で東京駅前の丸善と八重洲ブックセンターを確認.

同人選書シリーズは自然科学の棚ですが,本書は出版社営業がビジネス書として 売り込んでいるらしいので,書店毎に置いてある場所が違うかもしれません. 置き場所見つからなかったら困ると思っていたら…, 生まれて初めて,東京駅の丸善と八重洲ブックセンターという巨大本屋で 店内各所に一斉に配置!

各書店の書店員様,注目してくださってまことにありがとうございます. 1週間もないうちに消えるイベントと思われますので, 以下個人的記念で一挙公開,お許しください

東京駅北西(丸の内出口右手)にある丸善では, 1階(新刊)と3階(自然)に置いてあります. 全力の応援,ありがたいことです.
丸善東京駅oazo 丸善東京駅入口
東京駅丸の内出口.道路を渡って右手oazoと書かれたビルの1階入口から奥への通路
丸善東京駅 新刊1階 左手新刊書の棚の一段を占有!
丸善東京駅 新刊1階「Amazonランキングの謎」ポップ
このポップの立案者,入荷したての本を読破!?と思ったら, 出版社編集部作成とのこと
丸善東京駅 自然科学3階 エスカレータ脇 Polestar 丸善東京駅 自然科学3階 選書部屋I
自然科学(3階)エスカレータ脇「思考への指針」棚 3階 選書の部屋I のDojin選書
丸善東京駅 自然科学3階 ジャンル部屋J 丸善東京駅 自然科学3階 会計前
3階 分類の部屋Jの数学教養棚は平積み(写真は部分映像), 1階と同じ,中身に踏み込んだポップ 3階 レジコーナー前も平積み,こちらのポップは書名だけ(これも出版社供給)

東京駅南東(八重洲口右手)にある八重洲ブックセンターでは, 2階(社会)と3階(自然)両方に置いてあります. どういう興味から探しても何とかなるようにしてくださっていて, ありがたいことです.
八重洲ブックセンター 入口からエスカレータで2階か3階へ
八重洲ブックセンター 社会2階 上りエスカレータ前 新刊コーナー 八重洲ブックセンター 社会2階 エスカレータ脇 フェア棚
2階(社会) 上りエスカレータ前新刊コーナーに 2階 エスカレータ脇のフェアでは棚1段占領!
八重洲ブックセンター 社会2階 エスカレータ脇 フェア棚のポップ 八重洲ブックセンター 社会2階 下りエスカレータ前 新刊コーナー
2階 フェア区画のポップは丸善の3階レジ前と同じ,表題だけのもの とどめは下りエスカレータ前の新刊コーナーの平積み
八重洲ブックセンター 自然3階 数学棚前の平積み 八重洲ブックセンター 自然3階 エスカレータ脇 フェア棚
3階(自然)数学棚前平積み 3階 エスカレータ脇フェアはなんとと棚2段占拠!

東京の大手に比べると横浜の書店は出遅れています.昔から,話題の書でも 横浜は東京に比べて遅れがちなので,これは今に始まったことではありません. それでも,駅ビル(Lumine)の有隣堂の理学書の棚と, 西口ダイアモンド地下街の有隣堂の理工書区画のDojin選書の置いてある棚の 前には,それぞれ「Amazonランキングの謎」が平積み! また,西口から南西方向,ダイエーに隣接したあおい書店は, 専門書の階の科学の棚(U110)にDojin選書のシリーズがあって, 一冊だけですが並んでいます.

一方,オンライン書店のAmazonは,既に在庫切れ!? 大きい書店にしっかり並んだ5月26日(木)に 「取り扱いできません」と表示されました. (出版社営業部が気を遣ってAmazonを表題に入れてあげたのに, そのAmazonに見くびられました.) ぜひ,実際の店頭にもお立ち寄り,お買い求めください. (2011年5月下旬)

(追記) Amazon書店で一時取り扱い停止だった件,半日で在庫ありに復帰.どうやら,憶測どおり発売即売切だった模様.私の本を見くびりましたねアマゾンさん!


信頼できる筋からの情報によると, 5月25日(水)に既に並べてくださった 書店があるそうです.それも棚一段に表紙をずらっとならべる破格の扱い! 「Amazonランキングの謎」に棚一段を比例計算するととてつもなく巨大な書店!? どこだろう…. (2011年5月下旬)


出版社の営業さんが各書店の書店員さん等から良い感触をもらったようです. 東京駅の八重洲ブックセンターではワゴンで置いてくださるという噂も(半信半疑). 図書館に配本する取次でも大口の注文を得るなどあったらしく, 著者比約4倍の初刷り部数,破格(あくまで著者比)です. 好感触は著者として光栄ですが, きっと,強気でないと営業はできない,の実例でしょう. (2011年5月下旬)


スケジュール上は5月末日刊行でしたが,5月第4週に取次の配本が始まり, 早いところでは水曜日,書店に本が届き次第, 多くの大手書店では5月26日(木)には並べてくださるだろうとの観測. 5年の歳月をかけた研究の成果を2千円でおつりの来る値段でお手元に(^^ (2011年5月下旬)


化学同人編集部(Dojin選書シリーズ担当)津留貴彰さんが, 見本本を持ってきてくださいました. 既に化学同人やオンライン書店に貼ってあった写真どおりなので, 新規情報はありませんが,実物を手にすると完成したという印象がはっきりします. (この段落は著者と編集者のためだけの段落.ご容赦.) (2011年5月下旬)


集中講義に伺います (京都大学理学部数学教室 2011年7月19日−22日). 刊行が間に合いました.

提案してくださった京都大学の吉田伸生先生に深く感謝します. (昨年のことでしたが,既に内容の取捨選択の方針が固まっていて, 本書の中で触れることができませんでした.) (2011年5月上旬)


まだ表紙がないうちから,化学同人出版の営業部ほか, 関係各位が迅速に動いてくださったらしく, 先月末からネット書店は予約販売開始してくださっていました. (早々に掲載情報を教えてくださった響由布子さん,ありがとうございました!) (2011年5月上旬)

2011年5月 第2週に表紙完成, 第3週末頃に見本完成, 第4週末頃から店頭に並ぶ模様です. (2011年5月上旬)

ページ始めの目次に戻る



以下は,「Amazonランキングの謎を解く−確率的な順位付けが教える売上の構造」 刊行以前に書いていた本書の一部(背景となる研究)の紹介です.

オンライン ランキングとロングテール,そして無限粒子系 服部哲弥

 あるいは, 

アマゾンの謎順位 − Amazon書店はロングテールに非ず

・ 初掲載 2008/04/13
・ 数学的詳細の別ページ作成 2008/12/15
 −  stochastic ranking processの定義と無限粒子極限 存在定理のページ
 −  極限を記述する偏微分方程式系の時間大局解の存在定理 のページ
・ 追加(先行研究との関連) 2009/08/27
・ データの統計的解析の別ページ作成  − Amazon書店はロングテールビジネスではない! 2009/08/27
 −  Amazon.co.jp実測データの確率ランキング過程の理論的結果への統計的当てはめ
・ Amazon.co.jpランキングについての結論を急いだ別ページ作成 2009/11/24
 −  Amazon.co.jp のランキング − 作家先生のための説明
・ 追加(プロの物理学者,数学者,数理物理学者あてのコメント − Amazon.co.jpランキングの統計力学的普遍性(universality)) 2009/11/28
・ 追加(統計的当てはめによる実質総冊数の推定と実体本屋の挑戦) 2010/12/24

ロングテールという単語は, 聞くことがあっても意味をわかってないビジネス用語の代表格です. (gooリサーチ「実は意味を知らなかったビジネス用語」のアンケートで, 2007年10月 4位,2009年10月 5位.)

確率論は誤解されることの多い数学です. ブログや掲示板で確率を確立と書く人の多いこと(試験の答案も…). テレビ朝日の人気ドラマ「相棒」のSeason 2第6話「殺してくれとアイツは言った」 の終わりに出てくる「DNA鑑定書」に「確立99.9%」と印刷されていました.根深い.

(2011年6月さらに根深い追記!) このページの初めで紹介した 「Amazonランキングの謎を解く」化学同人が刊行された2011年6月某日, ○茶○水の某大手書店M○の検索機で「Amazonランキングの謎を解く」を 検索したところ,なんと,棚の分野名が「確立・統計」.書店の検索機とは, 根深さも極まれり.

無限粒子系という確率モデルでロングテールビジネスの草分けとされる Amazon.co.jpを探ろうというこのページのお話は, 現代的なビジネスの注目話題に高度な数学で切り込むつもりだったのに, そういう次第で,少数民族の言語で地味な話をする,というほうが近そうです.

ロングテール (the long tail) とは, 「売れない商品もとてつもなく多種類集めれば総額は無視できない」 という考え方です.一般化して 「個々の小さな社会的効果も大勢の人が参加すれば大きな社会現象になる」 という心情を含む場合も多いと思いますが,ここでは狭い話に限ります. ビジネスモデルとしては, 「オンラインリテール(ネットの小売業)においてweb pageを『商品陳列棚』と して使うことによって,1商品当たりの品揃えのコストを激減させ, 利益の出る商品の種類を巨大にすることで, ロングテールをビジネスチャンスにする」 ということになります.

ロングテールビジネス型のオンラインリテールの草分けと紹介される ことで有名なインターネット書店Amazon.comの日本版 Amazon.co.jp の「ランキング」という数字の時間変化が話の始まりです. (注:2008年現在,webでランクというと,グーグルのページランクのことと 思いこむ研究者のほうが多いようですが,以下の話は グーグルのページランクとは数学的には無関係です. あくまで日本のアマゾンがランキングと呼ぶ本の順位の話です.)


ご注意: 「数学」という言葉で眠くなるかたへ

このページは,どちらかというと数式を扱う生業の方々(数学者とは限らない) を読者としてイメージしていましたが, ページを始めてから1年半,2009年11月に,Twitterにこのページ を引用してくださったかたがいることをGoogle検索で発見しました.

Amazonのランキングに社会的関心があって,このページまでたどり着いてくださった とは,たいへん嬉しいことです.ただ,つぶやきの内容 『amazonの順位がどうやって決まるのかを考察してる人がいた。 数学の難しい話なんで私はいきなり挫折しました』…数学は少数民族の言語.根深い.

…じゃなくて,興味を持ってくださったのに,挫折させてごめんなさい. 数学は興味ないけどAmazon.co.jp のランキングの決まり方をざっくり知りたい, というかたのためのページを用意しました(ここをクリックしてください).

「数学」という言葉で元気になるかた,このまま続きをどうぞ!

2010年4月追記:研究が徐々にながらも進むにつれて, 内容や別ページが当初よりも若干増えました. 「忙しいのに読んでられね」と思われる向きには, 短くわかりやすくまとめて くださったかたのページをお薦めします.バクフー株式会社の柏野雄太さん, どうもありがとうございました.)

2013年2月追記:Amazonランキングの実際のアルゴリズムに興味の中心があるかた の中に「Amazonランキングの謎を解く」や以下の説明に驚く(有り体に言うと, 『その説明,おかしいだろ』と思う)かたがおいでと知りました. 実際のアルゴリズムはもちろん興味もあるしこの研究にとっても重要ですが, 私の本書や以下の説明は,ぶっちゃけ(わざと極端に書けば), 『Amazonさんが,本書やこの説明を 読んで,意地悪をしてわざと外すようにアルゴリズムを変えたとしても どうしても成り立ってしまう,数学的事実は何か』に興味があります. (正確には何らかの極限で数学的に成り立つ,という理想化を含むので, 現実には「どうしても,おおよそ,成り立ってしまうこと」に興味があります.) 同じ一つの現象を見ているので,もちろん, アルゴリズムを推測するという立場と共通する結論は多数です. 立場(強調点)の違いと,それにもかかわらず共通する認識をツイッター上 で議論して下さるかた(@FoD5さん)が います.まとめ(togetter)はこちら. @FoD5さん,それから,あいだを取り持って 下さった @j8takagiさん, どうもありがとうございました!


amazon.co.jp の本のページ

背景: Amazon.co.jpの本のページと本のランキング

実際にAmazonのwebで本を検索すると,右図のようなページが現れます. (右図は,かなり中略しています.) 右図下のほうを見ると「Amazon.co.jpランキング:本で 384,057位」 とあります.この「ランキング」の何十万位という数字がここでの興味の対象です.

この数字,ヒット商品はともかく, 何十万位にもなるとほとんど誰もまじめに見なかったようで, これまで精密な研究が少なかったようです.

このページを最初に作ったときからさかのぼること1年半,2006年12月13日に 佐藤哲さんの管理する suuri-MLというメーリングリストで,MLの法律顧問どの 佐々木将人さん が,『……どういう計算方法なのかわからないAmazonの謎順位。』([suuri: 178]) と書いていたのが気になって精密な研究を始めました.

ランキングに戻って しばらく見ていると,まず,1時間ごとに数字が更新されること に気づきます. たとえば次のような変化です.
amazon.co.jp の本のランキングの時間変化
この例では1時間に600-700ずつ順位が落ちて(ランキングの数値が増えて)います.

こうした専門書は1軒の書店では数週間から数ヶ月に1冊しか売れないので, この順位降下は,この本が売れていない時間帯のランキングの動きということに なります. この,「1時間に600-700ずつ降下」というランキングの時間変化の 計算を知りたい,というのが元の問題です.

会社が教えてくれればいいのですが, 商売上つきあいが深いはずの出版社に対してさえ売り上げ明細を 教えないそうです. あるUSAの計量経済学の学術論文は 「インターネット小売り業者は個別の売り上げデータを ちっとも提供してくれない」と書いています . 無機的な数字を扱うお堅い学術論文にここまで書かれるとは よほどのことがあったのだろうか,と憶測したくなるほどの書かれようです. オンラインリテールは経済的効果が高い,と分析する論文なので, 無料宣伝になるから,普通は協力しそうなものです. それはともかく, 順位降下のアルゴリズムは自分で見つけるしかありません.


現象: ランキングの時間発展

数週間から数ヶ月に1冊しか売れないような本を1冊選んで Amazon.co.jpでそのランキングを 1年間しつこく観察し続けると,次図のような, 思いの外ワイルドな動きが見られます.
webランキングの時間変化の概念図 注意:  図は実際の観測を背景にして作りましたが,あくまで単純化した模式図です. しかし,数字は(おおざっぱですが)誇張はありません.

観測可能なのは1時間に1点ずつですが,1年分なので つながった線に見えます.縦軸は, 上のほうがランキング数値大(順位は下位)です. 最初に例に挙げた37万何千位はこの図の中ほどやや上になります.

問題は「ランキングをどう定義したらこの曲線のようになるか?」です.


数学モデル: 確率的ランキング過程 (Stochastic ranking process)

ブロードバンドご利用のかたは,百聞は一見にしかず,
動画 (500KB, 30秒, wmv file)
をご覧ください.

要点は,

ということです.自分より下位の本が売れたときだけ順位が変化するので, 注目している本が売れていない間の順位降下は上位にいるとき早く, 下位に行くほど遅くなります.それが帆船(上に凸)の形の説明.

解: 無限粒子極限と蒸発で動く1次元流体

モデルを作っても,それ自体が難しすぎては,そこからまた一苦労となります. さいわい,このモデルは N が大きいときの様子がわかります (無限粒子極限). Amazon では N は 1000000 (百万)単位の話なので, Nが大きいときの結果はそのまま利用できます.

ブロードバンドご利用のかたは,再び百聞は一見にしかず, 今度は先ほどの4倍のファイルサイズ(3倍の再生時間)で申し訳ありませんが,
動画 (2MB, 1分30秒, wmv file)
をご覧ください.

数学: モデルの内容に関心のあるかたへ,および,数式のほうが理解しやすいかたへ

数学的なことを少し書かせていただくと, 単に無限粒子極限が数学的に存在することがわかるだけでなく, その振る舞いもあらわにわかります. 無限粒子極限は,蒸発を動因とする1次元非圧縮性混合流体の 偏微分方程式系に従うことから, 解があらわに求まることも納得できます. (そのようにして解を試行錯誤で発見し, あらわな表式に基づいて無限粒子極限の存在を証明しました.)

確率論のプロのかたに「これ,マルコフ過程ですね」, 微分方程式のプロのかたに 「こんなところにこの偏微分方程式が出てくるとは思わなかった」, あらゆる分野のかたに 「数学的基礎から社会的応用まで目を配っている」, と言っていただけると嬉しいです.

統計学的解析: Amazon.co.jpはロングテールではない!

上で紹介した, ウェブ時代のロングテール型商売の草分けとして知られるアマゾン書店の日本版 であるAmazon.co.jpのランキングという現実のインターネット商売の話と, 確率的ランキング過程という数学的モデルの話を具体的に結びつけます. モデルの解析結果と実際のランキングのデータをつきあわせると, 驚くことに,こんな簡単な数学模型が現実のデータとけっこう良く合います. しかも,合っているということから,数学的内容を通して, ある経済学的・社会学的現実が見えてきます.

下図の黒丸は Amazon.co.jp で某書籍のランキングの時間変化を 実測して得たデータ,77個の値です.横軸は時間,縦軸はランキングの数値. 重ねて実線で描いてある曲線は確率的ランキング過程の理論的結果. 両者が似通っている,というところが重要です. 社会現象のような複雑な対象が,単純な数学モデルのあらわな数式の予想と 似通うことはなかなか期待できません.物理現象のような「数式向き」の 現象でさえ,現実に実験すると(雑音と一括して呼ばれる)大きな影響が 加わって合わないのが普通です.高くつく実験装置の話題が新聞に出る こともありますが,実験条件を整え,理論式を複雑にして,やっと合うのが 普通です.対象についてのもっとも単純な数学モデルで ここまで合うのは研究としてはたいへん良い兆候です.

Amazon.co.jpランキングの時間変化の実測データと,確率的ランキング過程から得られる理論曲線の比較

上図の技術的詳細と統計的当てはめに関する説明は, 別ページを参照してください

左図の曲線(黒丸の実測データに理論的帰結を当てはめた結果)が Amazon.co.jpについて示す結論を要約します. 統計的解析の結果, ウェブ時代のロングテールビジネスの草分けとして宣伝されてきた Amazon書店は(少なくともその日本版Amazon.co.jpは),宣伝に偽りありで, 普通の町の書店と同じく,少数のベストセラーが支える本屋であることが わかりました.


統計学的解析(付録): 実質総冊数の推定と実体本屋の挑戦

ロングテールの総売上への寄与を決める指数の値は,やや専門的なので, 上記リンク先のページに譲ります. この統計的当てはめでは,Amazon書店の和書の実質的な総冊数も算出 しています.Amazon書店の検索機能からは250万部ほどの和書を カタログとして持っていることになっていますが, 実際には下位の書籍は注文しても待たされたあげく入手不可能という返事を もらうことになります.これに対して,ランキングデータの数学に基づく 理論式への当てはめでは,実際に「生きている」冊数が統計的に推測できます. 結果は,2007年頃は約80万点,2008年は約90万点,2009年は約95万点です. (今のところ毎年の新規刊行分をそのままカタログとして追加していることが 伺えます.)

これに対して,2010年12月23日に開店した MARUZEN&ジュンク堂書店梅田店 は在庫200万冊を謳っています.ベストセラーは重複して持っているだろう ことを割り引いても,手持ちのタイトル数はAmazon書店に匹敵する(もしかしたら 勝っている)可能性があります.「電子書棚」とでも言うべき,本を置く スペースの土地代等を浮かせることでコストを削減し,それによってロングテール の多数の本を売ることができるとされたネット書店でしたが, もしMARUZEN&ジュンク堂書店梅田店が商売として生き残るならば, 実在書店あなどるべからず


プロの物理学者,数学者,数理物理学者あてのコメント − Amazon.co.jpランキングの統計力学的普遍性(universality)

「1位に飛ぶなんて単純なアルゴリズムを採っているはずが無い」という 懐疑の声が初期の講演会場や論文のレフェリーで毎度のように聞かれました. しかし,下図1年に及ぶ長いデータ(手で採ったものの累積)をお見せすれば, さすがに文句はないでしょう(点が実測値,曲線は上記の統計的当てはめによる パラメータを用いた理論曲線).
Amazon.co.jpランキングの時間変化の約1年の実測データと,確率的ランキング過程から得られる理論曲線
たしかに,数ヶ月に1度しか売れない本が本当のランキング1位の表示を勝ち取る ことはありません.1万位前後が精一杯です. でも,統計力学をご存じのかたならば,上図で縦軸がN=100万のオーダーなので, 先ずは1万位を1位と近似するのが現象の正しい理解のしかただ, ということに異論はないはずです.

ここを納得してくださったかたからは,次に, 「買うたびに(近似的に)1位に飛ぶとしても,途中の順位変動はAmazonがもっと 細かい計算をしているのではないか?」 という質問が出ます.これは正当な質問です. 残念ながら,Amazon.co.jpの更新は1時間に1回と,離散化されているので, 1万位より上位の順位変動の研究は絶望的に難しいです. 10位以内の本の様子を予備研究的にながめると, 細かい計算をしている可能性は高いと思います.

ところが, Amazonの実際の順位計算アルゴリズムにほぼ無関係に, 低順位側では上で紹介したいちばん単純なモデルと一致する という統計力学における普遍性(universality)が成り立ちます. このことを説明するのに,まず,Amazonの順位が累積売り上げ順ではありえない ことに注意してください.実際,そうだとすると聖書が1位,という冗談を 考えれば明らかです.「最近の売れ行き」で順位を決めたい, というのがAmazonの意図であるのは決まっています. 膨大な書籍点数に順位を付けるから無用に複雑なことはできません(計算が 間に合いません).素直に考えれば,たとえば過去24時間の売り上げは重み1, その前の1日の売り上げは重み0.8,その前は0.64,といった重み付きの和を とって,その大小で順位を付けるでしょう.でも,1日に1冊も売れない, 10万位代以降の本にとってその順位は結局直近の売り上げ時刻が近い順に なります.

以上の思考実験から,上に述べた普遍性(universality)が成り立つことが わかります.

ところで,みなさん統計力学をやるときはO(N)の現象,すなわち,典型的な サンプル(configuration)に興味を持ちますが,なぜかランキングになると, 上位100位とかばかりを議論します. アマゾンランキングにおける熱力学極限とは (そう呼べるものがあるとすれば) 100万に比べて無視できない順位の現象,言い換えると,ほとんどの本の現象, もっとはっきり言えば,年に数冊しか売れない(long tailの)本のことです. 上記の,簡単なモデルで記述できる順位変化こそ,統計力学を知っている研究者が 最初に目を付けるべき性質であるべきで, ここで紹介している研究は,そういう意味で全く筋の通ったものであることを ぜひ納得していただきたく,よろしくお願いします.

そこのところを納得していただいた上で,あくまでお遊びで, 上記の統計学的解析を,上位のランキングに無茶を承知で外挿した結果 をこっそりお教えします.当たるも八卦,当たらぬも八卦. 安定的に10位をキープしている本は数秒(5秒以内とか)に1冊, 100位なら約1分に1冊,1000位なら20分に1冊, くらい売れているという数字を得ました. 当然,数点のところでは統計学的解析は無効ですから, トップスリーの売れ行きを,1時間毎にしか更新しない,相対評価の数値 (ランキング)から知ることは原理的に不可能です.


先行研究: Move-to-front規則,LRU (Least-recently-used)キャッシング

ここで,関連する先行研究について言及します. ここまで確率ランキング過程と呼んできた数学モデルは, 20世紀半ば過ぎには既に知られていました. 最初に文献に登場するのは1963年
M.L.Tsetlin, Finite automata and models of simple forms of behaviour, Russian Math. Surv. 18(4) (1963) 1-27.
(ジャンプ時刻を無視して順位の変化のみに注目すれば有限マルコフ連鎖なので) 定常分布が存在しますが,その具体形があらわにわかります. Tsetlinは,本を机に積み上げる(そして必要になるたびに山の途中から見つけ出し, 使い終わったら山の一番上にポンッと返す)という書斎の使い方は, 『定常分布に達するから(よく使う本は山の上の方にいやすくて取り出しやすい 可能性が高いことに注意すると),整理された状態であり,机の上を片付けるなんて よけいなことはしないでほしい』という趣旨がにじむコメントをさりげなく論文に 付け加えています.

Testlinはある種のオートマトンの簡単な例として挙げたためか,10年くらい 気づかれなかったようです.その間,
J.McCabe, On serial files with relocatable records, Oper. Res. 13 (1965) 609-618,
W.J.Hendricks, The stationary distribution of an interesting Markov chains, J. Appl. Probab. 9 (1972) 231-233,
の2本の論文がどちらも先行研究に気づかず,同じモデルを引用無しで調べています.

Hendricks以降はモデルが広まったようで, 引用がさかのぼってなされるようになり, move-to-front(先頭に持ってくる)規則という名前も付き, 研究の流行期に入りました. 右図は,move-to-frontをキーワードにして検索した文献やその引用のうち 関係あるかもしれないと考えて手元に記録した文献の本数を出版年代別に 4年ごとに区分した度数分布です.個人的に集めたものなので, 数には深い意味は全くありませんが,1960年代の2本の論文の後, 1970年代に最初の小さな流行,そして1980年代に始まり2010年頃に終わるだろう 大きな流行があることが読み取れます. 一つのテーマの研究の盛衰の様子が見えておもしろいかもしれません.

Move-to-front規則関連論文出版量

私がこの研究を始めたとき, 思いついた数学モデルがたいへん単純なものだったので, 先行研究はあるはずだと思いましたが, 正しいキーワードがわからなかったため見つけられず, 最初のうち論文で引用し損ないました.後に,杉峰伸明さんから, 『(私の講演を聴いた)誰かが,move-to-front ruleというモデルだ,と言っていた』 と教えてくれて,あわてて検索して見出した論文の山が上の図,という次第. (どなたか知りませんが,直接講演でコメントしてくれればよかったのに…. 杉峰さん,その節はどうもありがとうございました.)

さいわい,我々の論文の根幹,

  1. 無限粒子極限,
  2. 極限分布を記述する非線形偏微分方程式(流体力学極限),
  3. ウェブランキングのモデルとしての指摘,データの統計的当てはめと 経済学的帰結,
のいずれも先行研究に無く,すべて生き残りました.

膨大な先行研究を調べてみると,最初の3論文が調べたこと,すなわち, 定常分布の存在とその具体形,および,コンピュータサイエンス(データ探索) への応用,を中心に発展してきたことがわかります.

Move-to-front規則において,粒子の列をデータの列(記憶装置に順に並んでいる 状況などをイメージ)と見て,先頭へのジャンプを,データが使用するために 呼び出されたと見ることで,least-recently-used (LRU)キャッシングという データ配列方式の研究に結びつけています. キャッシングとは早い(けど高い)記憶素子(キャッシュメモリ)を少し用意して, 頻繁に使うと期待されるデータは通常の記憶素子ではなく,キャッシュメモリに 置いておくことで,平均的なデータアクセス速度を速くする技術です. LRUキャッシングとは,『最近使ったデータが使われる可能性が高い』という 単純なアルゴリズムです.キャッシュメモリがいっぱいになった状態から, 次にキャッシュに入っていなかったデータを呼び出したとき,そのデータを キャッシュに置きますが,その代わりに追い出すデータとして, 『使われたのがいちばん遠い過去のデータ(least-recently-used)』 を選びます. 使った順に先頭に持ってきて一列に並べることになるので, move-to-front規則と同値になります. 全体の中の一定の割合がキャッシュに残るので, 見つかったデータが全体の中でどの位置にいるかで, 呼び出すのに要する時間(探索コスト)が決まることになり, それをmove-to-front規則から算出する,というのがこれらの流行した先行研究の 基本的なアイデアです.

データサイズが大きい場合に興味を持つのは自然なので, そのような研究も試みられていましたが, 極限が偏微分方程式で表される,という流体力学極限の考え方に 至った先行研究はありませんでした. また,ウェブのランキングもウェブが安価な宣伝手段として広まったのが 21世紀近くになってから,ということもあったのか, 我々が応用するまで研究が無かったようです.

我々は,標準的研究も知らず,流行も追いかけなかった(誰も興味を持たない 「ロングテール」な研究だった)のが功を奏して(?), オリジナルな(でも注目してもらえない(??))研究として生き残りました.



確認: アンドロイドは電気羊の夢を見るか?

(表題: Ph.K.Dick, 1968年)

定義ないしは動画をごらんになればわかるとおり, このモデルの各粒子(Amazon で言えば,本)は 順位が降下しつつランダムに1位にジャンプします. 上のほうの模式図でもそうなっています. ランキングの数値が本来持っていると期待する役割,つまり, 本の人気(=本屋への貢献度)を測ることになるのか疑問があるかもしれません.

大丈夫です. よく売れる本はたとえ順位が落ちかけてもすぐ売れるので, 常に1位に近いところに順位が張り付きます. どの程度まで順位が落ちるかは売れ行き(1位へのジャンプの頻度)が 反映することは明らかです. ですから,平均的な順位がその本の人気を測る数値になります. 堅苦しく言えば, よく売れる本は観察時間の間に売れる部数が多いので, 部数に関する大数の法則が使える,ということです.

逆に売れにくい本の場合は, 観察時間に比べて平均購入時間間隔(販売頻度の逆数)が長いので, そもそも運が悪ければ観察時間の間に売れません. どこかの誰かが買うという行動はランダムなので 運不運に影響されるから, あまり売れない本,つまり,ロングテールに属する個々の本(タイトル),は 人気度が通常の観察時間ではわからない,という意味で, その指標が揺らぐ(大きく変化する)のは自然です.

こうして,stochastic ranking processの視点から ランキングの役割を見直すと, stochastic ranking processは現実のランキングのモデルとして 正しく機能することがわかります.

ところで,このページを最初に作ってまもなく, NHK総合のテレビ番組クローズアップ現代の 2008年6月4日放送分(No.2592)「ランキング依存が止まらない〜出版不況の裏側〜」 で,本屋のランキングの話がありました. インターネットではなく実際の本屋の話ですが, 売り上げランキングの1位の本を選ぶ人が多くなり, ランキングによって,売れる本への一極集中が進んだという話です. ロングテールの可能性についてAndersonが言うことと真逆の方向にランキングが 作用しているという話です.

近いうちにこの現象が,確率ランキング模型でどう現れるかという数学的な問題 を研究して,精密かつ定量的な結果を得たいな,と思っています. (現実に役立つかどうかはともかく,数学的には少し高級になるので, まずは知的興味として.)誰か共同研究したい人います?

2013年2月追記:楠岡誠一郎さんが共同研究してくれました.
T. Hattori, S. Kusuoka, Stochastic ranking process with space-time dependent intensities, ALEA, Lat. Am. J. Probab. Math. Stat. 9(2) (2012) 571-607 (リンクは200KB pdf file)
個々の書籍の注文の強度(平均的なジャンプ率)が,時刻だけでなく位置(順位)に も依存する場合(書籍毎に依存性が異なる関数でも差し支えない,という, 応用上は巨大な一般論)の極限定理です. 数学理論としては,この枠組みがあれば,高順位への注目による一極集中の可能性も 議論できるようになります. 現実の参考になる応用上の結論が出るかどうかは今後の課題です(ランキングが 数学的に興味深いロングテール領域とは逆の,世知辛い現実が絡む先頭付近の問題 なので,現実にランキングからおもしろい結論が出るかどうかは難しそうです)が, 数学的には戦闘準備のための手堅い橋頭堡を一つ確保した意義があります.


ページ始めの目次に戻る

日本語解説記事(講演予稿や講演スライドのpdfファイルのいくつか)
  1. 「 位置依存確率順位付け模型 」,
    岡山確率論セミナー スライド 約500KB 46シート pdf,2016.04.28 岡山大学理学部)
  2. 「 独立確率過程の大数の強法則と流れが定める確率順位付け模型 」,
    OR学会 待ち行列研究部会例会 スライド 約500KB 29シート pdf,2015.11.21 東京工業大学大岡山キャンパス)       OR学会 待ち行列研究部会例会
  3. 「 流行度の順位付け 」,
    OR学会 待ち行列研究部会例会 スライド 約900KB 39シート pdf,2012.11.17 東京工業大学大岡山キャンパス)       OR学会 待ち行列研究部会例会
  4. 「 確率的順位付け 」,
    語ろう数理解析 スライド (約750KB 36シート pdf,2010.11.20 芝浦工業大学 工学研究科)       語ろう数理解析
  5. 「 確率ランキング模型 --- A hydrodynamic limit of move-to-front rules and its application to web rankings 」,
    待兼山コロキウム スライド (約900KB 35シート pdf,2010.07.15 大阪大学 サイバーメディアセンター 菊池誠研究室)       待兼山コロキウム

  6. 「 Amazon.co.jpのランキングのモデルとロングテールの分析 」,
    研究集会「紀要の電子化と周辺の話題」スライド (約300KB 32シート pdf,2008.0902 京都大学数理研)
  7. 「 Stochastic ranking processの無限粒子極限とAmazon.co.jpのランキング 」,
    研究会「数理ファイナンスとその周辺」予稿 (2ページpdf,2008.01 東京大学数理科学研究科)

  8. 「 Amazon.co.jpのランキングを記述する偏微分方程式 」,
    日本数学会2008年度年会 応用数学分科会講演アブストラクトpp.162-165 (4ページpdf,2008.03)
  9. 「 Stochastic ranking processの流体力学極限と2ch.net 」,
    確率論シンポジウム予稿(2ページpdf,2007.12)


集中講義の記録はこちら

2007-2008年度の講演記録 論文 ページ始めの目次に戻る
hattori あと econ dot keio どっと ac と jp

日本語トップ> 解説記事>
  「ランダムウォークとくりこみ群」>
 「統計と確率の基礎」>
日本語トップ> 講義> 確率的順位付け,集中講義>   数理統計学,集中講義>