順番学研究所のご案内

無料ブログはココログ

« 書籍出版社の数理(6)――書籍出版社は保険会社と似ている、と考えてみよう | トップページ | 書籍出版社の数理(8)―出版社同士の競争は激しいのか? »

2010年6月 6日 (日)

書籍出版社の数理(7)――しかし本当に、書籍出版社と保険会社は似ているのか?

 前回の続きです。今回は、書籍出版社と保険会社の違いについて、考えてみましょう。

●保険会社はたくさんの加入者を集めることで、リスクを低減している

 さて、保険会社と書籍出版社が確率的な事象をどのように扱っているか、という疑問を投げかけて、前回は終わりました。まずは保険会社が確率を扱う方法とは、どのようなものなのか、見てみましょう。

  保険会社は、まず、生命表(各年齢の人が次の誕生日まで生き延びる確率や、平均してあと何年生きられるかを表にしたもの)に代表されるような各種統計から、保険の対象となる事象が起こる確率を詳細に調べます。 そして、ここからが説明を要するのですが、一言で言えば、「保険加入者をたくさん集めて、『中心極限定理』により、リスクを軽減」します。

 保険を含む金融の世界で、「リスク」とは予測値からのズレの大きさをいいます。ここでは例として、生涯に10分の1の確率で発生する成人病を対象とした保険を考えることにしましょう。保険会社は、その成人病にかかった保険加入者に、治療費として保険金100万円を支払わなければならないとします。このとき、保険会社は保険の掛け金をいくらに設定すればいいでしょうか。

 保険会社が100人の加入者を集めて、1人ずつから掛け金を11万円もらったとすれば、掛け金の合計は1100万円になります。病気になる確率は10分の1なので、保険会社が支払う保険金の予測値(期待値)は、加入者が100人の場合は1000万円。予測通りにいけば、1000万円支払っても、100万円が手元に残るので、これが保険会社のもうけになります。

 しかし、10分の1というのはあくまでも確率なので、加入者100人のなかから、たまたま15人の罹患者が出るかもしれません。そうなったら、保険金を1500万円支払わなければならなくなり、400万円の赤字になってしまいます。金融の世界では一般に、このような「予測値からのずれ」のことをリスクと呼びます。彼らの立場からすれば、予測から値がずれることによって、利益が予測通りに得られないことになるので、このことをリスクと呼ぶのもうなずけるでしょう。

 また、成人病保険の例でいえば、可能性としては100人のうち1人も病気にならないということもありえます。この場合の「予測からのずれ」は保険会社に思いがけない利益の増大をもたらしますが、このように「よい方向へのずれ」も、金融の世界では同様にリスクと呼ばれます。

 保険会社としては、このリスクを何とか小さくしたいところです。リスクを小さくするためにはどうすればいいでしょうか。経験的にもわかるように、保険加入者の数が少なければ、予測値からのずれが大きくなる確率は高くなります。しかし、加入者の数をもっとずっと大きくすれば、予測値から大きくずれる可能性は急激に小さくなります。10分の1の確率でかかる成人病に、100人のうち15人がかかる確率はそれなりに大きいかもしれないですが、1000人のうち150人がかかる確率はずっと少ないでしょうし、1万人のうち1500人がかかる確率はさらにずっと少ないはずです。

 このように、保険の加入者数が増えると、保険会社にとってのリスクが減ることは、直観的に推測できますが、数学的にはっきりと示すこともできます。それだけでなく、どのくらいリスクが減るのかさえも、きちんと計算できます。そのおおまかな理屈は次のようなものです。

 一般に、平均からのずれの生じやすさ=ばらつきは、「標準偏差」であらわされます。標準偏差はいわば「平均からのズレの大きさの『平均』」のようなもので、確率の分布の仕方がわかっていれば、多くの場合、簡単に算出できます。金融の世界でリスクの話をする場合、リスクの大きさを標準偏差の大きさで表すことが普通です。つまり、標準偏差が大きければ、リスクが高い=平均からばらつくことが多いということになります。

 そしてその標準偏差の大きさ=リスクの大きさは、たくさんの数を集めて集計すればするほど、相対的に小さくなっていくことが知られています。具体的にいえば、集計する数(統計学の用語では「標本数」という)をnとしたとき、罹患者数の期待値(予測値)からのずれを表す標準偏差は、nの平方根(√n)に比例します。つまり、成人病保険の例で言えば、加入者1万人の場合の罹患者数の標準偏差は、加入者100人の場合の10倍(1万/100の平方根)にしかならないので、相対的に小さくなるのです(保険加入者から集めたお金は100倍になるのに、リスクは10倍にしかならない!)。具体的には、加入者が1万人の場合、罹患者数の期待値は1000人で、標準偏差は30人と計算されます(標準偏差の計算の仕方は「中国あり得ない!の件」を参照のこと。z値を求める式の分母が、標準偏差に相当する)。

 さらに重要なことなのですが、このように加入者数が多くなると、罹患者数の確率分布はかなり素直に「正規分布」で近似できるようになります。そうなると、平均からのズレを確率で表すことができるようにもなります。正規分布で平均からのずれがある大きさになる確率は、簡単に計算する数式があり、すでに詳細に計算されてたいていの統計学の本の巻末に一覧表となって掲載されているからです。たとえば、平均から標準偏差ひとつ分より大きく上にずれる確率は約15.9%、標準偏差二つ分以上、上にずれる確率は約2.3%です。

 したがって、いま問題にしている成人病罹患者数が平均からズレる確率も計算できます。

 加入者1万人で罹患者数が平均から標準偏差1つ分の1030人を超える確率は約15.9%、標準偏差2つ分の1060人を超える確率は約2.3%であることがわかります。つまり、罹患者数が期待値の1.5倍である1500人に達する確率はほとんどゼロとみなしてよいくらい小さいと結論できます。加入者100人の場合に比べると著しくリスクが低下するのです。この仕組みで、保険会社は加入者を増やすことによってリスクを低減しており、皆さんご存じのように、この仕組みは大変うまくいっています。あとは、罹患率10%でうまく回るように保険料を設定し、魅力的なタレントを使ってCMを打てば……、まあ損をする心配はありません。

●出版社が保険会社と同じようにリスクを低減できない理由

 では、書籍出版社が確率を相手にする場合とき、何が起こっているでしょうか。出版社にとって、保険会社が加入者を増やすことに相当するのは、ある一定期間に多数のタイトルを出版することです。書籍出版社も、保険会社と同じ戦略をとり、たくさんのタイトルを出版すれば、リスク(標準偏差)が減り、年間売り上げが平均からずれる確率が低くなって、売り上げは安定するでしょうか?

 これまで繰り返し述べているように、書籍の売り上げの確率は、ほぼべき分布に従います。これが、非常に問題なのです。

 保険会社が、たくさんの加入者を集めることでリスク(標準偏差)を軽減できたのは、「中心極限定理」のおかげです。中心極限定理とは、簡単に言えば、上で述べたように、「たくさんの加入者が集まると平均値からずれる確率が低くなる」ということなのですが、 これをもう少し厳密に言うと、次のようなことになります。

 「ある確率事象によって決まる値が、平均値μと標準偏差σを持っていて、各試行が独立であるとき、それらをn個足し合わせたものは、nが大きくなるほど正規分布に近づく。その正規分布の平均はn×μ、標準偏差はσ√nとなる」

 この言葉の後半は、上で言っていることをむずかしく言い直していると考えていただいてけっこうです。問題は前半部分。中心極限定理によって、加入者が増えるほどリスクが減るためには、「平均値と標準偏差を持っている」ことが条件なのです。

 ところが、驚くべきことに、べき分布に従う確率事象は、平均値も標準偏差も持っていない(無限大になってしまう)ということが、あり得るのです。このため、べき分布を足しあわせても、正規分布にはなりません。べき分布の足しあわせは、べき分布になってしまいます。

 しかし、平均が無限大になってしまうとは、どういうことでしょうか。ここでは、保険と比較するために、先ほどの成人病の例を引き続き使うことにしましょう。

 先ほどの例では、10分の1の確率で100万円の支払いが発生するとしていました。この場合、支払いの期待値(支払いの平均値)は、100万円×0.1で、10万円です。

 もし、この病気による支払いが、べき分布に従うとしたら、支払額の期待値(平均値)はどうなるでしょうか?

 確率と事象の大きさが、一定の比率になって続いていると、べき分布になります。たとえば、

  • 10分の1の確率で、100万円の支払い
  • 100分の1の確率で、1000万円の支払い
  • 1000分の1の確率で、1億円の支払い
  • 10000分の1の確率で、10億円の支払い
  • ……

というように、確率が低いものの、確率の低減と同じ比率で、支払額が増加するような病気では、支払額がべき分布になっていると言えます。この病気の治療費を保証する保険の場合、期待値はどうなるか、考えてみましょう。

 期待値は、「確率×支払額」の総和ですから、

     期待値=0.1×100万円+0.01×1000万円+0.001×1億円+0.0001×10億円……

         =10万円+10万円+10万円+10万円……

         =無限大

 このように、べき分布の場合、支払額の期待値は無限大に発散してしまいます。

 これを書籍の売り上げに適用して、もう一度考えてみましょう。もし、本の年間の売れ行きの確率分布が以下のようなべき分布だったとしたら、期待値はどうなるでしょうか。

  • 10分の1の確率で1万部が売れ、
  • 100分の1の確率で10万部、
  • 1000分の1の確率で100万部……

この期待値は、「確率×売り上げ部数」なので、

 期待値=0.1×1万部+0.01×10万部+0.001×100万部……

     =1000+1000+1000+……

     =無限大

となり、やはり年間売り上げの期待値は無限大になってしまいます。

 議論は複雑になりますが、標準偏差についても同じように、べき分布では発散することがあることが示せます。

 もう少しちゃんといえば、いつも発散してしまうわけではなく、「上に有界でなく、べき分布の確率密度関数の指数が2以下のとき(=累積分布関数の指数が1以下のとき)、平均値も標準偏差も発散」し、「上に有界でなく、べき分布の確率密度関数の指数が2より大きく3以下のとき(=累積分布関数の指数が1より大きく2以下のとき)、平均値は有限で、標準偏差は発散」します。

 そして、実際の本の売り上げ分布は、確率密度関数の指数が2より大きく3以下(=累積分布関数の指数が1より大きく2以下)です。したがって、平均は有限になるものの標準偏差が発散するという条件に当てはまります。

 このため、中心極限定理によるリスクの低減はできないことになります。書籍出版社は、著者からリスクを引き受けているにもかかわらず、そのリスクを保険会社のようには低減できないのです!

●年売り上げが平均からずれる確率も、書籍の場合、求めるのがむずかしい

  ……えーと、ここで告白しますが、私、いま、嘘をつきました。

 本当の本当は、書籍の売り上げ分布の標準偏差は発散しません。先ほどの、平均や分散が発散する条件のところに、「上に有界でなく、…」と書きました。本の売り上げにおいて、「上に有界でない」とは、1000万部や10億部、1兆部というようなベストセラーが、確率は小さいがあり得る、ということに相当します。

 しかし、実際には、本の売り上げは、500万部を超えることはおそらくないでしょう。本の売り上げは、ほぼべき分布に従うものの、カットオフがあり、有限な範囲に収まるので、標準偏差も本当のところは発散しません。 ですから、たくさんのタイトルを発行すれば、年間売り上げの標準偏差は小さくなってリスクは低減していきます(理論的には)。また、たくさんのタイトルを発行すれば、売り上げの確率分布は、べき分布ではなく、正規分布に近づいていくはずです(理論的には)。

 ここで、一度、以前「書籍出版社の数理(4)――モンテカルロ法で売り上げの確率分布を求める!」で示した、シミュレーション結果の画像を見てください。 これは、50タイトルの本を発行した場合の、出版社の年間売上の分布のシミュレーションです。50タイトルを発行しても、年間売り上げの分布はかなりいびつなままで、正規分布にはほど遠い形です。テール部分の形は、明らかにべき分布のままです。標準偏差も、まだかなり大きいといえます。たしかに、2~3タイトルしか出さない場合と比べれば、リスクは低減していますが、平均値からずれる確率があまりに大きく、保険会社のような安定したビジネスにはなりようがありません。

 たくさんのタイトルを発行すれば、年間売り上げは平均値まわりに収束するのだから、そうすればいいではないか、とおっしゃるかもしれません。もし、たくさんのタイトルを発行し、年間売り上げの確率分布をべき分布ではなく、正規分布に従うようにしようとするのであれば、少なくとも1000タイトルほどを発行する必要に迫られるでしょう。保険会社ならば、保険の加入者を数万人規模で集めることは問題なくできますが、1つの出版社が1年間で発行できるタイトル数には自ずと限界があります。かなり大きな規模の出版社でも年間数百タイトル、中小出版社なら数十タイトルが現実的でしょう。その規模では、売り上げの安定は不可能です。無理矢理たくさんのタイトルを発行すれば、粗製濫造になって、結局売り上げが思うほど上がらなくなる危険もあります。

 売り上げの安定化が無理なら、次善の策として、平均からずれる確率を求めて、備えをすることになりますが、その上でも問題があります。

 保険業界では、確率分布の形が素直な上、かなりの数の加入者を集めることができるため、最終的に足しあわせた分布は正規分布になるので、平均からずれる確率を簡単に計算することができます。

 しかし、書籍売り上げのように、「ある範囲でおおむねべき分布に従うもの」を数十から数百、足しあわせたものは、正規分布にはなりません。どのような確率分布になるかを示す便利な数式も、現在のところないようです。つまり、出版社の年間売り上げの確率分布を近似的にでも、解析的に求める方法はないのです。このため、売り上げの確率分布を求めたかったら、モンテカルロ法によるシミュレーションをするしかありません。

  もっといえば、書籍の売り上げの分布がどのようになっているかという統計は、厚生労働省がまとめている生命表のように、しっかりと調査されていません。というか、まったく調べられていません。たとえば、出版業界の人でも「1年間に、売り上げが1万部を超える本は何タイトルあるか」という問いに答えられる人は1人もいないのではないでしょうか(私も答えられません)。こういう統計が、まったく存在しないからです。こういったことを算出する根拠となるデータは、おそらく大規模チェーンの書店のPOSデータや、日販やトーハンのデータの中にはあるでしょうが、表には出てこないので、誰にもわかりません。また、売り上げの分布は、本のジャンルによっても相当にばらつきがあるでしょう。

  こういったことを考えていくと、書籍出版社が、本の売り上げを確率として扱う上でできることといえば、「自社の過去の売り上げデータを使ったモンテカルロシミュレーション」と、「無理のない範囲でなるべくたくさんのタイトルを出版する」ということくらいなのかもしれません(書籍出版社の売り上げ安定化策については、また別に論じたいと思います)。

 以上のように、出版社は未だに、確率的事象としての本の売り上げを、うまく扱うことができないでいます。逆に言えば、本の売り上げの確率をうまく扱うことができなくても、運良くベストセラーが出てしまえば、会社としては存続できてしまうということだと思われます。確率的な事象にどう対処するかという戦略よりも、売れる本を出すことの方が経営の好転にずっと大きなインパクトを与えてしまうのです。普通なら、行き当たりばったりで運任せな経営では、会社の持続可能性は制限されるはずです。しかし、規模の小さい出版社ではどのみちリスクの低減に限界があるのですから、確率をできる限りうまく扱ったところでその効果はしれています。可能な限り合理的に行動したところで、売れる本が出なければ会社はつぶれてしまうのです。このように出版社の経営は運任せにならざるを得ないところがあるので、いわゆる悪い経営が排除されません。また、よい経営が勝利するとも限りません。ここが恐ろしいところです。

 次回は、電子書籍の登場が何を起こすのかを、今回の議論を元に、あまり論じられていない視点から考えてみたいと思います。

« 書籍出版社の数理(6)――書籍出版社は保険会社と似ている、と考えてみよう | トップページ | 書籍出版社の数理(8)―出版社同士の競争は激しいのか? »

出版」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« 書籍出版社の数理(6)――書籍出版社は保険会社と似ている、と考えてみよう | トップページ | 書籍出版社の数理(8)―出版社同士の競争は激しいのか? »