『確率思考の戦略論』『ブランディングの科学』の世界をRで体感する (1)NBDモデル

f:id:umejiro330:20191207113700j:plain
『確率思考の戦略論』『ブランディングの科学』の登場により高まった数学マーケティングの世界。

既に多くの読者がその内容について記事にしているようです。

一方で、実際にその根幹である「NBDモデル/NBDディリクレモデル」を何らかの方法で用いて、現実世界に適用していると思われる記事には滅多に出会うことはございません。

そこで、『確率思考の戦略論』および『ブランディングの科学』に記載のある実例と統計ソフト「R」を用いながら、数学マーケティングのパワーを実感していただきたいです。

両書籍の概要と背景の共通点
まず、NBDモデルの世界をRで体感する

両書籍の概要と背景の共通点

『確率思考の戦略論』の概要

『確率思考の戦略論』は、2001年の開業以来来場者数を減らしていたUSJを、数学マーケティングの力によって再建させた、そのメソッドが書かれている書籍です。
筆者は、ブランドの売上を伸ばすためには
自社ブランドへのプリファレンス(=自社ブランドが選ばれる確率)を高める
認知を高める
配荷を高める
としています。

『ブランディングの科学』の概要

『ブランディングの科学』は、バイロン・シャープ氏によって記載された、ブランドの売上を拡大させるためのマーケティング法則が記載されている書籍です。
『確率思考の戦略論』と同様に、ブランドの売上拡大についても記載があり、
ブランドのマーケットシェア(=売上)は顧客数が増加することによって拡大する。
また、消費者が購入しやすいブランドほどマーケットシェアは大きくなる。
消費者の購入しやすさ(=顧客数の増加しやすさ=売上の伸び)は
「メンタル・アベイラビリティ」(購入機会の高まり)
「フィジカル・アベイラビリティ」(ブランド想起の高まり)
によって決定されると記載があります。

背景の共通点

両書籍の、ブランド売上を拡大するために必要な要素として書かれているものは、記載方法が異なるだけです。
では、なぜ共通の考え方になるのか、それは両者ともに「NBDディリクレモデル」を前提として書籍内の記述を進めているからです。

NBDディリクレモデル(詳細は次回以降)

NBDディリクレモデルは、
・製品カテゴリにおける購買の生起が負の二項分布(NBD=negative binomial model)に従う
・ブランド選択の同時分布がディリクレ分布に従い、これらが同時に独立している
という上記の2つの仮定のもと、製品カテゴリの購入回数と、そのカテゴリ内のブランドの関係を記述することが出来ます。*1

まず、NBDモデルの世界をRで体感する

ディリクレNBDモデルの世界については次回以降に記述するため、今回はまず「NBDモデル」の世界をRで体感してみましょう。

その前に、NBDモデルの簡単な説明

NBDモデルについて、数式を用いて簡単に説明しておきます。
$P_{r}=\frac{\Gamma(K+r)}{\Gamma(r+1) \Gamma(K)}\left(\frac{M}{M+r}\right)^{r}\left(\frac{K}{M+r}\right)^{K}$
$r=そのカテゴリ内の購入回数や利用回数$
$M=そのカテゴリにおける平均購入回数や平均利用回数$
$K=分布を決めるパラメータ$
あるカテゴリ(例えば、洗剤やシャンプー、お菓子など)における購買回数・利用回数の分布は、パラメータMとKを用いれば現実世界に近似して記述出来ます。

※NBDモデルの導出方法は下記の記事でまとめました。
umejiro330.hatenablog.com

具体例1:本の貸し出し回数の分布

1983年の慶應義塾大学日吉情報センターにおける本の貸し出し頻度についてのデータを見てみます。*2

#NBDモデル_図書館
#実測値は下記の通り
o<-(c(5542,1876,826,475,283,170,92,72,44,24,36,16,9,7,8))
#まず、Mの値は0.995と分かっているので、貸出回数0回の状態からKを算出
x<-0
r<-x
K<-0.475486
M<-0.995
p<-gamma(K+r)*(K/(M+K))^K*(M/(M+K))^r/(gamma(r+1)*gamma(K))
p*9480#Kの値は算出完了
#xの範囲を1～10にして見てみる
x<-0:10
r<-x
K<-0.4754861
M<-0.995
p<-gamma(K+r)*(K/(M+K))^K*(M/(M+K))^r/(gamma(r+1)*gamma(K))
(e<-p*9480)

回数	実測値	理論値
0	5542	5542.0
1	1876	1783.0
2	826	890.0
3	475	497.0
4	283	292.2
5	170	177.0
6	92	109.3
7	72	68.4
8	44	43.2
9	24	27.6
10	36	17.7

おおむね、実測値と理論値の値が同じくらいになっております。

具体例2:「コークよりペプシが明らかに左に傾斜している」ことの説明

『ブランディングの科学』において、コカ・コーラとペプシの購入頻度についてのグラフが記載されており、コカ・コーラの方がペプシより左に傾斜しています。(購入平均回数は変わらないとされています)
その理由は、「ブランドは成長しながら、まず、多くのライトユーザーを取り込む。…ヘビーユーザーもその多くがさらに頻繁な購買行動を起こすようになる*3」、とされていますが、その様子ををRで見てみましょう。

#コカコーラとペプシ
#ペプシの1年間平均購入回数は9回
y1<-0:10
r1<-y1
K1<-0.16
M1<-9
p1<-gamma(K1+r1)*(K1/(M1+K1))^K1*(M1/(M1+K1))^r1/(gamma(r1+1)*gamma(K1))
names(p1)<-c(0:10)
#コカコーラは12回
y2<-0:10
r2<-y2
K2<-0.3
M2<-12
p2<-gamma(K2+r2)*(K2/(M2+K2))^K2*(M2/(M2+K2))^r2/(gamma(r2+1)*gamma(K2))
names(p2)<-c(0:10)
par(mfrow=c(1,2)) 
barplot(p1,main="ペプシ")
barplot(p2,ylim=c(0,0.5),main="コーラ")

f:id:umejiro330:20191207220611j:plain
本通りのグラフとはなりませんでしたが、ペプシの方が全体的に左に寄っているのが分かります。
もう少しグラフを見てみると、下記のことが分かります。
・0回の購入者数がペプシ>コカ・コーラ
(=コカ・コーラのライトユーザーが多い)
・複数回購入しているユーザー数はペプシ<コカ・コーラ
(=コカ・コーラのヘビーユーザーも多い)
『ブランディングの科学』で記載されていた、「「ブランドは成長しながら、まず、多くのライトユーザーを取り込む。…ヘビーユーザーもその多くがさらに頻繁な購買行動を起こすようになる(＝購入者数が増える=プリファレンスが増えている)」ということに整合的ですね。
ちなみに『確率思考の戦略論』にも記載されていますが、Kは分布の分散を決めるパラメータです。Kが大きくなればなるほど、分布の分散も大きくなるわけです。
加えて、プリファレンスが大きくなればKも大きくなるとの記載があります。