お金と数字と温泉を考えるブログ

お金と数字と温泉を考えています。

日本の都道府県別魚介類消費量の傾向

経緯

久々に何かのデータを見て傾向を見てみたいと思い、記事にしています。
テーマは「日本の都道府県別魚介類消費量の傾向」。
東西南北ある中で、特徴も違うであろうと考え、見てみます。

データセット

データセットは下記の2つ。
・家計調査(二人以上の世帯)品目別都道府県庁所在市及び
 政令指定都市ランキング(2016年(平成28年)~2018年(平成30年)平均)
 出典:総務省統計局

www.stat.go.jp

・平成30年漁業・養殖業生産統計 
 出典:農林水産省

http://www.maff.go.jp/j/tokei/kouhyou/kaimen_gyosei/index.htm

分析

⓪データセットの確認

Rでデータセットを見ていきます。

gyokai<-read.csv("C:/.../gyokai.csv",stringsAsFactors=FALSE)
str(gyokai)#データの特徴を見る。総務省統計局のデータから一部加工
'data.frame':	52 obs. of  15 variables:
 $ city  : chr  "和歌山市" "名古屋市" "北九州市" "福島市" ...
 $ まぐろ: int  1443 2251 370 2768 514 1127 2224 2581 2806 1571 ...
 $ あじ  : int  1268 614 1786 394 1438 615 1565 756 185 914 ...
 $ いわし: int  754 596 1179 419 850 637 682 350 128 945 ...
 $ かつお: int  1245 634 296 1681 353 574 615 1502 589 1035 ...
 $ かれい: int  659 390 1026 784 660 1363 805 346 163 1264 ...
 $ さけ  : int  2302 2344 2149 2634 2263 2320 2613 2752 2420 2656 ...
 $ さば  : int  1374 742 1226 537 1084 897 898 1053 859 1272 ...
 $ さんま: int  967 792 650 1337 656 548 798 1155 854 1114 ...
 $ たい  : int  965 334 1045 136 1031 235 302 225 336 851 ...
 $ ぶり  : int  2239 1525 2210 1210 2075 2766 5025 1272 509 2331 ...
 $ いか  : int  1401 1066 1492 1334 991 1520 2236 1152 671 1609 ...
 $ たこ  : int  784 714 435 502 456 701 610 496 317 858 ...
 $ えび  : int  1951 1378 1707 825 1396 1207 1915 1182 587 1633 ...
 $ かに  : int  452 462 465 233 443 1186 781 234 150 468 ...
クラスター分析

上記データセットに対してクラスター分析を行います。

scale<-scale(gyokai[,-1])#データの標準化、一行目は不要なので削除
d<-dist(scale)#距離行列の作成
hc<-hclust(d,method="ward.D2")#クラスター分析、分析手法はウォード法
plot(hc,labels=gyokai$city,hang=-1)#ラベルを付けて図をプロット

f:id:umejiro330:20191130103713j:plain
クラスター分析結果
分析の結果出力されたツリーを見ると、
・ツリーの左側が東日本
・ツリーの中央部が北日本
・ツリーの右側が西日本
という傾向があることから、地域によって食される魚介類が異なるようです。
一方で、ツリーからは特徴が異なることが分かっても、どの魚介類が消費されているかが分からないため、
次に主成分分析を試みます。

②主成分分析
gyokaic<-read.csv("C:/…/gyokai.csv",stringsAsFactors=FALSE,row.names=1)#同一データだが、1列目を行名に変更
pca<-prcomp(scale(gyokaic),scale=T)#主成分分析
biplot(pca) #結果のプロット

f:id:umejiro330:20191130105122j:plain
主成分分析結果
主成分分析の結果が二軸で表示されますが、おおむね
第一主成分:各都道府県の経度
第二主成分:各都道府県の緯度
としてプロットされているように見えます。

また、魚ごとの特徴も見られ、
・さけやさんま、かれい、いか…緯度の高い地域で主に食される
・たいやあじ、さば、ぶり…全国的に食されるが比較的緯度の低い地域で食される
・マグロ…全国的に食されるが、比較的経度の大きい地域で食される
ということが分かります。

③②を具体例(マグロ)で見てみる

マグロが全国的に食されていることを示すために、マグロの漁獲量についてのランキングトップ10を見てみます。
マグロ漁獲生産高トップ10(平成30年度)

順位 都道府県 漁獲高(100t)
1 静岡 301
2 宮城 179
3 宮崎 164
4 高知 148
5 三重 112
6 東京 109
7 鹿児島 107
8 沖縄 100
9 神奈川 53
10 青森 47

参考文献:平成30年漁業・養殖業生産統計(農林水産省)より一部加工

漁獲地は全国的に分散していますが、経度が大きい地域に多いのは主成分分析と整合的でした。