日本の都道府県別魚介類消費量の傾向
経緯
久々に何かのデータを見て傾向を見てみたいと思い、記事にしています。
テーマは「日本の都道府県別魚介類消費量の傾向」。
東西南北ある中で、特徴も違うであろうと考え、見てみます。
データセット
データセットは下記の2つ。
・家計調査(二人以上の世帯)品目別都道府県庁所在市及び
政令指定都市ランキング(2016年(平成28年)~2018年(平成30年)平均)
出典:総務省統計局
www.stat.go.jp
・平成30年漁業・養殖業生産統計
出典:農林水産省
http://www.maff.go.jp/j/tokei/kouhyou/kaimen_gyosei/index.htm
分析
⓪データセットの確認
Rでデータセットを見ていきます。
gyokai<-read.csv("C:/.../gyokai.csv",stringsAsFactors=FALSE) str(gyokai)#データの特徴を見る。総務省統計局のデータから一部加工 'data.frame': 52 obs. of 15 variables: $ city : chr "和歌山市" "名古屋市" "北九州市" "福島市" ... $ まぐろ: int 1443 2251 370 2768 514 1127 2224 2581 2806 1571 ... $ あじ : int 1268 614 1786 394 1438 615 1565 756 185 914 ... $ いわし: int 754 596 1179 419 850 637 682 350 128 945 ... $ かつお: int 1245 634 296 1681 353 574 615 1502 589 1035 ... $ かれい: int 659 390 1026 784 660 1363 805 346 163 1264 ... $ さけ : int 2302 2344 2149 2634 2263 2320 2613 2752 2420 2656 ... $ さば : int 1374 742 1226 537 1084 897 898 1053 859 1272 ... $ さんま: int 967 792 650 1337 656 548 798 1155 854 1114 ... $ たい : int 965 334 1045 136 1031 235 302 225 336 851 ... $ ぶり : int 2239 1525 2210 1210 2075 2766 5025 1272 509 2331 ... $ いか : int 1401 1066 1492 1334 991 1520 2236 1152 671 1609 ... $ たこ : int 784 714 435 502 456 701 610 496 317 858 ... $ えび : int 1951 1378 1707 825 1396 1207 1915 1182 587 1633 ... $ かに : int 452 462 465 233 443 1186 781 234 150 468 ...
①クラスター分析
scale<-scale(gyokai[,-1])#データの標準化、一行目は不要なので削除 d<-dist(scale)#距離行列の作成 hc<-hclust(d,method="ward.D2")#クラスター分析、分析手法はウォード法 plot(hc,labels=gyokai$city,hang=-1)#ラベルを付けて図をプロット
分析の結果出力されたツリーを見ると、
・ツリーの左側が東日本
・ツリーの中央部が北日本
・ツリーの右側が西日本
という傾向があることから、地域によって食される魚介類が異なるようです。
一方で、ツリーからは特徴が異なることが分かっても、どの魚介類が消費されているかが分からないため、
次に主成分分析を試みます。
②主成分分析
gyokaic<-read.csv("C:/…/gyokai.csv",stringsAsFactors=FALSE,row.names=1)#同一データだが、1列目を行名に変更 pca<-prcomp(scale(gyokaic),scale=T)#主成分分析 biplot(pca) #結果のプロット
主成分分析の結果が二軸で表示されますが、おおむね
第一主成分:各都道府県の経度
第二主成分:各都道府県の緯度
としてプロットされているように見えます。
また、魚ごとの特徴も見られ、
・さけやさんま、かれい、いか…緯度の高い地域で主に食される
・たいやあじ、さば、ぶり…全国的に食されるが比較的緯度の低い地域で食される
・マグロ…全国的に食されるが、比較的経度の大きい地域で食される
ということが分かります。