お金と数字と温泉を考えるブログ

お金と数字と温泉を考えています。

数字

2020年箱根駅伝ランナーのシューズとその影響

ヴェイパーフライの衝撃 今年の箱根駅伝では区間新記録ラッシュが起こり、その要因がランナーがはいているシューズによるものではないか、という話があります。 toyokeizai.net 果たして、今年の箱根駅伝はどのようなシューズが履かれていたのでしょうか。 r…

2020年箱根駅伝(復路)結果を可視化する

2020年箱根駅伝の復路が終わったので、結果を可視化してみます。 往路はこちら umejiro330.hatenablog.com 大きな順位変動がある往路と比べて、復路は変動が小さいですね。箱根の山登りが終わった段階で、ほぼ勝負ありといったところなのでしょうか。個人的…

2020年箱根駅伝(往路)結果を可視化する

2020年の箱根駅伝(往路)が終わったので、結果を可視化してみたいと思います。 各校ごとの順位変動(往路)スマホでご覧になっている方は画像が小さいかもしれませんが…図から見る、今年の各校の結果を簡単に分けると下記のようになります。 ①スタートダッシュ…

首都圏のJR乗降者数ランキング上位を地図にプロットし様子を見てみる

どのあたりが通勤圏内なのか JR東日本は毎年、乗降者数ランキングをweb上にアップしています。 www.jreast.co.jp 今回は上記データを用いて、首都圏の乗降者数トップ100がどのあたりに集中しているのかを、Rを使って図示してみたいと思います。 使うパッケー…

データから見るM-1 2019 しゃべくりvsコント 関西vs非関西の戦い

2019年のM-1をデータで分析。そこで見えた審査員やコンビの傾向とは?

2019年のM-1がナイツ塙の「言い訳」通りになった話

ナイツ塙の恐るべき観察力 2019年のM-1が12月22日に行われました。決勝進出組10組のうち7組が初出場ということで、今まで見たことが無い、新しい笑いを楽しめたと感じております。 ところで、M-1の舞台で漫才を行う漫才師以外に、M-1に出ることを心から楽し…

トランプ大統領の発言が過激かどうかをTwitterのつぶやきから確かめる

トランプ大統領のつぶやきは世界を動かす 言わずと知れた、アメリカ大統領 ドナルド・トランプ。資産家らしい歯に布着せぬ発言でアメリカ社会を混乱させています。 その中でもとりわけ影響を与えているのはトランプ大統領のツイッターです。大統領でありなが…

【トップ5は何だ?】サザンの歌詞で出てくる地名はどこが多いのか

サザンもサブスク開始 2019年12月20日、サザンオールスターズがストリーミング配信サービスを開始しました。 前週に、ラルクがストリーミング配信を開始したと記事に落としたばかりでした。 umejiro330.hatenablog.com 大御所でもストリーミング配信を開始し…

【はっきり出た】ラルクとGLAYの歌詞の違いをRMeCabとWord Cloudで確かめる

ラルクとGLAYの違いを、歌詞をテキストマイニングすることでで炙り出します。

『確率思考の戦略論』『ブランディングの科学』の世界をRで体感する (1)補論(NBDモデルの導出方法)

前回の記事で、『確率思考の戦略論』および『ブランディングの科学』に記載してある例をNBDモデルを用いて再現しました。 umejiro330.hatenablog.com ただ、NBDモデルの式は記載していたのですが、その導出方法について記載していなかったので、補論としてま…

『確率思考の戦略論』『ブランディングの科学』の世界をRで体感する (1)NBDモデル

『確率思考の戦略論』『ブランディングの科学』の世界を統計ソフト「R」で再現。簡単なモデルで複雑な世界を記載できるのは驚きです。

統計検定1級 2019問1を解く

動機 2019年11月23日に統計検定1級を受け、その復習のため。 内容は、簡単に書くと [1]確率母関数から期待値・分散を導出 [2]二項分布の期待値・分散を確率母関数から導出 [3]確率母関数を用いれば、累積分布関数をおさえることが出来ることの証明 [4][3]を…

日本の都道府県別魚介類消費量の傾向

経緯 久々に何かのデータを見て傾向を見てみたいと思い、記事にしています。 テーマは「日本の都道府県別魚介類消費量の傾向」。 東西南北ある中で、特徴も違うであろうと考え、見てみます。 データセット データセットは下記の2つ。 ・家計調査(二人以上の…

【大公開!】統計検定準1級に合格! 使用した参考書一覧

統計検定準1級の対策をしたいけど、範囲が広くてどこから手を付ければいいか分からないそこのあなた。この記事で対策テキスト一覧を記載しているので一度ご確認を。

時系列分析手法を無理矢理まとめる

動機私はとにかく昔から時系列分析が嫌いでした。 理由としては ・授業で触れたことが無かった ・通常の統計学と違うアプローチがされている ・線形回帰でモデリングしてもいけるんでは(?という甘い考え)から大学時代は触れないように回避しながら過ごし、卒…

大気汚染データの判別分析

暇しているので、ネット上に上がっているデータを判別分析してみることにしました。 データはこちらから拝借しています。 データバンク | 松原望 ここの「大気汚染データ」を利用します。データの説明変数としてSO2,D.D,NOXがあるようです。 被説明変数とし…

ポアソン分布による台風上陸数モデリング(2016 改)

稀に起こる事象をモデリングするにはどうすればよいか。 そういった場面で用いられるのがポアソン分布です。 二項分布において、nが無限大に大きく、pが限りなく小さいときに利用できる確率分布です。起こりうる確率が小さいものに対して適用されるので、例…

大阪環状線を多次元尺度構成法で書いてみる

京橋駅大阪環状線とは ※また馬鹿な記事を書いています。 もはや関西人にとっては言うまでもありませんが、関西の中心を回している 血管のような存在です。 大阪環状線があるからこそ、人の流れが滞ることなく動き続けることができます。 代表的な駅として・…

対数変換してOLSとGLMってそんなに違いますか

※この記事は興味本位で書いただけで、理論的には大きな間違いを孕んでいるかもしれません。 あくまでもモデリングの比較をしてみたかっただけです。対数変換後のOLSとポアソン回帰ってそんなに違うの 仕事しながら(真面目に仕事をしなさい)思ったのですが、 …

デルタ法

は自由度mのχ二乗分布に従う。そのときとの期待値と分散を求めよ。 の期待値と分散は=,=な訳ですが、 χ二乗分布の確率密度関数を用いての期待値・分散を求めるのは面食らいます。 (というか普通に計算できる自信がありません) このように、複雑な確率密度関…

因子分析その②~回転

umejiro330.hatenablog.com前回は因子分析の入りと、因子負荷量や累積寄与率を求めるところまでやりました。 今回は、それらを回転させます。 回転させる理由は前回の記事にも記載の通り、因子負荷量の解釈を簡単にするためです。回転を行う前に、回転方法は…

因子分析その①~回転まで

因子分析は準1級で出題が無いですが出る可能性があるため記載いたします。因子分析について 因子分析は、ある観測された変量に対して背後に潜む因子(共通因子)を探す分析、だと考えています。 因子分析でしばしば利用されるデータが、生徒の成績データ(国、…

多変量解析概観

統計検定準一級対策中ですが、過去に出題された多変量解析分野についてまとめとして記載いたします。主成分分析 2017年と2015年ですでに2回出題されており、内容はまんべんなく出題されています。 ・固有値 ・寄与率 ・主成分負荷量 ・スクリープロット いず…

行列を用いた重回帰分析(2016 記述問2)その③多項式回帰・過学習・外挿

umejiro330.hatenablog.com umejiro330.hatenablog.com2016年記述問2は、YとZの関係を求めるだけの問題ではなく、 Zを二乗したZ^2を加えて重回帰した場合はどうなのかという問題もありました。 その①その②同様正規方程式を用いれば解くことができますが、今…

行列を用いた重回帰分析(2016 記述問2)その②パラメータの計算

前回までの内容umejiro330.hatenablog.com 行列を用いた重回帰分析を行う際に、正規方程式を立てるというところまで行いました。 今回は、正規方程式を立てた後、行列計算をしてパラメータを求めるところまで行いたいと思います。解法手順 (2)行列計算 まず…

行列を用いた重回帰分析(2016 記述問2)その①正規方程式

行列計算 重回帰分析は統計検定2級レベルでも頻出のテーマですが、殊行列を用いた話になると 話は別です。 統計検定二級レベルでは行列計算は要求されません。(簡単な微積分の計算はあります) 準一級レベルでも行列計算を求められたのは2016年の記述問2のみ…