サプリライオンです!
2022年11月、統計検定1級試験を受けました。
結果、午前の試験は落ちましたが、午後の試験に合格しました!
今回は、そもそも統計検定1級とはどんな試験かということから、どんな勉強をしてこの結果に至ったかということを簡単に綴っていきます。
自分のスペック
- 統計検定準1級取得済み
- 線形代数や微積は大学時代に履修
- AtCoder青色、Kaggle Expert
- 数学好き
受験のきっかけ
- 統計についての理解度を高め、より良いデータサイエンティストになりたい!
- 転職サイトに「統計検定準1級」と記入するとスカウトが多く飛んできたので、「統計検定1級」にクラスチェンジすれば、さらに評価されるだろうという下心。
統計検定1級試験って何?
午前の「統計数理」と午後の「統計応用」の2つの試験により構成されています。両試験をそれぞれ合格して1級合格となります。
「統計応用」は4分野あり、試験の申し込み時点で1つを選択する必要があります。
(私は仮想通貨などの自動売買を将来的にやりたいので時系列分析のある(社会科学)分野を選択しました!)
毎年1回しか行われないため、不合格になると『もう1年遊べるドン』です。
試験範囲は分野が分かれているため準1級より狭く感じますが、難易度は準1級よりかなり厳しい試験です。準1級は記号選択や答えの値のみを記入するのに対して、1級は解答の過程を記述します。合格点については分からないのですが、感覚的に半分くらい取れば合格できると思いました。これは推測ですが、他の参加者との兼ね合いで合格点が決まっているような気がします。
詳細は公式で確認ください。 統計検定1級|統計検定:Japan Statistical Society Certificate (toukei-kentei.jp)
1級の試験勉強
勉強時間は120hrでした。
(準1級までの勉強は180hrですので、累計300hrです! 準1級までの勉強方法を知りたい方は私のブログをご参考に!)
やったことは単純です。
過去問を解く→解説を読む→参考書を読む
これの繰り返しです。
以下にそれぞれ記します。
過去問を解く
5年分(2016,2017,2018,2019,2021)をそれぞれ5周以上やった気がします。初めて解く時はじっくり考えましたが、そもそも試験時間が短いため熟考はしている場合じゃないと思い、問題1つあたり10minで解くことを心掛けました。そうすることで、過去問と戯れる回数を増やしました。
解説を読む
ブログなどを漁りましたが、やっぱり解説は公式本が最強でした!2016~2019の4年分は下記の公式参考書にお世話になりました。
2021年に関しては、下のブログを参考にしました!
解説を読むときも時間を意識しました。30min以上考えても理解できない時は、一旦寝かせて再トライした方がタイパが良いと判断したので、ある程度深く考えたら潔く次に進むようにしました。
参考書を読む
毎回躓く箇所や理解度が低い分野に関しては、参考書を読むようにしました。過去問の解説は分かりやすいのですが、行間の省かれている所が多いので参考書はあった方がよいと思います。使っていたのは下の3つです。
時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装
上の2冊のカバーしている内容は近いですが、片方にしかないことや、同じ内容でも見比べてみると理解が進みやすいと思いました。また3冊目は時系列分析を学ぶのには最高の本でした。3冊とも読みやすい本です。
ちなみに、私の理解が甘いと思ったところをピックアップしました。これらの概念に対して自信を持てるころには、統計数理は合格できると思います。
- t検定
- ヤコビアン
- 十分統計量
- 条件付き同時確率密度関数
- 最強力検定
- 事後確率密度関数
- 標本抽出
- ラグランジュの未定乗数法
- EMアルゴリズム
- カイ二乗分布
- ガンマ関数
- デルタ法
- 条件付き期待値、分散
- 同時確率密度関数
- 定常性
- 対数正規分布
- 中心極限定理
- 最小二乗法
- バイアス
- 一元配置分散分析
- 分散共分散行列
試験本番
午前と午後の両試験とも5問ずつ出題されますが、3問しか解答できません。90minという短い時間で解答するには、先に全問題を確認して優先順位と解答時間を計画しながら進めるのが良いと思います。以下、試験の感想です。
午前 統計数理
問1 包除原理など競プロで培われた能力を発揮した、はず! 自分にとってサービス問題でした。
問2 初めて見るタイプの問題でひるんだ。問題はシンプルっぽいので、解いたことがあれば手を付けてたかもしれないけど、パス。
問3 (1)(2)はそれぞれポアソン分布とガンマ分布の期待値および分散だから、いけるだろうと選択した。しかし、(3)~(5)はちんぷんかんぷん
問4 γの値によって期待値や分散が発散するって解釈したんだけどどうなんだろう?
問5 ぱっとみて何をしたい問題か分からなかったのでパス。
午後 統計応用(社会科学)
問1 多分難しい問題ではないと思うんだけど、πの意味が理解しきれなかったのでパス。
問2 2016統計応用(社会科学)問2とほぼ同じ問題だからそれなりに解けたと思う。
問3 時系列では見たことない式が出てきたので拒否反応でパス。
問4 まさかの時系列2つ目に驚いた。こっちの方が(1)は簡単でとっつきやすそうと解き始めたものの、4つおきの周期についてどう考えればよいか分からず、(2)~(4)は苦戦。
問5 平均への回帰問題!ベイズとか同時確率密度関数とかの知識で何とか解けそうだったものの、時間が足りず。こっちに時間を回せばよかったと後悔。
そもそもの解答量自体が両方とも6割くらいだった。全然時間足りないし、難しい!
会場について
2割くらいの空席があり、1つの長机に1人だけ座る感じなので、広々とした環境。ほとんど男性で、おにいさんからおじさんまで幅広く網羅って感じでした。初めて見る人たちなのに集団になると凄い既視感。
試験結果
統計数理は不合格(不合格者の内上位20%以内)、統計応用は合格でした!
得点の内訳は明記されておりませんでした。
ぶっちゃけ落ちると思っていたので、合格したのは嬉しかったのですが、1級合格の惜しい所まで来ていたと知ると何だか叫びたくなる気持ちが込み上げてきました。
反省点
勉強はやればやるだけ良い!
合格に足りなかったのは勉強時間でした。「ギリギリ受かればいいや」とか「コスパよく受かりたい」とか邪念に飲まれて甘えた考えを持っていた気がします。そもそも、ギリギリ合格した人と最優秀合格した人で能力が同じわけがないわけで、将来的には後者の方が圧倒的に楽になるわけで、そう考えると試験勉強はやればやるだけ良いという結論に至りました!!いつも自分の勉強計画は甘いので、想定の2倍頑張るようにする。
反復反復反復!
どの過去問も初見は厳しすぎて、本当にこの試験は受かるのかと絶望していました。しかし、同じ問題を何回も何回も挑戦するうちに、問いに深く潜れるようになりました。問題文自体は変わってないのですが、思考と休憩の反復によって統計学への理解が徐々に深まりました。
会場に余裕を持って早く着いても、待つ場所がなかった
1時間早く着いてどうしようもなくブラブラ近くを徘徊するしかなかったので、20min前くらいに到着するように調整した方がよい。昼は一度外に出される。色々運営側の手際が悪かったのでトイレは先に済ませるとか昼ご飯は買っておくなど、何かシミュレーションしておいた方が良いかも。自分は寒空の下おにぎりを食べて参考書を読む変な人になりきっていた。
今から統計検定1級の勉強を始める人のロードマップを考えてみた
まずは、準1級(せめて2級)のレベルに達する! 参考:私のブログ
次に統計検定1級の過去問をひたすら解く!幅広く解いた方が良いと思うので、できれば全年分!目安は過去問累計100問 or 200hrです。これは感覚的な所ですが、他の方のブログを見る限りでも素人は数百時間単位の勉強が必要かなと思います。
解けない問題が溜まり続けて爆発しそうになったら、評判の本を買って読む!
確実に8割解けるという自信が出るまで止まらない!
1年前の自分に出会ったら以上を伝えます。
感想
準1級を受けたときと比べると、統計についての知識は深くなっていましたが、まだまだでした。初めて見るというだけで問題を避けたくなる時点で応用力がない証なので。また、試験問題を解く感覚がパズルを解く感覚に似ていて、どの式を組み合わせて式変形をしようかに注力してる時点でなんだかなぁと。もっとこう、分布がどう広がっていて、どこが尖ってて、だからこの式に当てはめてみたいにイメージができるようになりたいと切実に思います。
トレードや機械学習関連の本を読む時の抵抗は薄まり、内容についてかなり認識できるようにはなりました。昔は難しいので勝手に脳が飛ばしていた所も引っかかるようになったり、文章からすぐ脳内に図が描かれたりとかなりレベルは上がった気はします。
皆さんの統計検定1級の勉強の一助になれば幸いです。
コメント