E-統計学

慶應通信の履歴

2019年4月入学(73期) 法学部甲類(法律学)
→2022年9月卒業
単位 130/124
GPA 2.83

※科目名の右側の数字は単位数。「英語Ⅰ2」なら2単位

[総合教育科目(済)]48/48(スク8/8)
特別課程：18単位認定
<外国語(済)>
英語Ⅰ 2 S 2019年第Ⅱ回
英語Ⅱ 2 A 2021年第Ⅳ回
英語Ⅲ 2 C 2019年第Ⅱ回
英語Ⅶ 2 B 2019年第Ⅱ回
英語リーディング 1 A 2020年春週末スク
英語ライティング 1 S 2020年夏スク
<人文科学(済)>
~~論理学 4 A 2019年第Ⅱ回~~（諦めました)
哲学 4 C 2019年第Ⅳ回
<社会科学(済)>
法学 4 B 2019年第Ⅱ回
社会学 4 B 2019年第Ⅳ回
E-政治学 2 A 2020年秋Eスク
<自然科学(済)>
数学(微分積分) 2 C 2019年第Ⅳ回
数学(線形数学) 2 C 2020年第Ⅲ回
E-統計学 2 A 2020年春Eスク
心理学(行動・個性) 2 A 2020年夏スク

[専門科目(済)]68/68(スク14/14)
<配本1年目(済)>
債権総論 3 S 2019年第Ⅳ回
新民法総論 3 S 2019年第Ⅳ回
憲法 4 A 2020年第Ⅰ回
<配本2年目(済)>
刑法総論 3 A 2020年第Ⅱ回
刑法各論 4 B 2020年第Ⅱ回
国際法Ⅱ 2 A 2020年第Ⅱ回
物権法3 B 2020年第Ⅲ回
新会社法 4 A 2020年第Ⅲ回
~~債権各論 3 S 2020年第Ⅳ回~~ (諦めました)
英米法 2 S 2020年第Ⅳ回
労働法 2 S 2021年第Ⅰ回
新商法総則商行為法 2 B 2021年第Ⅰ回
刑事政策学 2 A 2021年第Ⅰ回
現代中国論 2 S 2021年第Ⅰ回
政治思想史 4 B 2021年第Ⅲ回
ヨーロッパ中世政治思想 2 B 2021年第Ⅳ回
<配本3年目(済)>
親族法 1 S 2021年第Ⅱ回
相続法 1 A 2021年第Ⅱ回
法哲学 2 S 2021年第Ⅱ回
刑事訴訟法 4 A 2021年第Ⅱ回
政治哲学 2 A 2021年第Ⅱ回
経済原論(ミクロ) 2 S 2021年第Ⅲ回
経済原論(マクロ) 2 C 2021年第Ⅲ回

<スクーリング(済)> 通学12 Eスク2
医事法 2 A 2019年夏スク
国際法 2 A 2019年週末スク
刑事政策学 2 B 2020年夏スク
政治理論 2 A 2020年夏スク
心理学(専門) 2 S 2020年秋週末スク
E-政治思想論 2 B 2020秋Eスク
図書館情報学 2 S 2021春スク
哲学(専門) 2 S2021夜スク

[卒業論文]8/8
2020年10月末本指導1回目
2021年5月本指導2回目
同日 2022年3月卒業予定申告書提出許可
2022年6月本指導3回目・提出許可
2022年7月卒論提出
2022年9月卒業試験

[履歴]
2019年度(済)
<第Ⅱ回(済)>
英語Ⅰ2法学4英語Ⅶ2英語Ⅲ2~~(論理学4)~~
<第Ⅲ回(済)>
科目試験中止
(夏スク)医事法2
(週末スク)国際法2
<第Ⅳ回(済)>
哲学4新民法総論3微分積分2債権総論3社会学4
30単位

2020年度(済)
<第Ⅰ回(済)>
憲法4
(中止)TOEIC受験 3月
<第Ⅱ回(済)>
刑法総論3刑法各論4国際法Ⅱ2
(Eスク)E-統計学2
(春スク)英語リーディング1
(中止)TOEIC受験 5月
<第Ⅲ回(済)>
新会社法4物権法3線形数学2
卒論構想提出 8月
(夏スク)英語ライティング1心理学行動個性2刑事政策学2政治理論2
TOEIC受験 9/13 885点
<第Ⅳ回(済)>
英米法2~~債権各論3~~
(Eスク)E-政治学2E-政治思想論2
(秋スク)心理学専門2
卒論本指導1回目 10月末
TOEIC受験 1/10 午前 970点
40単位

2021年度(済)
<第Ⅰ回(済)>
労働法2新商法総則商行為法2刑事政策学2現代中国論2
卒論目次と参考文献
<第Ⅱ回(済)>
相続法1親族法1法哲学2刑事訴訟法4政治哲学2
(春スク)図書館情報学2
卒論本指導2回目 5月
卒業予定申告書提出許可
<第Ⅲ回(済)>
育児のため8-9月は低稼働、卒論指導は見送り
政治思想史4経済原論(ミクロ)2経済原論(マクロ)2
<第Ⅳ回(済)>
(夜スク)哲学(専門)2
英語Ⅱ2ヨーロッパ中世政治思想2
34単位

2022年度(済)
卒論第1稿完成 4月
卒論本指導3回目 6月
卒論最終稿完成・提出 7月
卒業試験8 9月
卒業 10月
卒業式 3月
8/8単位

放送大学履歴・予定

2021年4月～科目履修
2022年4月～全科履修情報コース
単位 103/124
GPA 3.40 (Ⓐ29 A10 B6 C2 合計47)

3年時編入認定：48単位

[除籍前取得単位] 12単位
世界の名作を読む(’07) 2 B
数学基礎論(’08) 2 Ⓐ
地球のダイナミクス(’10) 2 A
食品の安全性を考える(’08) 2 Ⓐ
現代経済学(’09) 2 Ⓐ
バイオテクノロジーと社会(’09) 2 Ⓐ

[2021年1学期(済)]
ＡＩシステムと人・社会との関係(’20) 2 Ⓐ
小学校プログラミング教育概論(’21) 1 Ⓐ
3単位

[2021年2学期(済)]
著作権法(’18) 2 Ⓐ
2単位

[2022年1学期(済)]
全科履修再入学
計算の科学と手引き(’19) 2 A
コンピュータとソフトウェア(’18) 2 A
アルゴリズムとプログラミング(’20) 2 Ⓐ
情報セキュリティ概論(’22) 2 B
データ構造とプログラミング(’18) 2 Ⓐ
コンピュータの動作と管理(’17) 2 Ⓐ
データの分析と知識発見(’20) 2 A
自然言語処理(’19) 2 Ⓐ
webのしくみと応用(’19) 2 Ⓐ
データベース(’17) 2 Ⓐ
統計学(’19) 2 Ⓐ
コンピュータ通信概論(’20) 2 Ⓐ
24単位

[2022年2学期](済)
映像コンテンツの制作技術(’20) 2 Ⓐ
力と運動の物理(’19) 2 C
現代フランス哲学に学ぶ(’17) 2 A
幼児理解の理論及び方法(’15)(OL) 1 Ⓐ
物理と科学のための数学(’21)(OL) 1Ⓐ
8単位

[2023年1学期](済)
微分方程式(’23) B
西洋哲学の根源(’22) 2 C
全体主義と新自由主義のあいだ(’23)(OL) 1 A
6単位

[2023年2学期]
原初から／への思索(’22) 2
日本政治思想史(’21) 2
現代に生きる現象学(’23) 2
日本仏教を捉え直す(’18) 2
英米哲学の挑戦(’23) 2
量子物理学(’21) 2
財政と現代の経済社会(’19) 2
場と時間空間の物理(’20) 2
日本語リテラシー(’21) 2
日本語アカデミックライティング(’22) 2
日本語リテラシー演習(’18) (OL) 1
生活環境情報の表現－ＧＩＳ入門(’20) (OL) 1
時間を究める(’23) (OL) 1
23単位
→卒業へ

[[レビュー]]
- 試験？
- 課題 ★★★☆☆
- 秋山裕先生
- なんとテキスト科目のテキストをそのまま使用するという、非常にリーズナブルな授業。単位も半分と、テキスト統計学の短縮版と思われる。データの読み方から、正規分布～中心極限定理～[[仮説検定]]～回帰分析まで。excelの使い方を詳細に解説してくれており、神excelの使い手に一歩近づける。
以下では講義のまとめをします
第9回 [[仮説検定]]
- 仮説検定では分布の変化を評価し、主張の検証を行う
  - 主張が統計学的にデータから支持されるかどうかを検証する
- [[仮説検定]]の手続き
  - 仮説の設定
    - 「今までと変わらない」[帰無仮説]と「今までと変わった」[対立仮説]にするのが基本
    - 例)今学期の平均点を65点として、H0:μ=65、H1:μ>65
  - 帰無仮説(H0:μ=65)が正しいとして分布を考え、得られた標本の平均(xb=70)がその分布の中で発生しにくいかどうかを考える。発生しにくければ対立仮説を支持する。#br
    帰無仮説を正しいと考えるのは、対立仮説(H1:μ>65)を証明するのが大変だから。
  - 帰無仮説に基づく分布の決定
    - 標本の平均、標準偏差から、[[中心極限定理]]に基づき標本平均の分布を計算する。平均＝標本の平均、標準偏差＝標本の標準偏差/√n
    - 検定統計量は[[標準化]]して[[標準正規分布]]にする。
  - [[有意水準]]の決定
    - [[有意水準]]とは、得られた標本平均が分布の中で「発生しにくい」と判断する確率のこと
    - 社会科学では一般に5%が用いられる。
  - [[棄却域]]の設定
    - [[有意水準]]の領域の範囲を求めることを[[棄却域]]の設定という。
      - 例えば対立仮説が「先学期の平均65点より高い」であれば、得られた標本平均が発生しにくいほど大きいければ対立仮説が支持されるので、[[棄却域]]は分布の右端になる。
      - 有意水準が大きければ、[[棄却域]]も大きい
      - [[標準化]]後なら、「z>NORM.S.INV(1-有意水準)」が[[棄却域]]となる
  - 検定の結論
    - 計算した検定統計量が[[棄却域]]に入っていれば「発生しにくい量」であると示されたことになる
    - 発生しにくいことが起こったならば
      - [[帰無仮説]]は棄却、[[対立仮説]]を採択
      - 「有意水準?%で対立仮説が起こった」と結論できる
    - [[棄却域]]に入っていなければ、[[帰無仮説]]を採択することになる（[[対立仮説]]を棄却する、とは言わない）
- 平均に関する検定における標準正規分布と[[t分布]]
  - 母集団の標準偏差が分からない場合は、標本の標準偏差で代用しなければならないが、[[標準正規分布]]を用いることができないので、代わりに[[t分布]]を使う
    - 統計量が正規分布に従うと仮定しないといけない
  - [[棄却域]]は「T.INV(有意水準,n-1)」で求められる
- [[P値]]による検定
  - 計算した検定統計量よりも大きく（小さく）なる確率を[[P値]]という
  - [[P値]]が[[有意水準]]より小さければ[[対立仮説]]を採択、大きければ[[帰無仮説]]を採択し、結論できる
  - 具体的には右片側検定なら「1-NORM.S.DIST(標準化した検定統計量)」左片側検定なら「1-T.DIST(標準化した検定統計量)」が有意水準より小さいかどうかで判断すればいい
- 割合に関する検定
  - 仮説の設定を H0:p=0.5, H1:p>0.5 のように行って同様に計算する
  - 検定統計量は[[区間推定]]で計算したように z=(pt-p)/√(p(1-p)/n) で計算する。
  - 同様に「1-NORM.S.DIST(標準化した検定統計量)」「1-T.DIST(標準化した検定統計量)」が有意水準より小さいかどうかで判断
  - 例)n=300人に対してx=171人がA候補者に投票した場合
    - 得票率pt=57% より z=2.42487, NORM.S.DIST(z,true)=0.99234より p(z > 2.42487) = 0.00766 よって[[有意水準]]1%でA候補は当選確実である
- [[第I種の過誤]]、[[第II種の過誤]]
  - 仮説検定による結論は誤りである場合がある
  - [[第I種の過誤]]は、帰無仮説H0が正しいのに棄却してしまう誤り。
  - [[第II種の過誤]]は、対立仮説H1が正しいのに、帰無仮説H0を採択してしまう誤り。
  - いずれも、結論と事実が棄却域の反対側にある場合に起きる誤りのこと。
  - 過誤をなくすためには、有意水準を小さくしてやればいい
第10回相関分析
- 変化が起こったとき、なぜその変化が起こったのかを明らかにする
- [[散布図]]
  - 2つの変数の関係を視覚的にとらえられる
  - [[Excel]]では「挿入」「グラフ」「散布図」で作成可能
- [[共分散]]
  - 関係の方向と関係の強さを数値で表現したもの
  - 右上がりならプラス、右下がりならマイナス、関係が強ければ絶対値大、関係が弱ければ絶対値小
  - 平均を軸として考える
    - 第1象限・第3象限に各点が散らばっていれば正の相関
    - 第2象限・第4象限に散らばっていれば負の相関
    - 傾向がみられなければ各象限に散らばる
    - ↑共分散でなぜ$$(x-\overline{x})(y-\overline{y})$$の平均を求めるのか、の理由
  - [[Excel]]ではCOVARIANCE.Sを使って求める
  - 値は単位の二乗になり、プラスマイナスくらいしか判断できないので、[[相関係数]]を使うことが多い
- [[相関係数]]
  - z_{x_i} = \frac{x_i-\overline{x}}{s_x}のように変換して[[標準化]]する。
    - 標準化した変数は単位なしになる。
  - $z_x$ と $z_y$ の[[共分散]] $cov_{z_xz_y}$ を使って、相関係数 $ρ_{xy}$ は次のように表せる。
  - $ρ_{xy} = \frac{cov_{z_xz_y}}{s_xs_y}$
  - 必ず-1～1の間になるので扱いやすい
  - [[Excel]]ではCORRELで求められる
  - みせかけの相関
    - アイスクリームとビールの消費量のように、共通するほかの変数（気温z）が影響している場合でも[[相関係数]]は大きくなる
    - 鵜呑みにしてはだめ
  - [[相関係数]]と線形
    - 相関係数は線形関係の強さを数値化したもので、非線形の関係の分析はできない
    - $y=x^2$ の相関係数は0
- [[順位相関係数]]
  - 極端に離れた値があると相関係数が大きく変わる（分布の歪み）
  - 歪んだ分布についての尺度として、[[順位相関係数]]がある
  - xとyのそれぞれを順位付けし、順位について相関係数を求める
  - [[Excel]]ではRANK.AVGを使って求める
- 株と相関係数
  - [[相関係数]]がマイナスとなる株を組み合わせると、[[標準偏差]]が非常に小さくなり、リスク回避ができる
第11回 [[回帰分析]]・[[最小二乗法]]
- [[相関係数]]からは、2つの変数に関係があることはわかるが、原因と結果の関係性が分からない
- [[回帰分析]]によって、2つの変数の関係を示す式を推定する
- y = \alpha + \beta x
  - $y :$ 被説明変数
  - $x :$ 説明変数
  - $\alpha :$ 回帰係数：定数項・切片
  - $\beta :$ 回帰係数：傾き・勾配
  - 変数が1つの場合は単純回帰（単回帰）という。複数の場合は重回帰という。
- [[誤差]]
  - [[誤差]]は縦方向に測る。誤差を $u_i$ とすると $y_i = α + βx_i + u_i$
  - 推定式を $\hat{y_i} = \hat{α} + \hat{β}x_i$ とすると、誤差を $e_i$ として $y_i = \hat{α} + \hat{β}x_i + e_i$ と表せる
- [[最小二乗法]]
  - $y_i = \hat{α} + \hat{β}x_i + e_i$ の誤差 $e_i$ の２乗の和を最小にするように $\hat{α}$ と $\hat{β}$ を求める
  - 誤差 e_i = y_i - (\hat{α} + \hat{β}x_i) の2乗の和をとって偏微分 = 0を解くと
    - $\hat{\beta} = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sum(x_i - \bar{x})^2}$
    - $\hat{\alpha} = \bar{y} - \beta \hat{x}$
  - [[Excel]]では SLOPE と INTERCEPT で求められる。[[散布図]]→近似曲線の追加でもできる。
- [[標準誤差]]
  - [[誤差]]が小さければ信頼度が高く、誤差が大きければ信頼度が低い
  - 標準誤差 s = \sqrt{\frac{1}{n-2}\sum_{i=1}^{n} e_i^2}
    - n-2で割るのは、実質的なデータの数がn-2だから。n=1では直線が引けず、n=2だと誤差が0になる。
    - √をとるのは単位をそろえるため。
    - [[Excel]]では STEYX を使って求める。
  - 標準誤差は見ただけでは何を表しているのかよくわからないので、[[決定係数]]が広く利用されている
- [[決定係数]]
  - \sum e_i^2 = \sum (y_i - \bar{y})^2 - \sum (\hat{y}_i -\bar{y})^2
    - $$y_i$$ : 実績値、 $$\hat{y}_i$$ : 回帰分析による理論値
  - 移項して $$\sum (y_i – \bar{y})^2 = \sum (\hat{y}_i -\bar{y})^2 + \sum e_i^2$$
  - 全平方和 = 回帰による平方和 + 残差平方和
  - 信頼度が高いとき、回帰の平方和：大、残差平方和：小
  - 信頼度が低いとき、回帰の平方和：小、残差平方和：大
  - [[決定係数]]は全平方和に対する回帰による平方和の比率で表す。
    - $$r^2 = \frac{\sum_{i=1}^{n}(\hat{y}i – \bar{y})^2}{\sum{i=1}^{n}(y_i – \bar{y})^2}$$
    - 必ず0～1の間になる。0なら説明していない、1なら完全に説明している。
    - 相関係数の2乗と等しい
    - [[Excel]]では RSQ で求める
- 回帰分析という名前はゴルトン(1822-1911)によるもの。因果分析という名称の方が適切。
第12回 [[回帰分析]]・[[信頼区間の推定]]と[[仮説検定]]
- 回帰分析で得られた直線の信頼度は[[決定係数]] $$r^2$$ の大きさだけではわかりにくい
- [[最小二乗法]]で推定した式 $$y = \hat{\alpha} + \hat{\beta}x $$ の $$\hat{\alpha}$$ と $$\hat{\beta}$$ の分布を考える
- $$\hat{\alpha}$$ と $$\hat{\beta}$$ の散らばりが大きければ信頼できないし、散らばりが小さければ信頼できる
- 標本n個を抽出するごとに$$\hat{\alpha}$$ と $$\hat{\beta}$$が1つ決まる。そこで、[[中心極限定理]] で $$\hat{\beta}$$ の分布を考える
- $$\hat{\beta}$$ の分布
  - いくつかの仮定が成立するとき、 $$y = \alpha + \beta x + u $$ の母集団から大きさ n の標本を抽出したときの回帰係数 $$\hat{\beta}$$ は平均 $$\beta$$、標準偏差 $$s{\hat{\beta}} = \frac{s}{\sum{i=1}^{n} (xi – \bar{x})^2}$$ の分布に従い、$$t = \frac{\hat{\beta} – \beta}{s{\hat{\beta}}}$$ は自由度 n-2 の [[t分布]]に従う。
    - 5つの仮定：誤差に偏りがない、誤差同士に関係がない、誤差の平均の大きさは一定、説明変数と誤さに関係がない、誤差が正規分布に従う（要するに、誤差がランダムの時にだけ成立する）
    - 古典的[[最小二乗法]]という
- $$\hat{\beta}$$ の[[信頼区間の推定]]
  - [[t分布]]について$$-t{\alpha /2}～t{\alpha /2}$$ に $$(1-\alpha) * 100(％)$$の領域を考える
    - $$P(\hat{\beta} – t{\alpha /2} s{\hat{\beta}} < \beta < \hat{\beta} + t{\alpha /2} s{\hat{\beta}} ) = 1 – \alpha$$ という形になる。
  - Excelでは、T.INV(1-α/2, n-2) で $$t{\alpha/2}$$を求め、sは STEYX 、$$\sum{i=1}^{n} (xi – \bar{x})^2$$は DEVSQ で求めて割り、 $$s{\hat{\beta}}$$ を求める。
  - LINEST 関数で回帰分析に必要な様々な値を求められる。計算結果を置く範囲指定後にCtrl+Shift+Returnを押す
- $$β$$ の[[仮説検定]]
  - tが[[自由度]] n-2 の[[t分布]]に従うことを利用して仮説検定を行える
  - $$y = \alpha + \beta x$$ の $$\beta$$ の検定については、次の仮説に関する検定([[有意性検定]])が広く行われている
    - $$H_0 : \beta = 0$$ (xが消え、yの大きさの決定にxが有意でなくなる)
    - $$H_1 : \beta \neq 0$$ (yの大きさの決定にxが有意である)
  - 帰無仮説$$H_0$$が正しいときに標本データから求めた$$\hat{\beta}$$が発生しにくいと判断する領域は、プラスとマイナス側の両方になる。tでも同様。
  - [[有意水準]]5%、n=4なら、T.INV(0.975,2) = 4.303より、棄却域はt > 4.303とt < -4.303 となる
  - 検定統計量 $$t = \frac{\hat{\beta} – \beta}{s_{\hat{\beta}}} (\beta = 0)$$ が[[棄却域]]に入った→帰無仮説が発生しにくい→帰無仮説を棄却、対立仮説を支持（棄却域に入れば影響ありと判断する）
- [[P値]]による[[仮説検定]]
  - 検定統計量 $$t = \frac{\hat{\beta} – \beta}{s_{\hat{\beta}}}$$ を計算し、*T.DIST(t, n-2, true) 2** が有意水準より小さければ[[帰無仮説]]棄却
    - T.DISTに2をかけるのは両端に棄却域があるから

六帖のかたすみ

六帖のかたすみ

生きろ

第9回 [[仮説検定]]

第10回相関分析

$ρ_{xy} = \frac{cov_{z_xz_y}}{s_xs_y}$

第11回 [[回帰分析]]・[[最小二乗法]]

第12回 [[回帰分析]]・[[信頼区間の推定]]と[[仮説検定]]

コメントを残すコメントをキャンセル

六帖のかたすみ

第9回 [[仮説検定]]

第10回 相関分析

ρ_{xy} = \frac{cov_{z_xz_y}}{s_xs_y}

第11回 [[回帰分析]]・[[最小二乗法]]

第12回 [[回帰分析]]・[[信頼区間の推定]]と[[仮説検定]]

コメントを残す コメントをキャンセル

第10回相関分析

$ρ_{xy} = \frac{cov_{z_xz_y}}{s_xs_y}$

コメントを残すコメントをキャンセル