統計

【統計】尤度と最尤推定量

尤度推定のお勉強 【目次】 尤度と最尤推定量 尤度と確率 簡単な図解 参考 尤度と最尤推定量 最尤推定法は、標本から母集団のパラメータを点推定する方法(母集団の分布は既知)。 得られた標本を (独立同一分布に従う)、推定したいパラメータを とすると…

【統計】生存時間解析 ハザード関数、生存関数などの関係性

生存時間解析ではハザード関数、生存関数など色々な関数が出てくるので関係性をメモ。頭の整理。 離散値の場合 確率密度関数 死亡関数 生存関数 ハザード関数 累積ハザード関数 (イメージ図) * 縦軸が確率密度関数 f (T)、横軸が時間 T * 死亡関数 F(t)=…

【統計】生存時間解析 ログランク検定、一般化Wilcoxon検定(Gehan's Wilcoxon検定)等

ログランク検定、重み付きログランク検定たちについてのメモ。 【目次】 計算式等 ノート サンプルデータ まずは手計算してみる SASでの実行 Rでの実行 プログラムコード 参考 前回のKaplan-meier 法に続く内容。 cochineal19.hatenablog.com 計算式等 先に…

【統計】生存時間解析 カプランマイヤー法(Kaplan-meier method)

カプランマイヤー法(Kaplan-meier method)についてのメモ。 【目次】 計算式等 ノート 打ち切りとは サンプルデータ 手計算してみる Rでの実行 SASでの実行 プログラムコード 参考 累積生存率とその信頼区間について記載する。 信頼区間はRで扱えるPlain(…

【統計】時系列分析(ARIMA、SARIMA、SARIMAXをRで実行する)

ARIMA、SARIMA、SARIMAXモデルをRで試してみる。 【目次】 用意したデータ データ加工 観測値の時系列の描画 単位根の検定 ARIMAモデルの実行 SARIMAモデルの実行 SARIMAXモデルの実行 モデルの比較 おわりに 参考 用意したデータ 今回、横浜市の月別火災発…

【統計】時系列分析(AR、MA、ARMA、ARIMA、SARIMA、ARIMAXモデル)

本記事は、AR、MA、ARMA、ARIMA、SARIMA、ARIMAXモデル等の特徴について。 【目次】 計算式等 ノート 参考 計算式等 < 前提> ■ 弱定常性(Weakly stationary) 時系列の期待値、分散および自己共分散が常に一定である状態(時点 t および k に依存しない状…

【統計】時系列分析(自己相関、自己共分散)

自己相関、自己共分散について、視覚的に分かるようにメモ。 【目次】 計算式 ノート 参考 自己相関、「自己」とつくので、ちょっと分かりづらい。 計算式 ■ 自己共分散 ■ 自己相関 ※t=時期、s=ラグ ノート サンプルデータで動きを見てみる。 Rで準備したデ…

【統計】共分散分析(ANCOVA)

本記事では、共分散分析について記載します。 【目次】 帰無仮説、対立仮設 計算式等 プログラムコード 雑談 参考 共分散分析は、分散分析と重回帰分析を組み合わせた手法と言われます。分散分析では説明変数に集団などカテゴリー変数(要因)のみを投入しま…

【統計】二元配置分散分析(Two-way ANOVA)

本記事では二元配置分散分析(Two-way ANOVA)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 前回の 一元配置分散分析 は1要因に対する分析手法でした。2要因の場合は、二元配置分散分析を用います。※本…

【統計】ロジスティック回帰分析(ホスマー・レメショウ検定、ROC、AUC等)

本記事では、ロジスティック回帰の評価について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 前回記事で理論部分を取り扱いましたが、続きでモデルの評価方法を取り扱います。 cochineal19.hatenablog.com 計算式等 モデル評価には、…

【統計】ロジスティック回帰分析

本記事では、ロジスティック回帰分析について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 今回はモデル作成までです。モデルの評価は別記事で扱います。 計算式等 ロジスティック回帰は二値分類()で用いられる分析手法です。モデル…

【統計】重回帰分析

本記事では、重回帰分析について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 単回帰分析については次の記事を参照ください。 cochineal19.hatenablog.com 計算式等 重回帰分析は、多変量 { } の関係を直線で求める分析方法です。モデ…

【統計】単回帰分析

本記事では、単回帰分析について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 計算式等 単回帰分析は、2変量 {x,y} の関係を直線(一次式)で求める分析方法です。モデル、式は次のとおりです。 ■ 単回帰モデル ■ 単回帰式 は切片(i…

【統計】連関係数(ファイ、ピアソン、クラメール)

本記事では、クロス表の連関係数について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 計算式等 次のクロス表で考えます。 Outcome Total 0 1 Factor 1 a b AB 2 c d CD Total AC BD N ファイ係数(Phi coefficient) -1~1の値を取…

【統計】相関係数(ピアソン、スピアマン、ケンドール)

本記事では、相関係数について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 計算式等 2変量を x, y とし、x の順位を z、y の順位を w として考えます。タイ(同一順位)は平均順位を用います。 ピアソンの積率相関係数(Pearson prod…

【統計】クラスカル・ウォリス検定(Kruskal-Wallis test)

本記事では、クラスカル・ウォリス検定(Kruskal-Wallis test)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 Wilcoxonの順位和検定とマンホイットニーのU検定(以降、Wicoxonの順位和検定等と言います)に…

【統計】Wilcoxonの順位和検定とマンホイットニーのU検定

本記事では、Wilcoxonの順位和検定(Wilcoxon rank sum test)とマンホイットニーのU検定(Mann–Whitney U test)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 両方とも2標本の分布の位置のズレを評価す…

【統計】コクラン-アーミテージ検定(Cochran-Armitage test)

本記事では、Cochran-Armitage test(コクラン-アーミテージ検定またはCA検定)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 CA検定は、割合の増加/減少傾向を評価する傾向性の検定です。 検定の中身は、…

【統計】マンテル・ヘンツェルの検定(Mantel-Haenszel test, Cochran-Mantel-Haenszel test)

本記事では、マンテル・ヘンツェルの検定(Mantel-Haenszel test)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 マンテル・ヘンツェルの検定は、 検定やFisher's Exact testと同じく、カテゴリーデータの…

【統計】Fisher's exact test

本記事では、Fisher's exact testについて記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 Fisher's Exact testは 検定と同じく、カテゴリーデータの独立性を評価する手法です。 cochineal19.hatenablog.com 本手法は…

【統計】χ二乗検定

本記事では、独立性の 検定について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 検定はカテゴリデータのクロス表(分割表、クロステーブル)で用いられる検定です。 帰無仮説、対立仮設 帰無仮説 対立仮設 要因と…

【統計】ヨンキー検定(傾向性検定)

本記事では、傾向性検定(ヨンキー検定)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 Jonckheere-Terpstra trend test(ヨンクヒール-タプストラ検定、またはヨンキー検定)は目的変数が連続値の時に使用…

【統計】一元配置分散分析(One-way ANOVA)

本記事では一元配置分散分析(One-way ANOVA)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 前回の t検定 は2群の平均の差を評価するものでした。3群以上の場合は、分散分析(ANOVA:ANalysis Of VArian…

【統計】t検定

本記事では、2標本の平均の差の検定(t検定)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 参考 帰無仮説、対立仮設 帰無仮説 対立仮設 群間の平均に差があるかどうかを評価します。帰無仮設の「群aと群bの平均に差…

【SQL Server】基本統計量の算出(特に中央値!percentile_cont関数、percentile_disc関数)

タイトル通り、基本統計量の算出方法です。SQL Serverには、中央値を算出するmedian関数はありません ... (同じMicrosoftのExcelにはあるのに ...)(SASのproc sqlではmedian関数が使えるのに ...)とがっかりしましたが、どうやらpercentile_cont関数で対…

本ブログは個人メモです。 本ブログの内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。