R、R Studio

【統計】一般化線形混合モデル(GLMM)

一般化線形混合モデル (Generalized Linear Mixed Model, GLMM) の備忘録。 一般化線形モデル (Generalized Linear Model, GLM) との違いだったり、SAS や R での使い方だったり。 GLM と GLMM GLM GLMM SAS (proc mixed) R (lmer, nlme) 参考 GLM と GLMM G…

【SAS】glmselectプロシジャ_Lasso回帰、ElasticNet回帰

前回 hpgenselect プロシジャで罰則付きロジスティック回帰を実行してみた。 【SAS】hpgenselect プロシジャ_罰則付きロジスティック回帰(LASSO) - こちにぃるの日記 目的変数が連続値の時のLASSO回帰をやってなかったのでまとめてみる。 ついでにElasticN…

【SAS】hpgenselect プロシジャ_罰則付きロジスティック回帰(LASSO)

特徴量選択でSTEPWISE法などのほか、LASSO(L1正則化)を視野に入れる人もいる(だろう)。 LASSOについては以前 Python の記事で触れた。 cochineal19.hatenablog.com 今回は「SASで使ったみたい」&「ロジスティック回帰で使ってみたい」という視点でまと…

【R】ggplot:対応のあるデータの推移図 + 2つの座標点の角度を求める

対応のあるデータを線でつないで増減をみるグラフを作りたくなったのでメモ。 サンプルデータ library(tidyverse) ads <- data.frame(id=(1:5) ,x=c(9,6,3,8,7) ,y=c(5,1,2,4,1) ,z=c(8,7,9,5,2)) ads2 <- data.frame() for (i in (2:4)) { ads2 <- union_al…

【統計】生存時間解析 ログランク検定、一般化Wilcoxon検定(Gehan's Wilcoxon検定)等

ログランク検定、重み付きログランク検定たちについてのメモ。 【目次】 計算式等 ノート サンプルデータ まずは手計算してみる SASでの実行 Rでの実行 プログラムコード 参考 前回のKaplan-meier 法に続く内容。 cochineal19.hatenablog.com 計算式等 先に…

【統計】生存時間解析 カプランマイヤー法(Kaplan-meier method)

カプランマイヤー法(Kaplan-meier method)についてのメモ。 【目次】 計算式等 ノート 打ち切りとは サンプルデータ 手計算してみる Rでの実行 SASでの実行 プログラムコード 参考 累積生存率とその信頼区間について記載する。 信頼区間はRで扱えるPlain(…

【統計】時系列分析(ARIMA、SARIMA、SARIMAXをRで実行する)

ARIMA、SARIMA、SARIMAXモデルをRで試してみる。 【目次】 用意したデータ データ加工 観測値の時系列の描画 単位根の検定 ARIMAモデルの実行 SARIMAモデルの実行 SARIMAXモデルの実行 モデルの比較 おわりに 参考 用意したデータ 今回、横浜市の月別火災発…

【統計】時系列分析(AR、MA、ARMA、ARIMA、SARIMA、ARIMAXモデル)

本記事は、AR、MA、ARMA、ARIMA、SARIMA、ARIMAXモデル等の特徴について。 【目次】 計算式等 ノート 参考 計算式等 < 前提> ■ 弱定常性(Weakly stationary) 時系列の期待値、分散および自己共分散が常に一定である状態(時点 t および k に依存しない状…

【統計】時系列分析(自己相関、自己共分散)

自己相関、自己共分散について、視覚的に分かるようにメモ。 【目次】 計算式 ノート 参考 自己相関、「自己」とつくので、ちょっと分かりづらい。 計算式 ■ 自己共分散 ■ 自己相関 ※t=時期、s=ラグ ノート サンプルデータで動きを見てみる。 Rで準備したデ…

【R、機械学習メモ】Rでのデータ分割

Rでのデータ分割の方法のメモ。 データ準備 rsample で分割 dplyr で分割 参考 データ準備 1500行の何の意味もないデータ。 ads <- data.frame(id=seq(1:1500)) rsample で分割 library(rsample) ads.sp1 <- rsample::initial_split(ads, prop=3/4) adtrain1 …

【統計】共分散分析(ANCOVA)

本記事では、共分散分析について記載します。 【目次】 帰無仮説、対立仮設 計算式等 プログラムコード 雑談 参考 共分散分析は、分散分析と重回帰分析を組み合わせた手法と言われます。分散分析では説明変数に集団などカテゴリー変数(要因)のみを投入しま…

【統計】二元配置分散分析(Two-way ANOVA)

本記事では二元配置分散分析(Two-way ANOVA)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 前回の 一元配置分散分析 は1要因に対する分析手法でした。2要因の場合は、二元配置分散分析を用います。※本…

【R】ggplot:svg画像の作成、svg画像へのリンク埋め込み

備忘録がてら、ggplot で svg形式ファイルを作る方法とリンクの埋め込み方法を書きます。 svg形式ファイルとは? ggplotでの出力方法 svg形式ファイルへのリンク埋め込み お試し画像 svg形式ファイルとは? svg形式ファイルは xmlをベースにしたベクター画像…

【統計】ロジスティック回帰分析(ホスマー・レメショウ検定、ROC、AUC等)

本記事では、ロジスティック回帰の評価について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 前回記事で理論部分を取り扱いましたが、続きでモデルの評価方法を取り扱います。 cochineal19.hatenablog.com 計算式等 モデル評価には、…

【統計】ロジスティック回帰分析

本記事では、ロジスティック回帰分析について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 今回はモデル作成までです。モデルの評価は別記事で扱います。 計算式等 ロジスティック回帰は二値分類()で用いられる分析手法です。モデル…

【統計】重回帰分析

本記事では、重回帰分析について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 単回帰分析については次の記事を参照ください。 cochineal19.hatenablog.com 計算式等 重回帰分析は、多変量 { } の関係を直線で求める分析方法です。モデ…

【統計】単回帰分析

本記事では、単回帰分析について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 計算式等 単回帰分析は、2変量 {x,y} の関係を直線(一次式)で求める分析方法です。モデル、式は次のとおりです。 ■ 単回帰モデル ■ 単回帰式 は切片(i…

【統計】連関係数(ファイ、ピアソン、クラメール)

本記事では、クロス表の連関係数について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 計算式等 次のクロス表で考えます。 Outcome Total 0 1 Factor 1 a b AB 2 c d CD Total AC BD N ファイ係数(Phi coefficient) -1~1の値を取…

【統計】相関係数(ピアソン、スピアマン、ケンドール)

本記事では、相関係数について記載します。 【目次】 計算式等 ノート プログラムコード 雑談 参考 計算式等 2変量を x, y とし、x の順位を z、y の順位を w として考えます。タイ(同一順位)は平均順位を用います。 ピアソンの積率相関係数(Pearson prod…

【統計】クラスカル・ウォリス検定(Kruskal-Wallis test)

本記事では、クラスカル・ウォリス検定(Kruskal-Wallis test)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 Wilcoxonの順位和検定とマンホイットニーのU検定(以降、Wicoxonの順位和検定等と言います)に…

【統計】Wilcoxonの順位和検定とマンホイットニーのU検定

本記事では、Wilcoxonの順位和検定(Wilcoxon rank sum test)とマンホイットニーのU検定(Mann–Whitney U test)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 両方とも2標本の分布の位置のズレを評価す…

【統計】コクラン-アーミテージ検定(Cochran-Armitage test)

本記事では、Cochran-Armitage test(コクラン-アーミテージ検定またはCA検定)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 CA検定は、割合の増加/減少傾向を評価する傾向性の検定です。 検定の中身は、…

【統計】マンテル・ヘンツェルの検定(Mantel-Haenszel test, Cochran-Mantel-Haenszel test)

本記事では、マンテル・ヘンツェルの検定(Mantel-Haenszel test)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 マンテル・ヘンツェルの検定は、 検定やFisher's Exact testと同じく、カテゴリーデータの…

【統計】Fisher's exact test

本記事では、Fisher's exact testについて記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 Fisher's Exact testは 検定と同じく、カテゴリーデータの独立性を評価する手法です。 cochineal19.hatenablog.com 本手法は…

【統計】χ二乗検定

本記事では、独立性の 検定について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 検定はカテゴリデータのクロス表(分割表、クロステーブル)で用いられる検定です。 帰無仮説、対立仮設 帰無仮説 対立仮設 要因と…

【統計】ヨンキー検定(傾向性検定)

本記事では、傾向性検定(ヨンキー検定)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 Jonckheere-Terpstra trend test(ヨンクヒール-タプストラ検定、またはヨンキー検定)は目的変数が連続値の時に使用…

【統計】一元配置分散分析(One-way ANOVA)

本記事では一元配置分散分析(One-way ANOVA)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 雑談 参考 前回の t検定 は2群の平均の差を評価するものでした。3群以上の場合は、分散分析(ANOVA:ANalysis Of VArian…

【統計】t検定

本記事では、2標本の平均の差の検定(t検定)について記載します。 【目次】 帰無仮説、対立仮設 計算式等 ノート プログラムコード 参考 帰無仮説、対立仮設 帰無仮説 対立仮設 群間の平均に差があるかどうかを評価します。帰無仮設の「群aと群bの平均に差…

【R言語】プログラムファイル用のテンプレート(結構使える!)

Rに限らず、プログラムファイルを見ると、いきなりコードを書き始める人もいますが、私は環境設定・データ取得・加工・出力はなるべくまとまりにすべきだと思っています。(そのほうがメンテナンス性が良いと思います。) ということで、R用テンプレートのメ…

【R言語&Javascript】Rスクリプトをバッチ実行する(その2)

Rscript.exeを使ったバッチ実行ツールの記事の続きです。 記事その1はこちらをご覧下さい。 【R言語&Javascript】Rスクリプトをバッチ実行する(その1) - こちにぃるの日記 Rscript.exeで設定した引数の受け取り方法を解説します。引数の設定は、次のと…

本ブログは個人メモです。 本ブログの内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。