【統計】生存時間解析 ハザード関数、生存関数などの関係性

生存時間解析ではハザード関数、生存関数など色々な関数が出てくるので関係性をメモ。頭の整理。

離散値の場合


確率密度関数

\quad f\left(t\right)=Pr\left(T=t\right)

死亡関数

\quad F\left(t\right)=\sum ^{t} _{T=0}f\left(t\right)

生存関数

\quad S\left(t\right)=\sum ^{T} _{t<T}f\left(t\right)=1-F\left(t\right)

ハザード関数

\quad h\left(t\right)=Pr\left(T=t \ | \ T \geqq t \right)=\dfrac{f\left(t\right)}{S\left(t-1\right)}

累積ハザード関数

\quad H\left(t\right)=\sum ^{t} _{T=0}h\left(t\right)


(イメージ図)
f:id:cochineal19:20210328135838p:plain:w300

* 縦軸が確率密度関数 f (T)、横軸が時間 T
* 死亡関数 F(t)=時点tまでにイベント発生する確率
* 生存関数 S(t)=時点t以降も生存している(イベント発生しない)確率。
* ハザード関数 H(t)=時点tの直前まで生存している集団(リスク集団、Number At Risk)のうち、時点tでイベント発生する確率


連続値の場合


確率密度関数

\quad f\left(t\right)=\lim _{\Delta t\rightarrow 0}\dfrac{\Pr \left( t \leqq T < t+\Delta t\right) }{\Delta t}

 ※Δt に依存するため、Δt で割って標準化する。

死亡関数

\quad F\left(t\right)=\int _{0}^{t}f\left( t\right) dt

生存関数

\quad S\left(t\right)=\int _{t}^{\infty }f\left( t\right) dt=1-F\left(t\right)

ハザード関数

\quad h\left(t\right)=\lim _{\Delta t\rightarrow 0}\dfrac{\Pr \left( t \leqq T < t+\Delta t \ | \ T \geqq t \right) }{\Delta t}=\dfrac{f\left(t\right)}{S\left(t\right)}

累積ハザード関数

\quad H\left(t\right)=\int _{0}^{t}h\left( t\right) dt


(イメージ図)
f:id:cochineal19:20210328135917p:plain:w300

打ち切りのあるデータの推定量


打ち切りがなければ、死亡関数から累積生存率を推定できる。

 \quad \widehat{S} \left(t\right)=1 − F\left(t\right)

打ち切りがあれば、カプランマイヤー法による推定(条件付き確率)。

\quad \widehat{S} \left( t \right) = \prod_{t_{i} < t} \left( 1 - \dfrac{d_{i}}{n_{i}} \right)


また、累積生存率から累積ハザード関数を推定できる。

\quad \widehat{H}\left( t\right) = -\log\ \widehat{S}\left( t \right) =\sum \dfrac{d_{i}}{n_{i}}

\quad \log \widehat{H}\left( t\right) = \log\left(-\log\ \widehat{S}\left( t \right)\right)


参考


http://www.math.s.chiba-u.ac.jp/~wang/suvival.pdf
Rと生存時間分析(1)
生存時間分析の基礎1(生存時間分析とは・生存時間分析のデータ形式)|Maxwell|note

本ブログは個人メモです。 本ブログの内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。