ベイズの定理

はじめに
ベイズの定理
参考文献

はじめに

　「感度と特異度はともに、そもそもの有病率の影響を受ける指標でもある。」と書いてある統計解析の書籍があった。誤植かと思ったが複数個所で同様の内容の記載があった。的中率と間違っているのかと思ったが、そういう文脈でもなかった。医師国家試験 1)レベルでもこれは間違いと言えそうだ。もしかしたら、別の考え方があるのかと思い少し考えてみた。

101C31
事前確率が変わると変化するのはどれか。

ａ感度
ｂ特異度
ｃ適中度
ｄ ROC曲線
ｅ偽陰性率

（解答はc）

　そもそも、感度の定義は「疾患があるという条件の下で検査が陽性である確率」という条件付き確率のはずだから、有病率（事前確率）影響を受けない気がする。（疾患がある人だけを扱っているわけだから、有病率という概念が馴染まない。）特異度についても疾患がない条件の下での指標なので感度と同様に考えることができる。

　医学部で習うベイズの定理はオッズや尤度に変形されたものが多い。この式を眺めても、尤度比（感度・特異度で計算される）が定数にならないと、事前オッズ（計算で有病率や事前確率と変換可能）だけでは事後オッズが計算できない。

事後オッズ＝尤度比×事前オッズ

　これを機会にベイズの定理を根本のところから復習しておこうと思う。

ベイズの定理

　そもそも、ベイズの定理は「原因から結果が起こった」という過去のデータを、「結果から原因はどれくらい起こっていそうか」という予測に活用できる便利な定理だ。疾患で例えるなら、病気の人の検査結果のデータ（例えるなら論文などの過去のデータ）を、検査結果から病気の有無の推定に用いることができるということだ。

原因から結果（病気から検査結果）　→　論文などの過去のデータ
結果から原因（検査結果から病気）　→　一般臨床

　ベン図で病気と検査の関係を表現すると以下のようになる。黄の部分が病気のある人、濃い青の部分が検査で陽性の人である。重なった緑の部分が「病気あり」、かつ、「検査陽性」の人を示している。

ここでまず、病気の部分（黄）に注目してみる。病気があるという条件の下で検査が陽性な人の確率は、緑を黄全体（緑に見える部分も含む）で割ったものである。式で表すと以下のようになる。

①　P（検｜病）＝P（病, 検）/P（病）

　同じように、検査の部分（青）に注目してみる。検査が陽性であるという条件の下で病気がある人の確率は、緑を青全体（緑に見える部分も含む）で割ったものである。上の式と考え方は同じ。

②　P（病｜検）＝P（病, 検）/P（検）

　ここで、①の式を少し変形してP（病, 検）の部分を左辺にする。

③　P（病, 検）＝P（検｜病）× P（病）

　これを②に代入する。

④　P（病｜検）＝ P（検｜病）× P（病） /P（検）

　この式が最も良く目にするベイズの定理の式そのものだ。

　この④の式の意味を考えながら、式を感度、特異度、有病率で表現してみる。2×2表を見ながら考えるとわかりやすい。P（検｜病）の部分は感度そのものを意味している。P（病）も有病率そのもの。ここまでは単純。P（検）のところは少し考えないといけないが、「病気あり」と「病気なし」の場合分けをして考える。病気ありの場合の検査陽性の部分aとなる確率は(a+ｃ)/ (a+b+c+d)とa/ (a+c)を乗したものになる。つまり、有病率と感度を乗したものである。同じように、病気なしの場合の検査陽性の部分bとなる確率は(b+d)/ (a+b+c+d)とb/ (b+d)を乗したものになる。これは（1-有病率）と（1-特異度）を乗したものと同じである。

	病気あり	病気なし
検査陽性	a	b	a+b
検査陰性	c	d	c+d
	a+ｃ	b+d	a+b+c+d

　つまり、検査が陽性の場合の病気の確率を示す一般式は以下のように導ける。理屈さえわかれば、何とか実用レベルの式には変形できる。

⑤　P（病｜検）＝感度× 有病率/｛（感度×有病率）＋（1－特異度）×（1－有病率）｝

　仮に感度0.85、特異度0.95の検査を行う場合、有病率（事前確率）0.04であれば、⑤に代入して、事後確率は以下のように計算できる。

	疾患あり	疾患なし
検査陽性	34	48	82
検査陰性	6	912	918
	40	960	1000

⑤　P（病｜検）＝ 0.85× 0.04/｛（0.85×0.04）＋（1－0.95）×（1 － 0.04）｝＝0.4146

　同じように、検査が陰性の場合にも一般式は以下のように導ける。

⑥　P（病｜検）＝（１－感度）× 有病率/｛（1－感度）×有病率＋特異度×（1－有病率）｝

　ここでも、仮に感度0.85、特異度0.95の検査を行う場合、有病率（事前確率）0.04であれば、⑤に代入して、事後確率は以下のように計算できる。

⑥　P（病｜検）＝（１－0.85）× 0.04/｛（1－0.85）×0.04＋0.95×（1－0.04）｝＝0.0065

　最初の疑問からは大きく回り道をしている気もするが、ここでも感度と特異度が定数として設定できなければ、特定の疾患を特定の検査で診断できない。

　感度と特異度は、ある疾患に対して、その検査方法の性能を示すような指標なので、「感度と特異度はともに、有病率の影響を受けない指標である。」、または「感度と特異度はともに、対象とする疾患や使用する検査方法の違いによって異なる。（当たり前すぎかも）」なら受け入れられるのではないだろうか。

参考文献

第101回医師国家試験問題および解答について. 厚生労働省. https://www.mhlw.go.jp/topics/2007/04/tp0427-6.html