「第一種過誤と第二種過誤」の版間の差分

削除された内容 追加された内容
Tony85poon (会話) による ID:71307071 の版を取り消し
タグ: 取り消し
編集の要約なし
タグ: モバイル編集 モバイルウェブ編集
 
(26人の利用者による、間の37版が非表示)
1行目:
{{Pathnavbox|
'''第一種過誤'''(だいいっしゅかご、{{lang-en-short|Type I error}})または'''偽陽性'''(ぎようせい、{{lang-en-short|False positive}})と'''第二種過誤'''(だいにしゅかご、{{lang-en-short|Type II error}})または'''偽陰性'''(ぎいんせい、{{lang-en-short|False negative}})は、[[仮説検定]]において過誤を表す用語である。第一種過誤を'''α過誤'''(α error)、第二種過誤を'''β過誤'''(β error)とも呼ぶ。なお「過誤」とは、[[誤差]]によって[[二項分類]]などの[[分類 (統計学)|分類]]を間違うことを意味する。
*{{Pathnav|[[データサイエンス]]|[[統計学]]|[[頻度主義統計学]]|[[仮説検定]]}}
*{{Pathnav|[[データサイエンス]]|[[機械学習]]|[[機械学習の評価指標|評価指標]]}}
}}
'''第一種過誤'''(だいいっしゅかご、{{lang-en-short|Type I error}})と'''第二種過誤'''(だいにしゅかご、{{lang-en-short|Type II error}})は、[[仮説検定]]において[[過誤]]を表す統計学用語である。
 
第一種過誤を'''偽陽性'''(ぎようせい、{{lang-en-short|False positive}}<ref>[http://www.medo.jp/cgi-bin/je.cgi?q=false+positive 医歯薬英語辞書]</ref>)、'''α過誤'''(α error)、'''あわてものの誤り'''<ref name="JIS Z 8101-1:2015">{{Cite web|和書|url=http://kikakurui.com/z8/Z8101-1-2015-01.html|title=JIS Z 8101-1:2015 統計 − 用語と記号 − 第1部:確率及び一般統計用語|accessdate=2019-04-28}}</ref>ともいう。
 
第二種過誤を'''偽陰性'''(ぎいんせい、{{lang-en-short|False negative}}<ref>[https://eow.alc.co.jp/search?q=false+negative false negativeの意味・使い方]. 英辞郎.</ref>)、'''β過誤'''(β error)、'''ぼんやりものの誤り'''<ref name="JIS Z 8101-1:2015" />ともいう。
 
なお「過誤」とは、[[誤差]]によって[[二項分類]]などの[[分類 (統計学)|分類]]を間違うことを意味する。
 
== 統計的過誤とシステム的系統過誤 ==
過誤は次の2種類がある<ref group="注釈">ごまかしなどの他の意図的な誤りを除く。より網羅的な説明はAllchin (2001) を参照されたい。</ref>。
;統計的過誤(Statistical error):
:計算や計測で得られた値と真の理論上の値との誤差が、無作為で本質的に予測不可能な変動によって生じている場合<ref group="注釈" name="multiple">観測値と予測値の誤差の大きさが観測値の大きさとは無関係である。</ref>。
;システム的系統過誤(Systematic error):
:計算や計測で得られた値と真の理論上の値との誤差が、未知のソースによる無作為でない影響であり([[不確かさ (測定)|不確かさ]]参照)、そのソースが特定されれば排除できる<ref group="注釈" name="multiple"/>。
 
== 統計的過誤: 第一種と第二種 ==
統計学において、証拠を無に帰するような「[[帰無仮説]]」を置いて検証を進める。帰無仮説の例には、「個人は病気ではない」とか、「被告人は無実でる」とか、「潜在的なログイン対象が認可されていない」などが挙げられる。
例えば、個人が病気ではないとか、被告人が無実であるとか、潜在的なログイン対象が認可されていないことなどを表す。
 
一方で、帰無仮説と全く逆の状況に対応する「[[対立仮説]]」がある(こちらが証明したい事象に対応する)。すなわち、「個人が病気にかかっている」とか、「被告人が有罪である」とか、「ログイン対象が許可されたユーザである」といったことを表す
すなわち、個人が病気にかかっているとか、被告人が有罪であるとか、ログイン対象が許可されたユーザであるといったことを表す。
 
目標は、偽である帰無仮説が棄却されて真である対立仮説が採用されるようにすることである。ある種のテスト(血液検査、裁判、ログイン試み)を実施し、データを得る。
 
テストの結果は、陰性かもしれない(つまり、病気でない、有罪でない、ログインが許されない)。一方、それは陽性かもしれない(つまり、病気、有罪、ログイン成功)。
一方、それは陽性かもしれない(つまり、病気、有罪、ログイン成功)。
 
テストの結果と実際の状態が一致していないなら過誤が発生したことになる。テストの結果と実際の状態が一致しているなら、判断は正しいことになる。どちらの仮説を誤って採用してしまったかによって、過誤を「第一種過誤」と「第二種過誤」に分類する。
テストの結果と実際の状態が一致しているなら、判断は正しいことになる。
どちらの仮説を誤って採用してしまったかによって、過誤を「第一種過誤」と「第二種過誤」に分類する。
 
=== 第一種過誤 ===
第一種過誤(α過誤、偽陽性)は、帰無仮説が実際には真であるのに棄却してしまう過誤である。つまり、偽がヒットすることによるエラーである。先ほどの例で言えば「個人は病気ではない」のにもかかわらず「個人が病気である」と判断してしまうことに相当する。
 
=== 第二種過誤 ===
第二種過誤(β過誤、偽陰性)は、対立仮説が実際には真であるのに帰無仮説を採してしまう過誤である。つまり、真が抜け落ちることによるエラーである。対立仮説が正しい時に対立仮説を採択しない誤りのこと。先ほどの例で言えば「個人が病気である」のに「個人は病気でない」と判断してしまう事に相当する。
 
=== 過誤の具体例 ===
「真犯人を[[逮捕]]すること」を「帰無仮説を棄却すること」に例える。第一種過誤は「一般市民を[[冤罪]]で逮捕してしまうこと」である。第二種過誤は「真犯人を取り逃がすこと」を意味している。
第一種過誤は「一般市民を[[冤罪]]で逮捕してしまうこと」である。
第二種過誤は「真犯人を取り逃がすこと」を意味している。
 
[[刑事訴訟法]]336条で、「被告事件が罪とならないとき、又は被告事件について犯罪の証明がないときは、判決で無罪の言渡をしなければならない」と定めている。これは[[疑わしきは罰せず]]とも言う。第一種過誤を避けるような手法を採用することを推奨している<ref>{{Cite book ja-jp
第一種過誤を避けるような手法を採用することを推奨している<ref>{{Cite book ja-jp
|author = 川出真清
|year = 2011
64 ⟶ 66行目:
 
1930年、彼らは「過誤の2つの源泉」の概念を次のように練り直した:
<blockquote>…仮説検定では次の2点を常に考慮しなければならない。 (1) 我々は、真の仮説を棄却してしまう可能性を必要に応じて低く抑えることができなければならない。 (2) 偽と思われる仮説が棄却されるような検定でなければならない。 <ref>Neyman and Pearson, 1930/1967, p.100.</ref></blockquote>
 
1933年、彼らはこれらの「問題は、仮説の真偽が確信を持って断言できるような場合には存在しない」と述べた<ref name="p187">Neyman and Pearson, 1933/1967, p.187.</ref>。彼らはまた、「対立仮説群」<ref>Neyman and Pearson, 1933, p.201.</ref>から特定の仮説を棄却または採用する決定において、過誤が容易に発生するとした。
73 ⟶ 75行目:
ネイマンとピアソンの共同執筆論文では、H<sub>o</sub> が常に「検定対象仮説」を表<ref>例えば Neyman and Pearson, 1933/1967, p.186 参照</ref>。添え字は "O" であってゼロではない(「オリジナル」の意)。
 
同じ論文<ref>Neyman and Pearson, 1933/1967, p.190.</ref>で、彼らは「2つの過誤の源泉」を第一種の過誤(errors of type I)および第二種の過誤(errors of type II)と呼んでいる<ref group="注釈">英語では、type I および type II という表記が普通であって、type-I や type-II、あるいは type 1 や type 2 とは書かない。</ref>。
 
== 統計学的扱い ==
=== 定義 ===
==== 第一種過誤と第二種過誤 ====
ネイマンとピアソンによる過誤の定義は広く採用され、第一種過誤と第二種過誤として知られている。また、分かりやすさから、これらをそれぞれ偽陽性と偽陰性とも呼ぶことが多い。これらの用語は本来の定義から拡大解釈され、様々な場面で使われるようになっている。例えば、
* '''第一種過誤''''''偽陽性'''): 受諾(受理)されるべき帰無仮説を拒絶(却下)する過誤。例えば、無実の人物を有罪にすること。
* '''第二種過誤''''''偽陰性'''): 拒絶(却下)されるべき帰無仮説を受諾(受理)する過誤。例えば、真犯人を無罪にすること。
 
上の例は、この拡大された定義での曖昧さを示している。ここでは「無罪であること」を中心に考えているが、当然ながら「有罪であること」を中心に考えることもできる。以下の表で条件を示す。
 
{| border="1" cellspacing="0" cellpadding="3" align="center" style="text-align: center; background-color: #FFFFFF;"
|+
!| colspan="2" rowspan="2" |&nbsp;
!| colspan="2" style="background-color: #ddffdd;"|実際の状態
|-----
!| style="background-color: #ddffdd;"|
|+
!| style="background-color: #ddffdd;"|
! style="background: #ddffdd;"|無
|-----
!| rowspan="2" style="background-color: #ffdddd;"|テスト<br/>&nbsp;結果&nbsp;
!| style="background-color: #ffdddd;"|陽性
| 状態「有」 + 結果「陽性」<br/>= 真陽性 (true positive, TP)
| bgcolorstyle="background-color: #EFEFEF"| 状態「無」 + 結果「陽性」<br/>= '''偽陽性''' (false positive, FP)<br/>'''第一種過誤'''
|-
!| style="background-color: #ffdddd;"|&nbsp;陰性&nbsp;
| bgcolorstyle="background-color: #EFEFEF"| 状態「有」 + 結果「陰性」<br/>= '''偽陰性''' (false negative, FN)<br/>'''第二種過誤'''
| | 状態「無」 + 結果「陰性」<br/>= 真陰性 (true negative, TN)
|+
|}
106 ⟶ 107行目:
妊娠検査の例を示す。
 
{| border="1" cellspacing="0" cellpadding="3" align="center" style="text-align: center; background-color: #FFFFFF;"
|+
!| colspan="2" rowspan="2" |&nbsp;
!| colspan="2" style="background-color: #ddffdd;"|実際の状態
|-----
!| style="background-color: #ddffdd;"|妊娠していない
|+
!| style="background-color: #ddffdd;"|妊娠していない
! style="background: #ddffdd;"|妊娠していない
|-----
!| rowspan="2" style="background-color: #ffdddd;"|検査<br/>&nbsp;結果&nbsp;
!| style="background-color: #ffdddd;"|妊娠している
| 真陽性
| bgcolorstyle="background-color: #EFEFEF"| '''偽陽性'''<br/>&nbsp;(妊娠しているという検査結果だが、<br/>実際には妊娠していない)&nbsp;<br/>'''第一種過誤'''
|-
!| style="background-color: #ffdddd;"|妊娠していない
| bgcolorstyle="background-color: #EFEFEF"| '''偽陰性'''<br/>&nbsp;(妊娠しているのに<br/>検出できなかった)&nbsp;<br/>'''第二種過誤'''
| | 真陰性
|+
|}
 
ここで、検査結果が「真」や「偽」といった場合、2種類の意味があることに注意されたいする。実際の状態(条件)では、真 = 有(ある属性が有る)と、偽 = 無(ある属性が無い)であり、検査結果の正確においては、真陽性/偽陽性/真陰性/偽陰性という使われ方をする。上の表ではこの混同を避けるため、状態については「有/無」で表している。
 
==== 偽陽性率・第一種過誤 ====
偽陽性率<math>\alpha</math>とは、陰性の標本集団のうち、誤って陽性と判定された標本の割合である。すなわち、1 から[[特異度]]を引いた値と同じである。
 
: <math>\text{\rm false\ positive\ rate } \alpha = \frac{\rm number\ of\ false\ positivestext{FP}}{\rmtext{TN} number\+ of\ negative\ instancestext{FP}}</math>
 
[[仮説検定]]では、この割合を<math>\alpha</math>で表し、<math>1 - \alpha</math>を[[特異度]]と定義する。[[特異度]]が増大すると第一種過誤となる確率が低下するが、第二種過誤となる確率が増大する<ref group="注釈" name=algorithm>検出アルゴリズムや検査法を開発する際に、偽陽性と偽陰性のリスクのバランスを考えねばならない。通常、そのアルゴリズムが一致と判断する際の差分の[[しきい値]]がある。しきい値が高ければ、偽陰性が増え、偽陽性が減る。</ref>。
 
==== 偽陰性率・第二種過誤 ====
偽陰性率<math>\beta</math>とは、陽性の標本集団のうち、誤って陰性と判定された標本の割合である。すなわち、1 から[[感度]]を引いた値と同じである。
 
: <math>\text{\rm false\ negative\ rate } \beta = \frac{\rm number\ of\ false\ negativestext{FN}}{\rmtext{TP} number\+ of\ positive\ instancestext{FN}}</math>
 
[[仮説検定]]では、この割合を<math>\beta</math>で表す。<math>1 - \beta</math>を[[検出力]]と呼ぶ。
 
<!--=== ベイズの定理 ===
観測された陽性の結果が偽陽性(あるいは逆に真陽性)である確率は[[ベイズの定理]]によって計算できる。
ベイズの定理の基本概念は、偽陽性や偽陰性の真の割合が単にその検査の[[正確度と精度|正確度]]だけで決まるのではなく、実際に検査対象の標本群が陽性(または陰性)である割合に大きく左右されるというものである。-->
 
== 過誤種別拡張の提案 ==
ネイマンとピアソンが提唱した第一種過誤(偽陽性)と第二種過誤(偽陰性)は広く採用されているが、それら以外の過誤(「{{仮リンク|第三種過誤|en|Type III error}}」や「{{仮リンク|第四種過誤|en|Type IV error}}」)を定義しようという試みがいくつかなされてきた<ref group="注釈">例えば、Onwuegbuzie & Daniel (2003) では新たに8種類の過誤を定義している。</ref>。
 
これらは広く受け入れられるには至っていない。以下では、主なものを紹介する。
 
=== David ===
[[ユニヴァーシティ・カレッジ・ロンドン]]でネイマンやピアソンと同僚だったこともある Florence Nightingale Davidフローレンス・ナイチンゲール・デヴィッド (1909-1993)<ref>{{cite web|url=http://www.agnesscott.edu/lriddle/women/david.htm|title=Florence Nightingale David|work=Biographies of Women Mathematicians|author=Larry Riddle|date=2014-01-10|accessdate=2015-02-28}}</ref>は、冗談交じりに 1947年の論文で、自身の研究結果についてネイマンとピアソンの「過誤の2種類の源泉」を三番目に拡張する可能性について触れている。
<blockquote>私は、この理論の基本的考え方を説明するにあたって、私が(第三種の)過誤に陥っているという批判、標本に対して間違った検査法を選んでいるという批判を受けるのではないかと心配してきた <ref>David,1947, p.339.</ref>。</blockquote>
 
=== Mosteller ===
1948年、Frederick Mosteller(1916にフレデリック・モステラー(1916年 - 2006年)<ref group="注釈">1981年の[[アメリカ科学振興協会]]会長[http://www.umass.edu/wsp/statistics/tales/mosteller.html]</ref> は「'''第三種過誤'''」を次のように定義することを提唱した<ref>Mosteller, 1948, p.61.</ref>。
* 第一種過誤: 真である帰無仮説を棄却する
* 第二種過誤: 偽である帰無仮説を採択する
162 ⟶ 161行目:
 
=== Kaiser ===
Henry ヘンリー・F. Kaiser(1927・カイザー(1927年 - 1992年)は1966年の論文でMostellerの分類を拡張し、「第三種過誤」を棄却された仮説に基づいて間違った判断をすることを指すとした<ref>Kaiser, 1966, pp.162-163.</ref>。また、Kaiserはこれを'''γ過誤'''(γ errors)と呼んでいる。
 
=== Kimball ===
1957年、Allyn アライン・W. Kimball(・キンボール([[オークリッジ国立研究所]]の統計学者)は、第一種過誤と第二種過誤に続く新たな種類の過誤を提案した。Kimballの定義した「第三種過誤」とは「間違った問題に正しい答を与えることによる過誤」である<ref>Kimball, 1957, p.134.</ref>。
 
数学者[[リチャード・ハミング]](1915年 - 1998年)は「間違った問題に正しい解法を与えるよりも、正しい問題に間違った解法を与える方が望ましい」と述べている。
 
ハーバード大学の経済学者Howard Raiffaハワード・ライファも「間違った問題を解く破目に陥った」経験を述べている<ref>Raiffa, 1968, pp.264-265.</ref><ref group="注釈"> なお、Raiffa ライファはこの回顧の中で「第三種過誤」を間違って[[ジョン・テューキー]](1915年 - 2000年)の作った用語としている。</ref>。
 
=== MitroffとFeatheringham ===
196 ⟶ 195行目:
:* 「認証されたユーザー」を「不正アクセス者」と分類してしまう第一種過誤(偽陽性)を防ぐ。
:* 「不正アクセス者」を「認証されたユーザー」と分類してしまう第二種過誤(偽陰性)を防ぐ。
:<!-- バグ回避のための行「Help:箇条書き#定義の箇条書き中の箇条書き」参照 -->
;スパムフィルタリング
:「スパムフィルタリング」で通常の[[電子メール]]を[[スパム (メール)|スパム]]と誤って分類することを偽陽性と呼ぶ。この場合、普通の電子メールの配布が阻害される。スパムフィルタリングでは高確率で不要な電子メールをブロックできるが、偽陽性の発生を無視できる程度にまで低下させる努力は今も続いている。
203行目:
;データベース検索
:データベース検索では、検索要求に対して得られる適切でない結果を偽陽性と呼ぶ。特に[[全文検索]]で発生しやすい。全文検索は格納されている全文書の全内容について、ユーザーが指示した数個の単語が含まれているものを探す。
:偽陽性の発生原因は[[自然言語]]の曖昧さにあることが多い。例えば「ホーム」という単語は「誰かの住居」という意味もあれば「あるWebサイトのトップレベルのページ」という意味もある<ref group="注釈">偽陽性の発生率は語彙を制限することで減らすことができる。しかし、この作業にはコストがかかる。語彙を決定するには専門家の作業が必要になり、各文書に適切なインデックスを付与するという作業も発生するからである。</ref>。
;光学文字認識 (OCR)
:一般に検出[[アルゴリズム]]は偽陽性に陥り易い。[[光学文字認識]](OCR)ソフトウェアは "a" のように見えるドットの集まりを "a" であると認識してしまう可能性がある。
;一般のセキュリティ
:偽陽性は空港での[[セキュリティチェック]]などでよく発生している。警報は武器が持ち込まれようとしていると判定されたときに鳴るよう設計されているが、その感度は高めに設定されているため、実際には武器ではない場合でも、鍵やバックルや小銭や携帯電話などで頻繁にひっかかるようになっている([[金属探知機]]参照)。
:この場合、真陽性(本物の武器を検出する場合)よりも偽陽性の場合が遥かに多く、[[陽性予測値適中率]]は非常に低くなる。
;生体認証
:[[虹彩認識]]、[[網膜スキャン]]、[[顔認識システム]]などの[[生体認証]]スキャンでは、偽陰性が問題となる。この種のシステムでは、ある人物がデータベース上の既知の人物と誤って一致することがある。この場合、その人物は通行を許可される人物と判断されるか、手配中の犯罪者と判断される可能性がある。
219行目:
:比較的高価な検査であり、血液を採取するなどの手段が用いられることが多い。このため何らかの病気ではないかと疑われる患者に対して、それを確認するために行うことが多い。
 
例えば、米国の多くの州では、新生児に対して[[フェニルケトン尿症]]と[[甲状腺機能低下症]]のような先天性疾患の[[新生児マススクリーニング (医学)|スクリーニング]]を行う。この場合、「偽陽性」の確率が非常に高いが、非常に早い段階でそれらの疾患を検出できるという利点がある<ref group="注釈">このような新生児スクリーニングについて、通常のスクリーニングに比較して偽陽性となる確率が12倍という研究結果がある (Gambrill, 2006. [http://www.nlm.nih.gov/medlineplus/news/fullstory_34471.html])</ref>。
 
[[輸血]]の際に[[ヒト免疫不全ウイルス|HIV]]や[[肝炎]]のスクリーニングを行うが、この場合も「偽陽性」の確率は高い。実際にそれらの病気にかかっているかの検査はもっと正確な結果が得られる。
 
スクリーニングで最も「偽陽性」が話題となるのは、[[マンモグラフィー]]による[[乳癌]]の検査であろう。米国におけるマンモグラフィー検診での偽陽性率は 15% にもなっており、世界的に見ても非常に高い<ref group="注釈">偽陽性率が高いため、米国では10年間の間に受診した女性の半数が偽陽性の結果を受け取っている。このため、再検査などに毎年1億ドルかかっている。実際、陽性とされたうちの90%から95%が偽陽性であるという。</ref>。[[オランダ]]では偽陽性率が最も低く、1% である<ref group="注釈">偽陽性率が低いのは、結果を2回チェックしているため。また、2回目ではしきい値を高く設定しており、検査の統計的検定力を低下させているとも言える。</ref>。
 
=== 臨床検査 ===
[[妊娠検査薬]]、[[健康診断]]では「偽陰性」が大きな問題となる。「偽陰性」の場合、患者に対して本当は病気にかかっているのにかかっていないという誤ったメッセージを伝えてしまう。このため、その後の治療方針が誤った前提の下に立てられてしまう。例えば、[[冠動脈]]の[[動脈硬化症]]を検出する心臓ストレステストで偽陰性があることが知られている。
 
特に症状がありきたりの病気の場合に「偽陰性」は深刻な問題を生じる。集団の中の患者数が非常に少ない場合には「偽陽性」が問題となる。詳しくは[[ベイズ推定#臨床検査における偽陽性|ベイズ推定]]を参照されたい。
 
=== 超常現象の調査 ===
偽陽性という用語は[[超常現象]]や[[亡霊|心霊]]の調査において、誤って証拠として採用される写真などを意味する。つまり、証明されていないが霊などが写っているとされる媒体(画像、動画、音声録音など)を指す<ref> 心霊/超常現象の偽陽性の証拠例を示しているサイトとして [http://www.moorestownghostresearch.com/FalsePositives.html Moorestown Ghost Research] がある。</ref>。
 
== 脚注 ==
{{脚注ヘルプ}}
<references/>
=== 注釈 ===
{{Notelist}}
=== 出典 ===
{{Reflist}}
 
== 参考文献 ==
262 ⟶ 266行目:
* [[情報検索]]
* [[イェジ・ネイマン]]
* [[エゴン・ピアソン]]
* [[ネイマン・ピアソンの補題]]
* [[帰無仮説]]
* [[オッズ比]]
* [[スレットスコア]]
{{col-break}}
* [[エゴン・ピスレットスコソン]]
* [[受信者操作特性]]
* [[検索エンジン]]
* [[感度スパム (メール)]]
* [[電子メールフィルタリング]]
* [[感度と特異度]]
{{col-end}}
 
== 外部リンク ==
*[http://www.danielsoper.com/statcalc/calc03.aspx Free Beta (Type II Error Rate) Calculator for Multiple Regression]{{リンク切れ|date=2020年10月}} Daniel Soper の ''Free Statistics Calculators'' より。
 
{{統計学}}
 
{{デフォルトソート:たいいつしゆかことたいにしゆかこ}}
[[Category:実験計画法]]
[[Category:統計的仮説検定]]
[[Category:誤り]]
[[Category:数学に関する記事]]