「第一種過誤と第二種過誤」の版間の差分
削除された内容 追加された内容
Tony85poon (会話) による ID:71307071 の版を取り消し タグ: 取り消し |
編集の要約なし タグ: モバイル編集 モバイルウェブ編集 |
||
(26人の利用者による、間の37版が非表示) | |||
1行目:
{{Pathnavbox|
*{{Pathnav|[[データサイエンス]]|[[統計学]]|[[頻度主義統計学]]|[[仮説検定]]}}
*{{Pathnav|[[データサイエンス]]|[[機械学習]]|[[機械学習の評価指標|評価指標]]}}
}}
'''第一種過誤'''(だいいっしゅかご、{{lang-en-short|Type I error}})と'''第二種過誤'''(だいにしゅかご、{{lang-en-short|Type II error}})は、[[仮説検定]]において[[過誤]]を表す統計学用語である。
第一種過誤を'''偽陽性'''(ぎようせい、{{lang-en-short|False positive}}<ref>[http://www.medo.jp/cgi-bin/je.cgi?q=false+positive 医歯薬英語辞書]</ref>)、'''α過誤'''(α error)、'''あわてものの誤り'''<ref name="JIS Z 8101-1:2015">{{Cite web|和書|url=http://kikakurui.com/z8/Z8101-1-2015-01.html|title=JIS Z 8101-1:2015 統計 − 用語と記号 − 第1部:確率及び一般統計用語|accessdate=2019-04-28}}</ref>ともいう。
第二種過誤を'''偽陰性'''(ぎいんせい、{{lang-en-short|False negative}}<ref>[https://eow.alc.co.jp/search?q=false+negative false negativeの意味・使い方]. 英辞郎.</ref>)、'''β過誤'''(β error)、'''ぼんやりものの誤り'''<ref name="JIS Z 8101-1:2015" />ともいう。
なお「過誤」とは、[[誤差]]によって[[二項分類]]などの[[分類 (統計学)|分類]]を間違うことを意味する。
== 統計的過誤と
過誤は次の2種類がある<ref group="注釈">ごまかしなどの他の意図的な誤りを除く。より網羅的な説明はAllchin (2001) を参照されたい。</ref>。
;統計的過誤(Statistical error)
:計算や計測で得られた値と真の理論上の値との誤差が、無作為で本質的に予測不可能な変動によって生じている場合<ref group="注釈" name="multiple">観測値と予測値の誤差の大きさが観測値の大きさとは無関係である。</ref>。
;
:計算や計測で得られた値と真の理論上の値との誤差が、未知のソースによる無作為でない影響であり([[不確かさ (測定)|不確かさ]]参照)、そのソースが特定されれば排除できる<ref group="注釈" name="multiple"/>。
== 統計的過誤: 第一種と第二種 ==
統計学において、証拠を無に帰するような「[[帰無仮説]]」
一方で、帰無仮説と全く逆の状況に対応する「
目標は、偽である帰無仮説が棄却されて真である対立仮説が採用され
テストの結果は、陰性かもしれない(つまり、病気でない、有罪でない、ログインが許されない)。一方、それは陽性かもしれない(つまり、病気、有罪、ログイン成功)。
テストの結果と実際の状態が一致していないなら過誤が発生したことになる。テストの結果と実際の状態が一致しているなら、判断は正しいことになる。どちらの仮説を誤って採用してしまったかによって、過誤を「第一種過誤」と「第二種過誤」に分類する。
=== 第一種過誤 ===
第一種過誤(α過誤、偽陽性)は、帰無仮説が実際には真であるのに棄却してしまう過誤である。つまり、偽がヒットすることによるエラーである。先ほどの例で言えば「個人は病気ではない」のにもかかわらず「個人が病気である」と判断してしまうことに相当する。
=== 第二種過誤 ===
第二種過誤(β過誤、偽陰性)は、対立仮説が実際には真であるのに帰無仮説を採
=== 過誤の具体例 ===
「真犯人を
[[刑事訴訟法]]336条で、「被告事件が罪とならないとき、又は被告事件について犯罪の証明がないときは、判決で無罪の言渡をしなければならない」と定めている。これは[[疑わしきは罰せず]]とも言う。第一種過誤を避けるような手法を採用することを推奨している<ref>{{Cite book ja-jp
|author = 川出真清
|year = 2011
64 ⟶ 66行目:
1930年、彼らは「過誤の2つの源泉」の概念を次のように練り直した:
<blockquote>…仮説検定では次の2点を常に考慮しなければならない。 (1) 我々は、真の仮説を棄却してしまう可能性を必要に応じて低く抑えることができなければならない。 (2) 偽と思われる仮説が棄却されるような検定でなければならない。 <ref>Neyman and Pearson, 1930/1967, p.100.</ref></blockquote>
1933年、彼らはこれらの「問題は、仮説の真偽が確信を持って断言できるような場合には存在しない」と述べた<ref name="p187">Neyman and Pearson, 1933/1967, p.187.</ref>。彼らはまた、「対立仮説群」<ref>Neyman and Pearson, 1933, p.201.</ref>から特定の仮説を棄却または採用する決定において、過誤が容易に発生するとした。
73 ⟶ 75行目:
ネイマンとピアソンの共同執筆論文では、H<sub>o</sub> が常に「検定対象仮説」を表<ref>例えば Neyman and Pearson, 1933/1967, p.186 参照</ref>。添え字は "O" であってゼロではない(「オリジナル」の意)。
同じ論文<ref>Neyman and Pearson, 1933/1967, p.190.</ref>で、彼らは「2つの過誤の源泉」を第一種の過誤(errors of type I)および第二種の過誤(errors of type II)と呼んでいる<ref group="注釈">英語では、type I および type II という表記が普通であって、type-I や type-II、あるいは type 1 や type 2 とは書かない。</ref>。
== 統計学的扱い ==
=== 定義 ===
==== 第一種過誤と第二種過誤 ====
ネイマンとピアソンによる過誤の定義は広く採用され、第一種過誤と第二種過誤として知られている。また、分かり
* '''第一種過誤'''('''偽陽性'''): 受諾(受理)されるべき帰無仮説を拒絶(却下)する過誤。例えば、無実の人物を有罪にすること。
* '''第二種過誤'''('''偽陰性'''): 拒絶(却下)されるべき帰無仮説を受諾(受理)する過誤。例えば、真犯人を無罪にすること。
上の例は、この拡大された定義での曖昧さを示している。ここでは「無罪であること」を中心に考えているが、当然ながら「有罪であること」を中心に考えることもできる。以下の表で条件を示す。
{| border="1" cellspacing="0" cellpadding="3" align="center" style="text-align: center; background-color: #FFFFFF;"
|+
|-----
▲! style="background: #ddffdd;"|無
|-----
| 状態「有」 + 結果「陽性」<br/>= 真陽性 (true positive, TP)
|
|-
|
|+
|}
106 ⟶ 107行目:
妊娠検査の例を示す。
{| border="1" cellspacing="0" cellpadding="3" align="center" style="text-align: center; background-color: #FFFFFF;"
|+
|-----
▲! style="background: #ddffdd;"|妊娠していない
|-----
| 真陽性
|
|-
|
|+
|}
ここで、検査結果が「真」や「偽」といった場合、2種類の意味があることに注意
==== 偽陽性率・第一種過誤 ====
偽陽性率<math>\alpha</math>とは、陰性の標本集団のうち、誤って陽性と判定された標本の割合である。すなわち、1 から
:
==== 偽陰性率・第二種過誤 ====
偽陰性率<math>\beta</math>とは、陽性の標本集団のうち、誤って陰性と判定された標本の割合である。すなわち、1 から
:
<!--=== ベイズの定理 ===
観測された陽性の結果が偽陽性(あるいは逆に真陽性)である確率は[[ベイズの定理]]によって計算できる。
ベイズの定理の基本概念は、偽陽性や偽陰性の真の割合が単にその検査の[[正確度と精度|正確度]]だけで決まるのではなく、実際に検査対象の標本群が陽性(または陰性)である割合に大きく左右されるというものである。-->
== 過誤種別拡張の提案 ==
ネイマンとピアソンが提唱した第一種過誤(偽陽性)と第二種過誤(偽陰性)は広く採用されているが、それら以外の過誤(「{{仮リンク|第三種過誤|en|Type III error}}」や「{{仮リンク|第四種過誤|en|Type IV error}}」)を定義しようという試みがいくつかなされてきた<ref group="注釈">例えば、Onwuegbuzie & Daniel (2003) では新たに8種類の過誤を定義している。</ref>。
これらは広く受け入れられるには至っていない。以下では、主なものを紹介する。
=== David ===
[[ユニヴァーシティ・カレッジ・ロンドン]]でネイマンやピアソンと同僚だったこともある
<blockquote>私は、この理論の基本的考え方を説明するにあたって、私が(第三種の)過誤に陥っているという批判、標本に対して間違った検査法を選んでいるという批判を受けるのではないかと心配してきた <ref>David,1947, p.339.</ref>。</blockquote>
=== Mosteller ===
1948年
* 第一種過誤: 真である帰無仮説を棄却する
* 第二種過誤: 偽である帰無仮説を採択する
162 ⟶ 161行目:
=== Kaiser ===
=== Kimball ===
1957年、
数学者[[リチャード・ハミング]](1915年 - 1998年)は「間違った問題に正しい解法を与えるよりも、正しい問題に間違った解法を与える方が望ましい」と述べている。
ハーバード大学の経済学者
=== MitroffとFeatheringham ===
196 ⟶ 195行目:
:* 「認証されたユーザー」を「不正アクセス者」と分類してしまう第一種過誤(偽陽性)を防ぐ。
:* 「不正アクセス者」を「認証されたユーザー」と分類してしまう第二種過誤(偽陰性)を防ぐ。
:<!-- バグ回避のための行「Help:箇条書き#定義の箇条書き中の箇条書き」参照 -->
;スパムフィルタリング
:「スパムフィルタリング」で通常の[[電子メール]]を[[スパム (メール)|スパム]]と誤って分類することを偽陽性と呼ぶ。この場合、普通の電子メールの配布が阻害される。スパムフィルタリングでは高確率で不要な電子メールをブロックできるが、偽陽性の発生を無視できる程度にまで低下させる努力は今も続いている。
203行目:
;データベース検索
:データベース検索では、検索要求に対して得られる適切でない結果を偽陽性と呼ぶ。特に[[全文検索]]で発生しやすい。全文検索は格納されている全文書の全内容について、ユーザーが指示した数個の単語が含まれているものを探す。
:偽陽性の発生原因は[[自然言語]]の曖昧さにあることが多い。例えば「ホーム」という単語は「誰かの住居」という意味もあれば「あるWebサイトのトップレベルのページ」という意味もある<ref group="注釈">偽陽性の発生率は語彙を制限することで減らすことができる。しかし、この作業にはコストがかかる。語彙を決定するには専門家の作業が必要になり、各文書に適切なインデックスを付与するという作業も発生するからである。</ref>。
;光学文字認識 (OCR)
:一般に検出[[アルゴリズム]]は偽陽性に陥り易い。[[光学文字認識]](OCR)ソフトウェアは "a" のように見えるドットの集まりを "a" であると認識してしまう可能性がある。
;一般のセキュリティ
:偽陽性は空港での[[セキュリティチェック]]などでよく発生している。警報は武器が持ち込まれようとしていると判定されたときに鳴るよう設計されているが、その感度は高めに設定されているため、実際には武器ではない場合でも、鍵やバックルや小銭や携帯電話などで頻繁にひっかかるようになっている([[金属探知機]]参照)。
:この場合、真陽性(本物の武器を検出する場合)よりも偽陽性の場合が遥かに多く、[[陽性
;生体認証
:[[虹彩認識]]、[[網膜スキャン]]、[[顔認識システム]]などの[[生体認証]]スキャンでは、偽陰性が問題となる。この種のシステムでは、ある人物がデータベース上の既知の人物と誤って一致することがある。この場合、その人物は通行を許可される人物と判断されるか、手配中の犯罪者と判断される可能性がある。
219行目:
:比較的高価な検査であり、血液を採取するなどの手段が用いられることが多い。このため何らかの病気ではないかと疑われる患者に対して、それを確認するために行うことが多い。
例えば、米国の多くの州では、新生児に対して[[フェニルケトン尿症]]と[[甲状腺機能低下症]]のような先天性疾患の[[
[[輸血]]の際に[[ヒト免疫不全ウイルス|HIV]]や[[肝炎]]のスクリーニングを行うが、この場合も「偽陽性」の確率は高い。実際にそれらの病気にかかっているかの検査はもっと正確な結果が得られる。
スクリーニングで最も「偽陽性」が話題となるのは、[[マンモグラフィー]]による[[乳癌]]の検査であろう。米国におけるマンモグラフィー検診での偽陽性率は 15% にもなっており、世界的に見ても非常に高い<ref group="注釈">偽陽性率が高いため、米国では10年間の間に受診した女性の半数が偽陽性の結果を受け取っている。このため、再検査などに毎年1億ドルかかっている。実際、陽性とされたうちの90%から95%が偽陽性であるという。</ref>。[[オランダ]]では偽陽性率が最も低く、1% である<ref group="注釈">偽陽性率が低いのは、結果を2回チェックしているため。また、2回目ではしきい値を高く設定しており、検査の統計的検定力を低下させているとも言える。</ref>。
=== 臨床検査 ===
[[妊娠検査薬]]、[[健康診断]]では「偽陰性」が大きな問題となる。「偽陰性」の場合、患者に対して本当は病気にかかっているのにかかっていないという誤ったメッセージを伝えてしまう。このため、その後の治療方針が誤った前提の下に立てられてしまう。例えば、[[冠動脈]]の[[動脈硬化症]]を検出する心臓ストレステストで偽陰性があることが知られている。
特に症状がありきたりの病気の場合に「偽陰性」は深刻な問題を生じる。集団の中の患者数が非常に少ない場合には「偽陽性」が問題となる。詳しくは[[ベイズ推定#臨床検査における偽陽性|ベイズ推定]]を参照されたい。
=== 超常現象の調査 ===
偽陽性という用語は[[超常現象]]や
== 脚注 ==
{{脚注ヘルプ}}
=== 注釈 ===
{{Notelist}}
=== 出典 ===
{{Reflist}}
== 参考文献 ==
262 ⟶ 266行目:
* [[情報検索]]
* [[イェジ・ネイマン]]
* [[エゴン・ピアソン]]
* [[ネイマン・ピアソンの補題]]
* [[帰無仮説]]
* [[オッズ比]]
{{col-break}}
* [[
* [[受信者操作特性]]
* [[検索エンジン]]
* [[
* [[電子メールフィルタリング]]
* [[感度と特異度]]
{{col-end}}
== 外部リンク ==
*[http://www.danielsoper.com/statcalc/calc03.aspx Free Beta (Type II Error Rate) Calculator for Multiple Regression]{{リンク切れ|date=2020年10月}} Daniel Soper の ''Free Statistics Calculators'' より。
{{統計学}}
{{デフォルトソート:たいいつしゆかことたいにしゆかこ}}
[[Category:実験計画法]]
[[Category:統計的仮説検定]]
[[Category:誤り]]
[[Category:数学に関する記事]]
|