Receiver operating characteristic: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m →Concetto basilare: refuso |
m Bot: numeri di pagina nei template citazione |
||
(42 versioni intermedie di 22 utenti non mostrate) | |||
Riga 1:
[[File:ROCfig.PNG|thumb
Nella [[Ricerca operativa|teoria delle decisioni]], le '''curve ROC''' ('''Receiver Operating Characteristic'''
La curva ROC viene creata tracciando il valore del ''True Positive Rate'' (TPR, frazione di veri positivi) rispetto al ''False Positive Rate'' (FPR, frazione di falsi positivi) a varie impostazioni di soglia. Il tasso di veri positivi è anche noto come sensibilità, richiamo o probabilità di rilevazione<ref name=":0">{{Cita web|url=https://www.mathworks.com/help/phased/examples/detector-performance-analysis-using-roc-curves.html|titolo=Detector Performance Analysis Using ROC Curves - MATLAB & Simulink|accesso=2019-11-06}}</ref>. Il tasso di falsi positivi è anche noto come fall-out o probabilità di falsi allarmi<ref name=":0" /> e può essere calcolato come (1 - specificità). Può anche essere pensato come un diagramma della potenza in funzione dell'errore di tipo I :quando la prestazione viene calcolata da un solo campione della popolazione, può essere considerata come una stima di queste quantità. La curva ROC è quindi il tasso dei veri positivi in funzione del tasso dei falsi positivi. In generale, se sono note le distribuzioni di sensibilità e 1-specificità, la curva ROC può essere generata tracciando la funzione di distribuzione cumulativa (area sotto la distribuzione di probabilità da <math>-\infty</math> alla soglia di discriminazione) della probabilità di rilevamento nell'asse y rispetto alla funzione di distribuzione cumulativa della probabilità di falso allarme sull'asse x.
Le curve ROC furono utilizzate per la prima volta da alcuni ingegneri elettrici durante la [[seconda guerra mondiale]], che volevano scovare i nemici utilizzando il [[radar]] durante le battaglie. Recentemente invece le curve ROC sono utilizzate anche in [[medicina]],<ref>Lusted, 1971</ref><ref>Erdrich 1981, Henderson, 1993</ref> [[radiologia]],<ref>Goodenough e coll., 1974; Hanley e McNeil, 1982</ref> [[psicologia]], [[veterinaria]]<ref>Greiner, Pfeiffer e Smith, 2000</ref> e altri ambiti, come il [[machine learning]] e [[data mining]].▼
Il ROC è anche noto come curva Receiver Operating Characteristic, poiché è un confronto tra due caratteristiche operative (TPR e FPR) al cambiare del criterio.<ref>{{Cita web|url=https://www.questia.com/read/91082370/signal-detection-theory-and-roc-analysis-in-psychology|titolo=Signal Detection Theory and ROC Analysis in Psychology and Diagnostics: Collected Papers - 1996, Page iii by John A. Swets. {{!}} Online Research Library: Questia|accesso=2019-11-06|dataarchivio=6 novembre 2019|urlarchivio=https://web.archive.org/web/20191106103308/https://www.questia.com/read/91082370/signal-detection-theory-and-roc-analysis-in-psychology|urlmorto=sì}}</ref>
== Applicazioni ==
▲Le curve ROC furono utilizzate per la prima volta
==Concetto basilare==
Se si considera un problema di predizione a 2 classi ([[classificatore binario]] come da figura: distribuzione rossa e azzurra), scelto un valore di soglia (''threshold'' o ''cut-off''),
*se il risultato della predizione è positivo ''p'' e il valore vero è anche positivo ''p'', viene chiamato ''vero positivo'' (true positive - TP);
*se invece il valore vero è negativo, il risultato viene chiamato ''falso positivo'' (false positive - FP);
*
*un ''falso negativo'' (false negative - FN) invece
È inoltre possibile rappresentare questo tipo di situazione
{| align=center
|-
Line 32 ⟶ 37:
|}
Una curva ROC è il grafico dell'insieme delle coppie (FP, TP) al variare di un parametro del classificatore. Per esempio, in un classificatore a soglia, si calcola la frazione di veri positivi e quella di falsi positivi per ogni possibile valore della soglia; tutti i punti così ottenuti nello spazio FP-TP descrivono la curva ROC.
Il test che si effettua attraverso l'analisi delle curve ROC ha la capacità di scernere, ad esempio, tra un insieme di popolazione ''sana'' e ''malata'', andando ad analizzare l'area sottesa dalla curva ROC (''Area Under Curve'', AUC). Ciò equivale alla probabilità che il risultato del test effettuato su un individuo estratto a caso dal gruppo dei malati sia superiore a quello estratto a caso dal gruppo dei sani.<ref>Bamber, 1975; Zweig e Campbell, 1993</ref>▼
▲
Solitamente si ha che le curve ROC passano per i punti (0,0) e (1,1), avendo inoltre due condizioni che rappresentano due curve limite:▼
*una che taglia il grafico a 45°, passando per l'origine. Questa retta rappresenta il caso del classificatore randomico (linea di «nessun beneficio»), e l'area sottesa è pari a 0,5.▼
▲
*la seconda curva è rappresentata dall'insieme di segmenti che dall'origine sale al punto (0,1) e da quello che congiunge il punto (0,1) a (1,1), avendo un'area sottesa di valore pari a 1, ovvero rappresenta il classificatore perfetto.▼
▲*una che taglia il grafico a 45°, passando per l'origine. Questa retta rappresenta il caso del classificatore
▲*la seconda curva è rappresentata
==Alcuni concetti==
*<math>TPR = TP / P = TP / (TP+FN) </math>
*<math>FPR = FP / N = FP / (FP + TN)</math>
*[[accuratezza]] <math>ACC = (TP + TN) / (P + N)</math>
Line 47 ⟶ 54:
==Altri progetti==
{{interprogetto
== Collegamenti esterni ==
* {{Collegamenti esterni}}
{{Controllo di autorità}}
{{Portale|neuroscienze}}
[[Categoria:Ricerca operativa]]
[[Categoria:Data mining]]
|