P-P plot: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
←Nuova pagina: Un '''P-P plot''' ('''Probability-Probability plot''', o '''Percent-Percent plot''') è un probability plot per valutare quanto due set di dati siano simili, tracciand... |
Nessun oggetto della modifica |
||
(31 versioni intermedie di 11 utenti non mostrate) | |||
Riga 1:
:''Da non confondere con [[Q-Q plot]]''
Un '''P-P plot''' ('''Probability-Probability plot''', o '''Percent-Percent plot''') è un [[probability plot]] per valutare quanto due set di dati siano simili, tracciando su di un grafico le due [[cdf]].▼
▲Un '''P-P plot''' ('''Probability-Probability plot''', o '''Percent-Percent plot''') è un [[probability plot]] per valutare quanto due set di dati siano simili, tracciando su di un grafico le due [[
==Definizione==
Date due [[misura di probabilità|distribuzioni di probabilità]], con funzioni di ripartizione "''F''" e "''G''", il P-P plot traccia su un grafico <math> (F(
Così per ogni input ''z'' l'output è la coppia di numeri corrispondenti alla probabilità che ''f'' e ''g'' siano minori o uguali a ''z''.
La linea di comparazione è la linea a ''45°'' che ha per estremi <math>(0,0)</math> e <math>(1,1)</math> -- le distribuzioni sono uguali se e solo se il grafico cade su questa linea -- ogni deviazione indica una differenza tra le distribuzioni.
==Utilizzo==
Se due distribuzioni sono separate nello spazio, il P-P plot darà poche informazioni - è utile solo per comparare distribuzioni di probabilità che hanno locazioni vicine o uguali. Da notare che passerà per il punto <math>(\frac{1}{2};\frac{1}{2})</math> se e solo se le due distribuzioni hanno la stessa mediana.
I P-P plot a volte sono limitati a paragoni tra due campionamenti piuttosto che per effettuare un confronto tra un campionamento e un teorico modello di una distribuzione empirica. Comunque, sono di utilizzo generale, particolarmente quando le osservazioni non sono tutte descritte con la stessa distribuzione.
Comunque, hanno trovato uso nel paragone di una distribuzione campionaria da una nota distribuzione teorica: dati n campionamenti, plottando la cdf teorica continua contro la cdf empirica si produrrebbe un grafico a gradini (un gradino ogni volta che ''z'' tocca un campionamento), e toccherebbe l'estremo superiore del quadrato in corrispondenza dell'ultimo punto dei dati.
{{Portale|statistica}}
[[Categoria:Terminologia matematica]]
[[Categoria:statistica]]
|