P-P plot: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
(17 versioni intermedie di 7 utenti non mostrate) | |||
Riga 1:
:''Da non confondere con [[Q-Q plot]]''
Un '''P-P plot''' ('''Probability-Probability plot''', o '''Percent-Percent plot''') è un [[probability plot]] per valutare quanto due set di dati siano simili, tracciando su di un grafico le due [[funzione di ripartizione|
==Definizione==
Date due [[misura di probabilità|distribuzioni di probabilità]], con funzioni di ripartizione "''F''" e "''G''", il P-P plot traccia su un grafico <math> (F(
Così per ogni input ''z'' l'output è la coppia di numeri corrispondenti alla probabilità che ''f'' e ''g'' siano minori o uguali a ''z''.
La linea di comparazione è la linea a ''45°'' che ha per estremi <math>(0,0)</math> e <math>(1,1)</math> -- le distribuzioni sono uguali se e solo se il grafico cade su questa linea -- ogni deviazione indica una differenza tra le distribuzioni.
Se due distribuzioni sono separate nello spazio, il P-P plot darà poche informazioni - è utile solo per comparare distribuzioni di probabilità che hanno locazioni vicine o uguali. Da notare che passerà per il punto <math>(\frac{1
▲'''Utilizzo'''
I P-P plot a volte sono limitati a
Comunque, hanno trovato uso
▲Se due distribuzioni sono separate nello spazio, il P-P plot darà poche informazioni - è utile solo per comparare distribuzioni di probabilità che hanno locazioni vicine o uguali. Da notare che passerà per il punto (1/2;1/2) se e solo se le due distribuzioni hanno la stessa mediana.
{{Portale|statistica}}
▲I P-P plot a volte sono limitati a comparazioni tra due campionamenti piuttosto che per comparazioni tra un campionamento e un teorico modello di distribuzione. Comunque, sono di utilizzo generale, particolarmente quando le osservazioni non sono tutte modellizzate con la stessa distribuzione.
▲Comunque, hanno trovato uso nella comparazione di una distribuione campionaria da una nota distribuzione teorica: dati n campionamenti, plottando la cdf teorica continua contro la cdf empirica si produrrebbe un grafico a gradini (un gradino ogni volta che z tocca un campionamento), e toccherebbe l'estremo superiore del quadrato in corrispondenza dell'ultimo punto dei dati.
[[Categoria:Terminologia matematica]]
[[Categoria:statistica]]
|