P-P plot: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Nessun oggetto della modifica
 
(27 versioni intermedie di 10 utenti non mostrate)
Riga 1:
:''Da non confondere con [[Q-Q plot]]''
{{W|matematica|agosto 2009}}
 
Un '''P-P plot''' ('''Probability-Probability plot''', o '''Percent-Percent plot''') è un [[probability plot]] per valutare quanto due set di dati siano simili, tracciando su di un grafico le due [[cdffunzione di ripartizione| funzioni di ripartizione]] (in inglese dette cumulative distribution function o cdf). Questo è meno utilizzato del Q-Q plot, ma entrambi vengono definiti come diagrammi di probabilità, e quindi sono facilmente confondibili dai non esperti.
 
'''==Definizione'''==
 
Date due [[misura di probabilità|distribuzioni di probabilità]], con funzioni di ripartizione "''F''" e "''G''", il P-P plot traccia su un grafico <math> (F(xz), G(xz)) </math> al variare di ''z'' tra <math> -\infty </math> e <math> +\infty </math>. Siccome una [[funzione di ripartizione]] ha immagine in <math>[0,1]</math>, il [[dominio (matematica)|dominio]] di questo grafico parametrico è <math>(-\infty,+\infty)</math> e l'[[immagine]] è il quadrato <math>[0,1]</math> X <math>[0,1]</math>.
'''Definizione'''
----
 
Così per ogni input ''z'' l'output è la coppia di numeri corrispondenti alla probabilità che ''f'' e ''g'' siano minori o uguali a ''z''.
 
La linea di comparazione è la linea a ''45°'' che ha per estremi <math>(0,0)</math> e <math>(1,1)</math> -- le distribuzioni sono uguali se e solo se il grafico cade su questa linea -- ogni deviazione indica una differenza tra le distribuzioni.
Date due [[distribuzioni di probabilità]], con funzioni di ripartizione "F" e "G", il P-P plot traccia su un grafico (F(x),G(x)) al variare di z tra -\infty e +\infty. Siccome una [[funzione di ripartizione]] ha immagine in [0,1], il dominio di questo grafico parametrico è (-\infty,+\infty) e l'immagine è il quadrato [0,1]X[0,1].
 
'''==Utilizzo'''==
Così per ogni input z l'output è la coppia di numeri corrispondenti alla probabilità che f e g siano minori o uguali a z.
 
Se due distribuzioni sono separate nello spazio, il P-P plot darà poche informazioni - è utile solo per comparare distribuzionoidistribuzioni di probabilità che hanno locazioni vicine o uguali. Da notare che passerà per il punto <math>(\frac{1/}{2};\frac{1/}{2})</math> se e solo se le due distribuzioni hanno la stessa mediana.
La linea di comparazione è la linea a 45° che ha per estremi (0,0) e (1,1) - le distribuzioni sono uguali se e solo se il grafico cade su questa linea - ogni deviazione indica una differenza tra le distribuzioni.
 
I P-P plot a volte sono limitati a comparazioniparagoni tra due campionamenti piuttosto che per comparazionieffettuare un confronto tra un campionamento e un teorico modello di una distribuzione empirica. Comunque, sono di utilizzo generale, particolarmente quando le osservazioni non sono tutte modellizzatedescritte con la stessa distribuzione.
 
Comunque, hanno trovato uso nellanel comparazioneparagone di una distribuionedistribuzione campionaria da una nota distribuzione teorica: dati n campionamenti, plottando la cdf teorica continua contro la cdf empirica si produrrebbe un grafico a gradini (un gradino ogni volta che ''z'' tocca un campionamento), e toccherebbe l'estremo superiore del quadrato in corrispondenza dell'ultimo punto dei dati.
'''Utilizzo'''
----
 
{{Portale|statistica}}
 
[[Categoria:Terminologia matematica]]
Se due distribuzioni sono separate nello spazio, il P-P plot darà poche informazioni - è utile solo per comparare distribuzionoi di probabilità che hanno locazioni vicine o uguali. Da notare che passerà per il punto (1/2;1/2) se e solo se le due distribuzioni hanno la stessa mediana.
[[Categoria:statistica]]
 
I P-P plot a volte sono limitati a comparazioni tra due campionamenti piuttosto che per comparazioni tra un campionamento e un teorico modello di distribuzione. Comunque, sono di utilizzo generale, particolarmente quando le osservazioni non sono tutte modellizzate con la stessa distribuzione.
 
Comunque, hanno trovato uso nella comparazione di una distribuione campionaria da una nota distribuzione teorica: dati n campionamenti, plottando la cdf teorica continua contro la cdf empirica si produrrebbe un grafico a gradini (un gradino ogni volta che z tocca un campionamento), e toccherebbe l'estremo superiore del quadrato in corrispondenza dell'ultimo punto dei dati.
 
<noinclude>{{Categorizzare|matematica}}</noinclude>