Conditional random field: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica |
Nessun oggetto della modifica Etichette: Modifica visuale Link a pagina di disambiguazione |
||
Riga 1:
{{C|Da controllare la correttezza della traduzione dalla versione inglese della voce. Alcune frasi non sono sintatticamente corrette in italiano.|Informatica|agosto 2024}}
'''I Conditional Random Field''' ( '''CRF''' ) sono una classe di metodi di [[Modello statistico|modellazione statistica]] spesso
Altri esempi di applicazione dei CRF sono: l'etichettatura o [[Parsing|analisi]] di dati sequenziali per l'[[elaborazione del linguaggio naturale]] o di [[Bioinformatica|sequenze biologiche]], il [[Analisi grammaticale|POS tagging]], l'analisi superficiale<ref>{{Cita conferenza|url=http://portal.acm.org/ft_gateway.cfm?id=1073473&type=pdf&CFID=4684435&CFTOKEN=39459323}}</ref>, il [[Risoluzione all'identità|riconoscimento di entità]]
== Descrizione ==
I CRF sono un tipo di [[modello grafico
Lafferty, McCallum e Pereira <ref name="Laf:McC:Per01">{{Cita conferenza|titolo=Conditional random fields: Probabilistic models for segmenting and labeling sequence data|conferenza=ICML 2001: 18th International Conf. on Machine Learning|autore=Lafferty, J. McCallum, A., Pereira, F.|data=2001|pagine=282–289|url=http://repository.upenn.edu/cgi/viewcontent.cgi?article=1162&context=cis_papers|editore=Morgan Kaufmann}}
</ref> definiscono un CRF sulle osservazioni <math>\boldsymbol{X}</math> e [[Variabile casuale|variabili casuali]] <math>\boldsymbol{Y}</math> come segue:<blockquote>Sia <math>G = (V, E)</math> un grafo tale che <math>\boldsymbol{Y} = (\boldsymbol{Y}_v)_{v\in V}</math>, in modo che <math>\boldsymbol{Y}</math> sia indicizzato dai vertici di <math>G</math> .
<math>(\boldsymbol{X}, \boldsymbol{Y})</math> è un
<math>P(\boldsymbol{Y}_v |\boldsymbol{X}, \{\boldsymbol{Y}_w: w \neq v\}) = P(\boldsymbol{Y}_v |\boldsymbol{X}, \{\boldsymbol{Y}_w: w \sim v\})</math>
dove <math>\mathit{w} \sim v</math> significa che <math>w</math> e <math>v</math> sono vicini in <math>G</math> .</blockquote>Ciò significa che un CRF è un [[Modello grafico|modello
==== Inferenza ====
Per i grafi
* Se il grafo è una catena o un albero, gli algoritmi di ''passaggio
* Se il CRF contiene solo potenziali a coppie e l'energia è submodulare, gli algoritmi combinatori ''min cut/max flow'' forniscono soluzioni esatte.
Se l'inferenza esatta è impossibile, si possono utilizzare diversi algoritmi per ottenere soluzioni
* [[Loopy belief propagation]]
* [[Espansione Alpha]]
* [[Mean field inference]]
* Rilassamenti della [[programmazione lineare]]
==== Apprendimento dei parametri ====
L'apprendimento dei parametri <math>\theta</math> di solito viene
==== Esempi ====
Nella modellazione sequenziale, il grafo di interesse è solitamente un grafo a catena. Una sequenza di input di variabili osservate <math>X</math> rappresenta una sequenza di osservazioni e <math>Y</math> rappresenta una variabile di stato nascosta (o sconosciuta) che deve essere dedotta in base alle osservazioni.
* l'''addestramento'' del modello, apprendimento delle distribuzioni condizionali tra
* la ''decodifica'', determinazione della probabilità di una
* l'''inferenza'', determinazione della sequenza di etichette ''più probabile'' <math>Y</math> dato <math>X</math> .
La dipendenza condizionale di
I CRF a catena lineare hanno molte
In particolare, a differenza degli HMM, i CRF possono contenere un numero qualsiasi di funzioni di caratteristiche, tali funzioni possono ispezionare l'intera sequenza di input <math>X</math> in qualsiasi momento durante l'inferenza e
==
* Teorema di Hammersley-Clifford
|