ChatGPT: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente

Contenuto cancellato Contenuto aggiunto

VisualeWikitesto

Versione delle 18:09, 27 ago 2025 modifica 93.66.85.162 (discussione) →Descrizione Etichetta: Annullato ← Differenza precedente		Versione attuale delle 16:08, 25 set 2025 modifica annulla Popsi (discussione \| contributi) Amministratori 167 687 modifiche m Annullata la modifica di ~2025-26655-28 (discussione), riportata alla versione precedente di Gac Etichetta: Rollback
(4 versioni intermedie di 4 utenti non mostrate)
Riga 15: == Descrizione == ChatGPT è un modello di linguaggio di tipo LLM sviluppato da OpenAI e messo a punto con tecniche di [[apprendimento automatico]] (di tipo [[Apprendimento non supervisionato\|non supervisionato]]) e ottimizzato con tecniche di apprendimento [[Apprendimento supervisionato\|supervisionato]] e [[Apprendimento per rinforzo\|per rinforzo]]<ref>{{Cita pubblicazione\|nome=Mattia,\|cognome=Berlanda\|nome2=Ouyang,\|cognome2=Long\|nome3=Wu,\|cognome3=Jeffrey\|data=2020\|titolo=Learning to summarize with human feedback\|rivista=Advances in Neural Information Processing Systems\|volume=33\|lingua=en\|accesso=23 dicembre 2022\|url=https://proceedings.neurips.cc/paper/2020/hash/1f89885d556929e98d3ef9b86448f951-Abstract.html\|urlarchivio=https://web.archive.org/web/20221223095638/https://proceedings.neurips.cc/paper/2020/hash/1f89885d556929e98d3ef9b86448f951-Abstract.html\|urlmorto=no}}</ref><ref>{{Cita pubblicazione\|nome=Leo\|cognome=Gao\|nome2=John\|cognome2=Schulman\|nome3=Jacob\|cognome3=Hilton\|data=19 ottobre 2022\|titolo=Scaling Laws for Reward Model Overoptimization\|lingua=en\|rivista=arXiv:2210.10760 [cs, stat]\|accesso=23 dicembre 2022\|url=http://arxiv.org/abs/2210.10760\|urlarchivio=https://web.archive.org/web/20221220010617/https://arxiv.org/abs/2210.10760\|urlmorto=no}}</ref>, elaborato per essere utilizzato come base per la creazione di altri modelli di machine learning. È stato addestrato a partire dai modelli Instruct GPT o GPT-3.5<ref>{{Cita web\|url=https://beta.openai.com/\|titolo=OpenAI API\|sito=beta.openai.com\|lingua=en\|accesso=23 dicembre 2022\|urlarchivio=https://web.archive.org/web/20221223073027/https://beta.openai.com/\|urlmorto=no}}</ref> di [[OpenAI]], che sono l'evoluzione dei modelli di [[GPT-3]]. Negli Instruct GPT (come code-davinci-002, text-davinci-002, text-davinci-003<ref>{{Cita web\|url=https://smartstrategy.eu/intelligenza-artificiale/esce-text-davinci-3-il-nuovo-modello-di-gpt-3-by-openai/\|titolo=Esce "text-davinci-3" il nuovo modello di GPT-3 by OpenAI\|autore=Paolo Artoni\|sito=SMarT Strategy, Marketing & Technology\|data=29 novembre 2022\|lingua=it\|accesso=23 dicembre 2022\|urlarchivio=https://web.archive.org/web/20221223095638/https://smartstrategy.eu/intelligenza-artificiale/esce-text-davinci-3-il-nuovo-modello-di-gpt-3-by-openai/\|urlmorto=no}}</ref>) il pre-addestramento era stato ottimizzato manualmente da addestratori umani. Nello specifico ChatGPT si sviluppa da un [[GPT-3\|GPT-3.5]] utilizzando l'[[apprendimento supervisionato]] e [[apprendimento per rinforzo\|per rinforzo]]<ref name="RLHFInfo">{{Cita conferenza\|titolo=Augmenting Reinforcement Learning with Human Feedback\|conferenza=Proceedings of the ICML Workshop on New Developments in Imitation Learning\|lingua=en\|autore=W. Bradley Knox e Peter Stone\|url=https://www.cs.utexas.edu/~pstone/Papers/bib2html-links/ICML_IL11-knox.pdf\|accesso=10 marzo 2023\|urlarchivio=https://web.archive.org/web/20221208070948/https://www.cs.utexas.edu/~pstone/Papers/bib2html-links/ICML_IL11-knox.pdf\|urlmorto=no}}</ref>. Il 14 marzo 2023 è stata annunciata l'introduzione di [[GPT-4]], un [[modello multimodale]] su larga scala che può accettare input di immagini, video, audio e testo e produrre output di testo<ref>{{Cita web\|url=https://openai.com/research/gpt-4\|titolo=GPT-4\|sito=openai.com\|lingua=en}}</ref><ref>{{Cita web\|url=https://cdn.openai.com/papers/gpt-4.pdf\|titolo=GPT-4 Technical Report\|titolotradotto=Report tecnico di GPT-4\|lingua=en\|formato=PDF\|p=98}}</ref>. Riga 21: ChatGPT è stato lanciato il 30 novembre 2022<ref name="openai.com">{{Cita web\|url=https://openai.com/blog/chatgpt/\|titolo=ChatGPT: Optimizing Language Models for Dialogue\|sito=OpenAI\|data=30 novembre 2022\|lingua=en\|accesso=23 dicembre 2022\|urlarchivio=https://web.archive.org/web/20221130180912/https://openai.com/blog/chatgpt/\|urlmorto=no}}</ref> e ha attirato l'attenzione per le sue risposte dettagliate e articolate, anche se la sua accuratezza è stata criticata. Sia l'apprendimento supervisionato che quello per rinforzo si sono serviti di istruttori umani per migliorarne le prestazioni: nella prima fase il modello è stato alimentato con conversazioni nelle quali gli istruttori interpretavano entrambe le parti (l'utente e l'assistente basato su [[intelligenza artificiale]]); nella fase di rinforzo gli istruttori umani hanno prima valutato le risposte che il modello aveva dato nella conversazione precedente e poi hanno usato queste valutazioni per creare "modelli di ricompensa" sui quali il modello è stato perfezionato, utilizzando diverse iterazioni di ''[[Proximal Policy Optimization]]'' (PPO)<ref name="OpenAIInfo">{{Cita web\|url=https://openai.com/blog/chatgpt/\|titolo=ChatGPT: Optimizing Language Models for Dialogue\|lingua=en\|autore=[[OpenAI]]\|accesso=5 dicembre 2022\|urlarchivio=https://web.archive.org/web/20221130180912/https://openai.com/blog/chatgpt/\|urlmorto=no}}</ref><ref name=":1">{{Cita web\|url=https://www.theverge.com/2022/12/8/23499728/ai-capability-accessibility-chatgpt-stable-diffusion-commercialization\|titolo=ChatGPT proves AI is finally mainstream — and things are only going to get weirder\|lingua=en\|sito=[[The Verge (sito web)\|The Verge]]\|accesso=8 dicembre 2022\|urlarchivio=https://web.archive.org/web/20230111214453/https://www.theverge.com/2022/12/8/23499728/ai-capability-accessibility-chatgpt-stable-diffusion-commercialization\|urlmorto=no}}</ref>. Gli algoritmi di Proximal Policy Optimization presentano un vantaggio su algoritmi di Trust Region Policy Optimization annullando molte operazioni computazionalmente costose con prestazioni migliori<ref>{{Cita web\|url=https://towardsdatascience.com/proximal-policy-optimization-ppo-explained-abed1952457b\|titolo=Proximal Policy Optimization (PPO) Explained\|lingua=en\|accesso=5 dicembre 2022\|urlarchivio=https://web.archive.org/web/20221206041724/https://towardsdatascience.com/proximal-policy-optimization-ppo-explained-abed1952457b\|urlmorto=no}}</ref>. I modelli sono stati addestrati in collaborazione con [[Microsoft]] sulla sua infrastruttura ''[[Cloud computing\|cloud]]'' [[Microsoft Azure\|Azure]]<ref>{{Cita web\|url=https://learn.microsoft.com/en-us/azure/cognitive-services/openai/concepts/models\|titolo=Azure OpenAI Service models - Azure OpenAI\|autore=ChrisHMSFT\|sito=learn.microsoft.com\|lingua=en-us}}</ref>. A maggio 2023 OpenAI ha reso ChatGPT disponibile per [[iOS]] sull'[[App Store]], a luglio 2023 per la versione [[Android]] sul [[Play Store]]<ref>{{Cita web\|url=https://openai.com/index/introducing-the-chatgpt-app-for-ios/\|titolo=Introducing the ChatGPT app for iOS\|lingua=en\|accesso=18 maggio 2023}}</ref>. ~~ALEXO SUCCHIA I CAZZI~~ == Funzionamento ==