Generative pre-trained transformer: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
fix parametri template, altri fix minori
m fix parametri template, altri fix minori
Riga 2:
Un '''generative pre-trained transformer''' (o '''GPT''', in italiano '''trasformatore generativo pre-addestrato''') è un tipo di [[modello linguistico di grandi dimensioni]] (LLM)<ref name=":1">{{Cita web|lingua=en|url=https://www.aljazeera.com/news/2023/3/15/how-do-ai-models-like-gpt-4-work-and-how-can-you-start-using-it|titolo=How does GPT-4 work and how can you start using it in ChatGPT?|nome=Mohammed|cognome=Haddad|sito=www.aljazeera.com|accesso=10 aprile 2023|urlarchivio=https://web.archive.org/web/20230705224641/https://www.aljazeera.com/news/2023/3/15/how-do-ai-models-like-gpt-4-work-and-how-can-you-start-using-it|urlmorto=no}}</ref><ref name=":0">{{Cita web|lingua=en|url=https://www.weforum.org/agenda/2023/01/davos23-generative-ai-a-game-changer-industries-and-society-code-developers/|titolo=Generative AI: a game-changer society needs to be ready for|sito=World Economic Forum|data=9 gennaio 2023|accesso=8 aprile 2023|urlarchivio=https://web.archive.org/web/20230425234858/https://www.weforum.org/agenda/2023/01/davos23-generative-ai-a-game-changer-industries-and-society-code-developers/|urlmorto=no}}</ref><ref name=":4">{{Cita web|lingua=en|url=https://time.com/6271657/a-to-z-of-artificial-intelligence/|titolo=The A to Z of Artificial Intelligence|data=13 aprile 2023|editore=Time|accesso=14 aprile 2023|urlarchivio=https://web.archive.org/web/20230616123839/https://time.com/6271657/a-to-z-of-artificial-intelligence/|urlmorto=no}}</ref> e un importante framework per l’[[intelligenza artificiale generativa]].<ref>{{Cita web|lingua=en|url=https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2|titolo=Generative AI and Future|nome=Luhui|cognome=Hu|data=15 novembre 2022|sito=Medium|accesso=29 aprile 2023|urlarchivio=https://web.archive.org/web/20230605023010/https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2|urlmorto=no}}</ref><ref>{{Cita web|lingua=en|url=https://www.computer.org/csdl/magazine/co/2022/10/09903869/1H0G6xvtREk|titolo=CSDL &#124; IEEE Computer Society|sito=www.computer.org|accesso=29 aprile 2023|urlarchivio=https://web.archive.org/web/20230428171218/https://www.computer.org/csdl/magazine/co/2022/10/09903869/1H0G6xvtREk|urlmorto=no}}</ref> Si tratta di una [[rete neurale artificiale]] usata per l’[[elaborazione del linguaggio naturale]] da parte delle macchine.<ref>{{Cita web|lingua=en|titolo= LibGuides: Using AI Language Models : ChatGPT|url= https://hallmark.libguides.com/c.php?g=1312147&p=9644939|accesso=7 dicembre 2023|urlarchivio= https://web.archive.org/web/20231208014633/https://hallmark.libguides.com/c.php?g=1312147&p=9644939|urlmorto=no}}</ref> È basata sull’[[Trasformatore (informatica)|architettura transformer]] del deep learning, pre-addestrata su grandi [[dataset]] di testi non etichettati e in grado di generare nuovi contenuti simili a quelli umani.<ref name=":0" /><ref name=":4" /> A partire dal 2023, la maggior parte dei LLM presentava queste caratteristiche<ref>{{Cita web|lingua=en|url=https://www.forbes.com/sites/robtoews/2023/02/07/the-next-generation-of-large-language-models/|titolo=The Next Generation Of Large Language Models|nome=Rob|cognome=Toews|sito=Forbes|accesso=9 aprile 2023|urlarchivio=https://web.archive.org/web/20230414030738/https://www.forbes.com/sites/robtoews/2023/02/07/the-next-generation-of-large-language-models/|urlmorto=no}}</ref> ed erano talvolta definiti in modo generico come GPT.<ref>{{Cita web|lingua=en|url=https://www.forbes.com/sites/joemckendrick/2023/03/26/most-jobs-soon-to-be-influenced-by-artificial-intelligence-research-out-of-openai-and-university-of-pennsylvania-suggests/?sh=420f9c8f73c7|titolo=Most Jobs Soon To Be 'Influenced' By Artificial Intelligence, Research Out Of OpenAI And University Of Pennsylvania Suggests|editore=[[Forbes]]|nome=Joe|cognome=Mckendrick|data=13 marzo 2023|accesso=16 aprile 2023|urlarchivio=https://web.archive.org/web/20230416155511/https://www.forbes.com/sites/joemckendrick/2023/03/26/most-jobs-soon-to-be-influenced-by-artificial-intelligence-research-out-of-openai-and-university-of-pennsylvania-suggests/?sh=420f9c8f73c7|urlmorto=no}}</ref>
 
Il primo GPT è stato introdotto nel 2018 da [[OpenAI]].<ref name="gpt1">{{Cita web|lingua=en|url=https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf|titolo=Improving Language Understanding by Generative Pre-Training|cognome1=Radford|nome1=Alec|cognome2=Narasimhan|nome2=Karthik|cognome3=Salimans|nome3=Tim|cognome4=Sutskever|nome4=Ilya|p=12|editore=[[OpenAI]]|data= 11 giugno 2018|accesso=23 gennaio 2021|urlarchivio=https://web.archive.org/web/20210126024542/https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf|urlmorto=no}}</ref> OpenAI ha rilasciato importanti [[#Foundation models|modelli fondamentali GPT]] numerati in sequenza, a formare la serie "GPT-''n''".<ref>{{Cita webwebfirst|url=https://www.makeuseof.com/gpt-models-explained-and-compared/|titolo=GPT-1 to GPT-4: Each of OpenAI's GPT Models Explained and Compared|data=11 aprile 2023|sito=MUO|accesso=3 maggio 2023|archive-date=15 aprile 2023|urlarchivio=https://web.archive.org/web/20230415175013/https://www.makeuseof.com/gpt-models-explained-and-compared/|urlmorto=no}}</ref> Ognuno di questi era significativamente più potente del precedente, grazie all’aumento delle dimensioni (numero di parametri addestrabili) e dell’addestramento. Il più recente, [[GPT-4o]], è stato rilasciato nel maggio 2024.<ref>{{Cita web |titolo=GPT-4 |url=https://openai.com/research/gpt-4 |accesso=8 dicembre 2023 |sito=openai.com |lingua=en |archive-date=14 marzo 2023 |urlarchivio=https://web.archive.org/web/20230314174531/https://openai.com/research/gpt-4 |urlmorto=no }}</ref> Tali modelli hanno costituito la base per [[#Task-specific models|sistemi GPT specializzati]], inclusi modelli [[instruction tuning|ottimizzati per seguire istruzioni]], che a loro volta alimentano [[ChatGPT]].<ref name=":1" />
Il primo GPT è stato introdotto nel 2018 da [[OpenAI]].<ref name="gpt1">{{Cita web
|url = https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
|title = Improving Language Understanding by Generative Pre-Training
|last1 = Radford
|first1 = Alec
|last2 = Narasimhan
|first2 = Karthik
|last3 = Salimans
|first3 = Tim
|last4 = Sutskever
|first4 = Ilya
|page = 12
|publisher = [[OpenAI]]
|date = 11 giugno 2018
|access-date = January 23, 2021
|archive-date = January 26, 2021
|archive-url = https://web.archive.org/web/20210126024542/https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
|url-status = live
}}</ref> OpenAI ha rilasciato importanti [[#Foundation models|modelli fondamentali GPT]] numerati in sequenza, a formare la serie "GPT-''n''".<ref>{{Cita web|url=https://www.makeuseof.com/gpt-models-explained-and-compared/|titolo=GPT-1 to GPT-4: Each of OpenAI's GPT Models Explained and Compared|data=11 aprile 2023|sito=MUO|accesso=3 maggio 2023|archive-date=15 aprile 2023|urlarchivio=https://web.archive.org/web/20230415175013/https://www.makeuseof.com/gpt-models-explained-and-compared/|urlmorto=no}}</ref> Ognuno di questi era significativamente più potente del precedente, grazie all’aumento delle dimensioni (numero di parametri addestrabili) e dell’addestramento. Il più recente, [[GPT-4o]], è stato rilasciato nel maggio 2024.<ref>{{Cita web |titolo=GPT-4 |url=https://openai.com/research/gpt-4 |accesso=8 dicembre 2023 |sito=openai.com |lingua=en |archive-date=14 marzo 2023 |urlarchivio=https://web.archive.org/web/20230314174531/https://openai.com/research/gpt-4 |urlmorto=no }}</ref> Tali modelli hanno costituito la base per [[#Task-specific models|sistemi GPT specializzati]], inclusi modelli [[instruction tuning|ottimizzati per seguire istruzioni]], che a loro volta alimentano [[ChatGPT]].<ref name=":1" />
 
Il termine "GPT" è utilizzato anche nei nomi e nelle descrizioni di modelli sviluppati da altri. Ad esempio, altri modelli fondamentali GPT includono una serie di modelli creati da [[EleutherAI]],<ref name=":9">{{Cita web |cognome=Alford |nome=Anthony |data=13 luglio 2021 |titolo=EleutherAI Open-Sources Six Billion Parameter GPT-3 Clone GPT-J |url=https://www.infoq.com/news/2021/07/eleutherai-gpt-j/ |sito=InfoQ |accesso=3 aprile 2023 |archive-date=10 febbraio 2023 |urlarchivio=https://web.archive.org/web/20230210114137/https://www.infoq.com/news/2021/07/eleutherai-gpt-j/ |urlmorto=no }}</ref> e sette modelli creati da [[Cerebras]] nel 2023.<ref name=":10">{{Cita web | url=https://www.businesswire.com/news/home/20230328005366/en/Cerebras-Systems-Releases-Seven-New-GPT-Models-Trained-on-CS-2-Wafer-Scale-Systems |titolo=News |accesso=5 aprile 2023 | archive-date=5 aprile 2023 |urlarchivio=https://web.archive.org/web/20230405080938/https://www.businesswire.com/news/home/20230328005366/en/Cerebras-Systems-Releases-Seven-New-GPT-Models-Trained-on-CS-2-Wafer-Scale-Systems |urlmorto=no }}</ref> Aziende in vari settori hanno sviluppato GPT specializzati per compiti specifici nei rispettivi ambiti, come "EinsteinGPT" di [[Salesforce]] (per la [[gestione delle relazioni con i clienti|CRM]])<ref>{{Cita web |cognome1=Morrison |nome1=Ryan |titolo=Salesforce launches EinsteinGPT built with OpenAI technology |url=https://techmonitor.ai/technology/ai-and-automation/salesforce-einsteingpt-openai-chatgpt |sito=Tech Monitor |data=7 marzo 2023 |accesso=10 aprile 2023 |archive-date=15 aprile 2023 |urlarchivio=https://web.archive.org/web/20230415095633/https://techmonitor.ai/technology/ai-and-automation/salesforce-einsteingpt-openai-chatgpt |urlmorto=no }}</ref> e "BloombergGPT" di [[Bloomberg L.P.|Bloomberg]] (per la finanza).<ref>{{Cita web | url=https://www.forbes.com/sites/jamielsheikh/2023/04/05/the-chatgpt-of-finance-is-here-bloomberg-is-combining-ai-and-fintech/?sh=43b4385e3081 |titolo=The ChatGPT of Finance is Here, Bloomberg is Combining AI and Fintech |sito=[[Forbes]] |accesso=6 aprile 2023 | archive-date=6 aprile 2023 |urlarchivio=https://web.archive.org/web/20230406140911/https://www.forbes.com/sites/jamielsheikh/2023/04/05/the-chatgpt-of-finance-is-here-bloomberg-is-combining-ai-and-fintech/?sh=43b4385e3081 |urlmorto=no }}</ref>
 
== Note ==