Generative pre-trained transformer: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
fix parametri template, altri fix minori |
m fix parametri template |
||
(2 versioni intermedie di 2 utenti non mostrate) | |||
Riga 2:
Un '''generative pre-trained transformer''' (o '''GPT''', in italiano '''trasformatore generativo pre-addestrato''') è un tipo di [[modello linguistico di grandi dimensioni]] (LLM)<ref name=":1">{{Cita web|lingua=en|url=https://www.aljazeera.com/news/2023/3/15/how-do-ai-models-like-gpt-4-work-and-how-can-you-start-using-it|titolo=How does GPT-4 work and how can you start using it in ChatGPT?|nome=Mohammed|cognome=Haddad|sito=www.aljazeera.com|accesso=10 aprile 2023|urlarchivio=https://web.archive.org/web/20230705224641/https://www.aljazeera.com/news/2023/3/15/how-do-ai-models-like-gpt-4-work-and-how-can-you-start-using-it|urlmorto=no}}</ref><ref name=":0">{{Cita web|lingua=en|url=https://www.weforum.org/agenda/2023/01/davos23-generative-ai-a-game-changer-industries-and-society-code-developers/|titolo=Generative AI: a game-changer society needs to be ready for|sito=World Economic Forum|data=9 gennaio 2023|accesso=8 aprile 2023|urlarchivio=https://web.archive.org/web/20230425234858/https://www.weforum.org/agenda/2023/01/davos23-generative-ai-a-game-changer-industries-and-society-code-developers/|urlmorto=no}}</ref><ref name=":4">{{Cita web|lingua=en|url=https://time.com/6271657/a-to-z-of-artificial-intelligence/|titolo=The A to Z of Artificial Intelligence|data=13 aprile 2023|editore=Time|accesso=14 aprile 2023|urlarchivio=https://web.archive.org/web/20230616123839/https://time.com/6271657/a-to-z-of-artificial-intelligence/|urlmorto=no}}</ref> e un importante framework per l’[[intelligenza artificiale generativa]].<ref>{{Cita web|lingua=en|url=https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2|titolo=Generative AI and Future|nome=Luhui|cognome=Hu|data=15 novembre 2022|sito=Medium|accesso=29 aprile 2023|urlarchivio=https://web.archive.org/web/20230605023010/https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2|urlmorto=no}}</ref><ref>{{Cita web|lingua=en|url=https://www.computer.org/csdl/magazine/co/2022/10/09903869/1H0G6xvtREk|titolo=CSDL | IEEE Computer Society|sito=www.computer.org|accesso=29 aprile 2023|urlarchivio=https://web.archive.org/web/20230428171218/https://www.computer.org/csdl/magazine/co/2022/10/09903869/1H0G6xvtREk|urlmorto=no}}</ref> Si tratta di una [[rete neurale artificiale]] usata per l’[[elaborazione del linguaggio naturale]] da parte delle macchine.<ref>{{Cita web|lingua=en|titolo= LibGuides: Using AI Language Models : ChatGPT|url= https://hallmark.libguides.com/c.php?g=1312147&p=9644939|accesso=7 dicembre 2023|urlarchivio= https://web.archive.org/web/20231208014633/https://hallmark.libguides.com/c.php?g=1312147&p=9644939|urlmorto=no}}</ref> È basata sull’[[Trasformatore (informatica)|architettura transformer]] del deep learning, pre-addestrata su grandi [[dataset]] di testi non etichettati e in grado di generare nuovi contenuti simili a quelli umani.<ref name=":0" /><ref name=":4" /> A partire dal 2023, la maggior parte dei LLM presentava queste caratteristiche<ref>{{Cita web|lingua=en|url=https://www.forbes.com/sites/robtoews/2023/02/07/the-next-generation-of-large-language-models/|titolo=The Next Generation Of Large Language Models|nome=Rob|cognome=Toews|sito=Forbes|accesso=9 aprile 2023|urlarchivio=https://web.archive.org/web/20230414030738/https://www.forbes.com/sites/robtoews/2023/02/07/the-next-generation-of-large-language-models/|urlmorto=no}}</ref> ed erano talvolta definiti in modo generico come GPT.<ref>{{Cita web|lingua=en|url=https://www.forbes.com/sites/joemckendrick/2023/03/26/most-jobs-soon-to-be-influenced-by-artificial-intelligence-research-out-of-openai-and-university-of-pennsylvania-suggests/?sh=420f9c8f73c7|titolo=Most Jobs Soon To Be 'Influenced' By Artificial Intelligence, Research Out Of OpenAI And University Of Pennsylvania Suggests|editore=[[Forbes]]|nome=Joe|cognome=Mckendrick|data=13 marzo 2023|accesso=16 aprile 2023|urlarchivio=https://web.archive.org/web/20230416155511/https://www.forbes.com/sites/joemckendrick/2023/03/26/most-jobs-soon-to-be-influenced-by-artificial-intelligence-research-out-of-openai-and-university-of-pennsylvania-suggests/?sh=420f9c8f73c7|urlmorto=no}}</ref>
Il primo GPT è stato introdotto nel 2018 da [[OpenAI]].<ref name="gpt1">{{Cita web|lingua=en|url=https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf|titolo=Improving Language Understanding by Generative Pre-Training|cognome1=Radford|nome1=Alec|cognome2=Narasimhan|nome2=Karthik|cognome3=Salimans|nome3=Tim|cognome4=Sutskever|nome4=Ilya|p=12|editore=[[OpenAI]]|data= 11 giugno 2018|accesso=23 gennaio 2021|urlarchivio=https://web.archive.org/web/20210126024542/https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf|urlmorto=no}}</ref> OpenAI ha rilasciato importanti [[#Foundation models|modelli fondamentali GPT]] numerati in sequenza, a formare la serie "GPT-''n''".<ref>{{Cita web|lingua=en|url=https://www.makeuseof.com/gpt-models-explained-and-compared/|titolo=GPT-1 to GPT-4: Each of OpenAI's GPT Models Explained and Compared|data=11 aprile 2023|sito=MUO|accesso=3 maggio
▲}}</ref> OpenAI ha rilasciato importanti [[#Foundation models|modelli fondamentali GPT]] numerati in sequenza, a formare la serie "GPT-''n''".<ref>{{Cita web|url=https://www.makeuseof.com/gpt-models-explained-and-compared/|titolo=GPT-1 to GPT-4: Each of OpenAI's GPT Models Explained and Compared|data=11 aprile 2023|sito=MUO|accesso=3 maggio 2023|archive-date=15 aprile 2023|urlarchivio=https://web.archive.org/web/20230415175013/https://www.makeuseof.com/gpt-models-explained-and-compared/|urlmorto=no}}</ref> Ognuno di questi era significativamente più potente del precedente, grazie all’aumento delle dimensioni (numero di parametri addestrabili) e dell’addestramento. Il più recente, [[GPT-4o]], è stato rilasciato nel maggio 2024.<ref>{{Cita web |titolo=GPT-4 |url=https://openai.com/research/gpt-4 |accesso=8 dicembre 2023 |sito=openai.com |lingua=en |archive-date=14 marzo 2023 |urlarchivio=https://web.archive.org/web/20230314174531/https://openai.com/research/gpt-4 |urlmorto=no }}</ref> Tali modelli hanno costituito la base per [[#Task-specific models|sistemi GPT specializzati]], inclusi modelli [[instruction tuning|ottimizzati per seguire istruzioni]], che a loro volta alimentano [[ChatGPT]].<ref name=":1" />
Il termine "GPT" è utilizzato anche nei nomi e nelle descrizioni di modelli sviluppati da altri. Ad esempio, altri modelli fondamentali GPT includono una serie di modelli creati da [[EleutherAI]],<ref name=":9">{{Cita web
== Note ==
<references />
{{Intelligenza_artificiale}}
[[Categoria:Intelligenza artificiale]]
|