Minerva (modello linguistico)

Modello linguistico avanzato sviluppato dal gruppo di ricerca Sapienza NLP presso l'Università Sapienza di Roma

Minerva è una famiglia di modelli linguistici di grandi dimensioni sviluppata dal gruppo di ricerca Sapienza NLP[1], presso la Sapienza Università di Roma, guidato da Roberto Navigli. È stato addestrato da zero con un focus primario sulla lingua italiana.[2][3][4]

Minerva LLM
software
GenereModello linguistico di grandi dimensioni (non in lista)
SviluppatoreSapienza Università di Roma
Sistema operativoMultipiattaforma
Sito webminerva-llm.org

I modelli utilizzano tecniche di apprendimento profondo, in particolare un'architettura a trasformatore. Sono stati addestrati su un ampio corpus di dati testuali e sono ottimizzati - tramite il cosiddetto instruction tuning - per svolgere vari compiti di elaborazione del linguaggio naturale mirati a comprendere e generare testo simile a quello umano, come la traduzione automatica, il riassunto di testi e la risposta a domande.[5]

La versione con 7 miliardi di parametri è stata inoltre sottoposta a un raffinamento per evitare la generazione di contenuti indesiderati utilizzando una tassonomia di temi di sicurezza a grana fine e creando un dataset di 21.000 istruzioni in italiano insieme alle loro risposte desiderate.[6]

  1. ^ Minerva LLMs - sito web, su nlp.uniroma1.it. URL consultato il 19 aprile 2025.
  2. ^ Ecco Minerva, la prima famiglia di LLM addestrati da zero in italiano, in ANSA, 2 maggio 2024. URL consultato il 19 aprile 2025.
  3. ^ La via italiana ai chatbot del futuro: presentata l'ultima versione di Minerva, il modello linguistico AI targato Sapienza, su uniroma1.it. URL consultato il 19 aprile 2025.
  4. ^ Minerva 7B, l'IA generativa italiana è diventata grande, in ANSA, 27 novembre 2024. URL consultato il 19 aprile 2025.
  5. ^ Cosa può fare la nuova versione di Minerva 7B?, in il Sole 24 Ore, 27 novembre 2024. URL consultato il 12 febbraio 2025.
  6. ^ Minerva Tech Page, su nlp.uniroma1.it. URL consultato il 20 aprile 2025.

Collegamenti esterni

modifica
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica