LLaMA non è come ChatGPT o Bing; non è un sistema con cui chiunque può parlare. Piuttosto, è uno strumento di ricerca che Meta afferma di condividere nella speranza di “democratizzare l’accesso in questo campo importante e in rapida evoluzione”. In altre parole: aiutare gli esperti a risolvere i problemi dei modelli linguistici di intelligenza artificiale, dai pregiudizi e la tossicità alla loro tendenza a inventare semplicemente informazioni.
A tal fine, Meta sta rilasciando LLaMA (che in realtà non è un singolo sistema ma un quartetto di modelli di diverse dimensioni) con “una licenza non commerciale incentrata sui casi d’uso della ricerca”, con accesso concesso a gruppi come università, ONG e laboratori industriali .
“Riteniamo che l’intera comunità dell’IA – ricercatori accademici, società civile, responsabili politici e industria – debba lavorare insieme per sviluppare linee guida chiare sull’IA responsabile in generale e sui modelli di linguaggio di grandi dimensioni responsabili in particolare”, ha scritto la società nel suo post. “Non vediamo l’ora di vedere cosa la comunità può imparare – e alla fine costruire – utilizzando LLaMA”.
In un documento di ricerca, Meta afferma che la seconda versione più piccola del modello LLaMA, LLaMA-13B, ha prestazioni migliori del popolare modello GPT-3 di OpenAI “sulla maggior parte dei benchmark”, mentre il più grande, LLaMA-65B, è “competitivo con il migliori modelli”, come il Chinchilla70B di DeepMind e il PaLM 540B di Google. (I numeri in questi nomi si riferiscono ai miliardi di parametri in ciascun modello: una misura delle dimensioni del sistema e un’approssimazione approssimativa della sua sofisticatezza, sebbene queste due qualità non si ridimensionino necessariamente di pari passo.)
Una volta addestrato, LLaMA-13B può essere eseguito anche su una singola GPU Nvidia Tesla V100 di livello data center. Questa sarà una buona notizia per le istituzioni più piccole che vogliono eseguire test su questi sistemi, ma non significa molto per i ricercatori solitari per i quali tali apparecchiature sono fuori portata.
Meta ha effettivamente rilasciato i propri chatbot AI accessibili in passato, ma l’accoglienza è stata tutt’altro che eccezionale. Uno, chiamato BlenderBot, è stato criticato per essere semplicemente… non molto buono, mentre un altro, chiamato Galactica, progettato per scrivere articoli scientifici, è stato messo offline dopo soli tre giorni dopo aver continuato a produrre sciocchezze scientifiche.
Con il quartetto LLaMA, Meta presumibilmente spera in un’accoglienza più gentile.
“Oggi stiamo rilasciando un nuovo modello di linguaggio di grandi dimensioni AI all’avanguardia chiamato LLaMA progettato per aiutare i ricercatori a far progredire il loro lavoro”, ha dichiarato il CEO Mark Zuckerberg in un post su Facebook. “Gli LLM hanno mostrato molte promesse nel generare testi, conversazioni, riassumere materiale scritto e compiti più complicati come risolvere teoremi matematici o prevedere strutture proteiche. Meta è impegnata in questo modello di ricerca aperto e renderemo disponibile il nostro nuovo modello alla comunità di ricerca sull’IA”.