Il gigante tecnologico Google ha presentato ufficialmente Gemini, il suo ultimo modello di intelligenza artificiale (AI), sostenendo di aver superato GPT-4 di OpenAI.

Il 6 Dicembre, Sundar Pichai, CEO di Google, e Demis Hassabis, CEO e co-fondatore di Google DeepMind, hanno annunciato il lancio di Gemini tramite un post sul blog aziendale.

Il modello di intelligenza artificiale è stato ottimizzato per diverse dimensioni e casi d'uso (Ultra, Pro, Nano) ed è stato costruito per essere multimodale in modo da comprendere e combinare diversi tipi di informazioni.

Rispetto a GPT-4 di OpenAI, che non è in grado di eseguire operazioni matematiche, il modello è anche più avanzato nella matematica e nella codifica specializzata.

Secondo Google, la versione Ultra raggiunge "prestazioni all'avanguardia" in 30 dei 32 benchmark accademici utilizzati per lo sviluppo di modelli linguistici di grandi dimensioni.

Inoltre, a detta di Google, ha ottenuto un punteggio del 90% in un test di massive multitask language understanding (MMLU), superando le prestazioni di un umano esperto.

Jeff Dean, Chief Scientist di Google, ha dichiarato che Gemini Ultra è il primo modello "a raggiungere prestazioni da umano esperto su MMLU in 57 soggetti con un punteggio superiore al 90%".

Condividiamo un tweet su X di — Jeff Dean (@) (@JeffDean) December 6, 2023

Sono entusiasta di condividere il nostro lavoro su Gemini! Gemini è una famiglia di modelli multimodali che dimostrano capacità davvero notevoli nei campi delle immagini, dell'audio, del video e del testo. Il nostro modello più potente, Gemini Ultra, ha migliorato lo standard in 30 dei 32 benchmark,... pic.twitter.com/sQfxBy9tpT

Inoltre, il sistema è stato progettato fin dall'inizio per funzionare senza soluzione di continuità tra testo, immagini, audio e video, il che lo pone in una posizione di vantaggio rispetto ai suoi concorrenti.

"Abbiamo progettato Gemini per essere multimodale fin dall'inizio", ha dichiarato Dean, aggiungendo: "piuttosto che iniziare con un modello puramente testuale e poi inserire a posteriori codificatori audio e visivi".

Illustrazione delle capacità multimodali di Gemini. Fonte: X/JeffDean

Gemini ha anche capacità di programmazione avanzate, compresa la generazione di codice di alta qualità con AlphaCode 2, un sistema avanzato di "code-generation". Può anche risolvere problemi di programmazione complessi e collaborare con gli sviluppatori.

Secondo Rowan Cheung, esperto di intelligenza artificiale, Gemini Pro ha superato GPT-3.5 in sei degli otto benchmark, "diventando così il chatbot gratuito più potente attualmente sul mercato".

Confronto tra le prestazioni di Gemini e ChatGPT. Fonte: Google

Secondo Google, per coloro che desiderano provare il nuovo modello di intelligenza artificiale, una versione perfezionata di Gemini Pro è già stata distribuita nella versione ChatGPT di Google — nota come Bard.

"Questo è il più grande aggiornamento di Bard dal suo lancio. Sarà disponibile in inglese in più di 170 paesi e territori, abbiamo in programma di espanderci ad altre modalità e di supportare nuove lingue e località nel prossimo futuro", ha dichiarato l'azienda.

La risposta di Google Bard alla domanda su quale modello di intelligenza artificiale stia utilizzando. 

Gemini è disponibile anche su Pixel 8 Pro, il telefono simbolo di Google.

"Pixel 8 Pro è il primo smartphone progettato per eseguire Gemini Nano, che sta alimentando nuove funzionalità come Summarize nell'app Recorder e Smart Reply in Gboard, a cominciare da WhatsApp — con altre app di messaggistica in arrivo il prossimo anno", ha dichiarato.

Il sistema sarà implementato in altri prodotti e servizi di Google come Search, Ads e Chrome "nei prossimi mesi", ha aggiunto.

Inoltre, il gigante tecnologico ha iniziato a sperimentare Gemini per alimentare il suo motore di ricerca in modo da rendere l'attività un'esperienza generativa.

Google ha presentato Gemini all'inizio di quest'anno, pubblicizzando le sue capacità e affermando che sarebbe stato più potente di ChatGPT.