Il gigante tecnologico Google ha presentato ufficialmente Gemini, il suo ultimo modello di intelligenza artificiale (AI), sostenendo di aver superato GPT-4 di OpenAI.
Il 6 Dicembre, Sundar Pichai, CEO di Google, e Demis Hassabis, CEO e co-fondatore di Google DeepMind, hanno annunciato il lancio di Gemini tramite un post sul blog aziendale.
Il modello di intelligenza artificiale è stato ottimizzato per diverse dimensioni e casi d'uso (Ultra, Pro, Nano) ed è stato costruito per essere multimodale in modo da comprendere e combinare diversi tipi di informazioni.
Rispetto a GPT-4 di OpenAI, che non è in grado di eseguire operazioni matematiche, il modello è anche più avanzato nella matematica e nella codifica specializzata.
Secondo Google, la versione Ultra raggiunge "prestazioni all'avanguardia" in 30 dei 32 benchmark accademici utilizzati per lo sviluppo di modelli linguistici di grandi dimensioni.
Inoltre, a detta di Google, ha ottenuto un punteggio del 90% in un test di massive multitask language understanding (MMLU), superando le prestazioni di un umano esperto.
Jeff Dean, Chief Scientist di Google, ha dichiarato che Gemini Ultra è il primo modello "a raggiungere prestazioni da umano esperto su MMLU in 57 soggetti con un punteggio superiore al 90%".
Condividiamo un tweet su X di — Jeff Dean (@) (@JeffDean) December 6, 2023
Sono entusiasta di condividere il nostro lavoro su Gemini! Gemini è una famiglia di modelli multimodali che dimostrano capacità davvero notevoli nei campi delle immagini, dell'audio, del video e del testo. Il nostro modello più potente, Gemini Ultra, ha migliorato lo standard in 30 dei 32 benchmark,... pic.twitter.com/sQfxBy9tpT
I’m very excited to share our work on Gemini today! Gemini is a family of multimodal models that demonstrate really strong capabilities across the image, audio, video, and text domains. Our most-capable model, Gemini Ultra, advances the state of the art in 30 of 32 benchmarks,… pic.twitter.com/sQfxBy9tpT
— Jeff Dean (@) (@JeffDean) December 6, 2023
Inoltre, il sistema è stato progettato fin dall'inizio per funzionare senza soluzione di continuità tra testo, immagini, audio e video, il che lo pone in una posizione di vantaggio rispetto ai suoi concorrenti.
"Abbiamo progettato Gemini per essere multimodale fin dall'inizio", ha dichiarato Dean, aggiungendo: "piuttosto che iniziare con un modello puramente testuale e poi inserire a posteriori codificatori audio e visivi".

Gemini ha anche capacità di programmazione avanzate, compresa la generazione di codice di alta qualità con AlphaCode 2, un sistema avanzato di "code-generation". Può anche risolvere problemi di programmazione complessi e collaborare con gli sviluppatori.
Secondo Rowan Cheung, esperto di intelligenza artificiale, Gemini Pro ha superato GPT-3.5 in sei degli otto benchmark, "diventando così il chatbot gratuito più potente attualmente sul mercato".

Secondo Google, per coloro che desiderano provare il nuovo modello di intelligenza artificiale, una versione perfezionata di Gemini Pro è già stata distribuita nella versione ChatGPT di Google — nota come Bard.
"Questo è il più grande aggiornamento di Bard dal suo lancio. Sarà disponibile in inglese in più di 170 paesi e territori, abbiamo in programma di espanderci ad altre modalità e di supportare nuove lingue e località nel prossimo futuro", ha dichiarato l'azienda.

Gemini è disponibile anche su Pixel 8 Pro, il telefono simbolo di Google.
"Pixel 8 Pro è il primo smartphone progettato per eseguire Gemini Nano, che sta alimentando nuove funzionalità come Summarize nell'app Recorder e Smart Reply in Gboard, a cominciare da WhatsApp — con altre app di messaggistica in arrivo il prossimo anno", ha dichiarato.
Il sistema sarà implementato in altri prodotti e servizi di Google come Search, Ads e Chrome "nei prossimi mesi", ha aggiunto.
Inoltre, il gigante tecnologico ha iniziato a sperimentare Gemini per alimentare il suo motore di ricerca in modo da rendere l'attività un'esperienza generativa.
Google ha presentato Gemini all'inizio di quest'anno, pubblicizzando le sue capacità e affermando che sarebbe stato più potente di ChatGPT.