Răzvan Tătaru

Google prezintă noul model de inteligență artificială Gemini 2.0

Google Gemini 2.0

Google a anunțat noul model IA Gemini 2.0, capabil de generarea de imagini și audio și care permite construirea de agenți cu inteligență artificială.

Modelul Gemini 2.0 Flash începe să fie integrat în „robotul” conversațional al companiei pentru toți utilizatorii, a spus Sundar Pichai, CEO-ul Google. Totodată, Google lansează și funcția „Deep Research” pentru abonații Advanced, care face din Gemini un asistent pentru cercetarea de subiecte în amănunt, cu o fereastră largă de context.

Funcția de „AI Overviews”, disponibilă în Google Search (nu încă în România), primește o actualizare bazată pe noul model, care permite abordarea de subiecte mai complexe și întrebări în mai mulți pași, inclusiv ecuații matematice avansate, interogări multimodale și codare.

Ce poate face 2.0 Flash

Versiunea nouă Gemini 2.0 Flash întrece 1.5 Pro în testele interne ale companiei și suportă „input” în format text, foto, video și audio. 2.0 Flash acceptă acum „output” multimodal, cum ar fi imagini generate nativ amestecate cu text și audio multilingv text-to-speech (TTS).

De asemenea, poate apela în mod nativ la instrumente precum Căutarea Google, executarea codului, precum și funcții definite de utilizatori terți.

Momentan, 2.0 Flash este disponibil ca model experimental în interfața de programare (API) oferită de companie prin Google AI Studio și Vertex AI pe Google Cloud.

Modelul este introdus de acum și în varianta web a chatbot-ului Gemini, pe telefon și pe desktop, ca mai apoi să fie adăugat și în aplicația mobilă.

„La începutul anului viitor, vom extinde Gemini 2.0 la mai multe produse Google”, a scris compania pe blogul oficial.

„Era experiențelor realizate de agenți”

Noul model AI al Google permite crearea și dezvoltarea agenților care pot ușura experiențele utilizatorilor.

Astfel, Project Astra, prezentat prima dată la I/O 2024, devine mai conversațional, poate folosi mai multe instrumente Google, cum ar fi Search, Lens sau Maps (Hărți), iar memoria este îmbunătățită, pentru a putea răspunde în context în timp.

Un alt proiect de agent cu IA este Project Mariner, aflat încă în fază de cercetare, prin care se explorează interacțiunile dintre agenți și oameni, începând cu browserul.

Ca prototip de cercetare, este capabil să înțeleagă și să raționeze informațiile de pe ecranul browserului, inclusiv pixeli și elemente web, cum ar fi text, cod, imagini și formulare, și apoi folosește aceste informații printr-o extensie Chrome experimentală pentru a finaliza sarcinile.

Momentan, Project Mariner poate doar să tasteze, să deruleze sau să facă clic în fila activă din browser și cere utilizatorilor confirmarea finală înainte de a realiza anumite acțiuni sensibile, cum ar fi achiziția unui lucru.

Un alt agent este Jules, care poate ajuta utilizatorii în scrierea de cod, fiind integrat cu GitHub. Poate aborda o problemă, dezvolta un plan și îl poate executa, totul sub îndrumarea și supravegherea unui dezvoltator.

Parallax

Vizualizari
318
Conţinut
Parerea ta despre articol
Adauga comentariu

- Ultimele știri -

 

  Ultimele știri