Răzvan Tătaru

I/O 2024: Cele mai importante lansări de la evenimentul Google – Inteligența Artificială, la baza conferinței

Captură de ecran Google I/O 2024

Așa cum era de așteptat, conferința anuală pentru dezvoltatori realizată de Google a fost despre inteligență artificială și integrarea acesteia în mai multe produse ale companiei. StartupCafe.ro prezintă cele mai importante lansări din cadrul Google I/O 2024.

Modelele de inteligență artificială Google Gemini și Gemma

Modelul AI Gemini este integrat în 2 miliarde de produse Google, așa cum a spus directorul general (CEO-ul) Sundar Pichai, iar în cadrul prezentării, acesta a primit o serie de îmbunătățiri.

Gemini 1.5 Pro a primit actualizări ale performanței, în special pe partea de traducere, codare și procesare a cerințelor.

Totodată, Google a prezentat și modelul Gemini 1.5 Flash, un model lingvistic AI mai mic, destinat sarcinilor mai mici sau cu o frecvență mai mare, unde viteza de răspuns contează.

Ambele sunt multimodale, suportând introducerea de text, imagini, audio și video.

Modelele sunt disponibile acum în AI Studio și Gemini API în fază de testare, cu o lansare generală în iunie 2024.

În plus, gama de modele AI „deschise” Gemma primește o actualizare prin Gemma 2, mai mare decât prima generație, dar în continuare ușor de utilizat. Potrivit spuselor Google, modelul Gemma 27B depășește unele modele care sunt de peste două ori mai mari și va rula eficient pe GPU-uri sau pe un singur host TPU în Vertex AI.

Totodată, a fost lansat și modelul open destinat imaginilor PaliGemma, optimizat pentru subtitrări de imagini, întrebări și răspunsuri vizuale și alte sarcini de etichetare a imaginilor.

Google DeepMind, VideoFX, Veo și Imagen 3

Laboratorul de inteligență artificială al companiei, Google DeepMind, a prezentat VideoFX, un instrument experimental care permite utilizatorilor să genereze videoclipuri prin anumite cerințe. Acesta a fost construit pe baza noului model Veo, destinat generării de videoclipuri.

Momentan, aplicația este disponibilă în test restrâns în Statele Unite.

Totodată, instrumentele ImageFX și MusicFX au primit actualizări și au devenit disponibile în 110 țări. România încă nu se află printre țările care suportă funcțiile din AI Labs.

Modelul AI Veo poate genera videoclipuri de înaltă rezoluție (1080p) în stiluri vizuale și cinematice diferite.

Modelul de generare de imagini Imagen ajunge la versiunea a 3-a, care poate reproduce într-un mod mai realist texturi și detalii. Acesta este disponibil în test restrâns în ImageFX, prin înregistrare, și va deveni disponibil în curând prin soluția Vertex AI.

Aplicațiile Google și Android, cu „un strop” de Gemini

Compania a prezentat noi funcții bazate pe AI în aplicația de căutare Google și în galeria Google Photos.

Astfel, rezultatele generate de IA vor fi disponibile mai întâi pentru toți utilizatorii din Statele Unite, ca mai apoi să se extindă în mai multe țări. Noile „AI Overviews”, așa cum le numește Google, sunt bazate pe un model Gemini creat special pentru motorul de căutare, potrivit spuselor companiei, care permite întrebări mai lungi sau cerințe de simplificare ale rezultatelor.

În fază experimentală deocamdată, Google poate căuta cu inteligență artificială și prin camera telefonului, cu Google Lens. Momentan, funcția va fi disponibilă în AI Labs, în SUA, pentru căutările în limba engleză.

Google Photos primește o funcție de căutare cu ajutorul Gemini, numită „Ask Photos”. Astfel, utilizatorii pot să caute imagini din galerie într-un mod mai natural decât până acum, de exemplu „arată-mi cea mai bună poză de la fiecare parc național vizitat”. Totodată, funcția poate oferi context pentru imagini sau răspunsuri la întrebări specifice legate de pozele din galerie.

Android n-a fost uitat în „marea” de inteligență artificială, prin actualizări ale funcției „Circle to Search”, a noului asistent Gemini și altele.

„Circle to Search”, funcția de căutare pe ecran cu ajutorul Google, prezentă prima dată pe Samsung Galaxy S24, acum poate ajuta elevii și studenții cu temele prin oferirea de metode de rezolvare și nu printr-un răspuns imediat.

Google Gemini pe Android, care poate înlocui Google Assistant, va putea oferi informații în funcție de contextul de pe ecran, cum ar fi generarea de imagini care pot fi copiate în Gmail sau în aplicația de mesaje, sau căutarea pe baza unui video de pe YouTube.

Începând cu seria de telefoane Pixel, la sfârșitul lui 2024, modelul Gemini Nano va deveni multimodal. Astfel, telefoanele vor putea să proceseze text, imagini, sunete și voce pe dispozitiv.

Totodată, Gemini Nano ajunge în aplicația TalkBack, pentru accesibilitatea utilizatorilor. Astfel, modelul va ajuta în descrierea mai bună a imaginilor pentru persoanele cu deficiențe de vedere.

Gemini Nano va ajuta și în aplicația de telefon, prin alertarea utilizatorilor despre potențialele apeluri frauduloase. Acțiunea se desfășoară pe dispozitiv, iar funcția se va lansa mai târziu anul acesta.

  • Vizionați toată conferința sau cele mai importante puncte în 10 minute:
Parallax

Vizualizari
188
Conţinut
Parerea ta despre articol
Adauga comentariu

- Ultimele știri -

 


  Ultimele știri