Google ogłosiło premierę Gemini 3 – najnowszej generacji swojego flagowego modelu sztucznej inteligencji. Firma deklaruje, że jest to jej "najinteligentniejszy model", który przesuwa granice w zakresie rozumowania, vibe codingu oraz działań agentowych. Nowa wersja trafia od razu do wyszukiwarki oraz narzędzi dla programistów.
Sundar Pichai, CEO Google i Alphabet, podkreślił, że w ciągu dwóch lat AI przeszła drogę od prostego odczytywania tekstu i obrazów do odczytywania nastrojów i niuansów. Gemini 3 ma być odpowiedzią na potrzebę głębszego zrozumienia intencji użytkownika, co ma skutkować precyzyjniejszymi odpowiedziami przy mniejszej liczbie promptów.
Podczas gdy Gemini 1 wprowadziło natywną multimodalność, a Gemini 2 położyło podwaliny pod systemy agentowe, Gemini 3 skupia się na jakości rozumowania i "ludzkim" wymiarze interakcji.
Oto najważniejsze cechy wyróżniające nowy model:
Wraz z nowym modelem Google zaprezentowało Google Antigravity – nową platformę programistyczną opartą na agentach. To zmiana paradygmatu w tworzeniu oprogramowania. AI przestaje być tylko podpowiadaczem kodu w IDE, a staje się aktywnym partnerem.
Agenci w środowisku Antigravity posiadają dedykowany interfejs i bezpośredni dostęp do edytora, terminala oraz przeglądarki. Mogą autonomicznie planować zadania, pisać kod, a następnie samodzielnie go weryfikować i uruchamiać.
Google zapowiedziało również wariant Gemini 3 Deep Think. Jest to ulepszony tryb rozumowania przeznaczony do rozwiązywania najbardziej złożonych problemów naukowych i logicznych. W testach ARC-AGI osiągnął on bezprecedensowy wynik 45,1%.
Obecnie tryb ten przechodzi testy bezpieczeństwa i w najbliższych tygodniach zostanie udostępniony subskrybentom pakietu Google AI Ultra.
Google zdecydowało się na szerokie udostępnienie modelu już w dniu premiery. Jest on dostępny w następujących kanałach:
Google zapewnia, że Gemini 3 to najbezpieczniejszy model w historii firmy. Został przetestowany zgodnie z Frontier Safety Framework oraz poddany ocenie zewnętrznych ekspertów (m.in. z brytyjskiego AISI oraz zespołu Apollo). Model wykazuje wyższą odporność na ataki typu prompt injection i jest mniej podatny na manipulacje.
OpenAI było pierwsze ze swoim konsumenckim modelem ChatGPT i przez dłuższy czas działało lub nadal działa lepiej od produktów konkurencji, albo przynajmniej na jej poziomie. Korzystanie z produktu firmy, która skupia się tylko na nim może mieć swoje zalety. Czemu zatem przyglądać się jakiemuś Gemini?
Google to cały ekosystem różnych produktów i prawie każdy korzysta przynajmniej z kilku - od wyszukiwarki, przez maila, YouTube czy nawigację. Gemini jako produkt Google uzupełniający ten ekosystem może wykorzystywać ten fakt i oferować użytkownikom wartość dodaną. Na przykład Gemini może streścić nam treść filmu na YouTube i podać najważniejsze wnioski. Nie musi w tym celu „obejrzeć całego wideo”, wystarczy, że ma dostęp do wbudowanych w serwis napisów i automatycznych transkrypcji. Integracja z kolejnymi produktami Google będzie tylko postępować. W planie Pro jest też aż 2 TB przestrzeni współdzielonej z Dyskiem Google, Gmailem czy Zdjęciami Google.
AI jest też coraz istotniejszą częścią Androida oraz Android XR w goglach z rozszerzoną rzeczywistością. Siłą rzeczy AI Google nie musi być najlepsze, aby przyciągnąć użytkowników, wystarczy, że nie będzie gorsze i przyciągnie do siebie grawitacyjną siłą swojego ogromnego ekosystemu.
