Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

Newsy
Opinie: 0
Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

Anthropic zaprezentowało dziś dwa potężne modele klasy „Mythos”: Claude Fable 5, przeznaczony do ogólnego użytku oraz Claude Mythos 5, wersja odblokowana dla partnerów rządowych i badawczych. Wraz z premierą Mythosa coraz bardziej wkraczamy w erę systemów agentowych. Niesie to jednak za sobą bezprecedensowe koszty i ograniczenia dla użytkowników końcowych.

Pod względem technologicznym Fable 5 i Mythos 5 to ten sam model. Różnią się wyłącznie nałożonymi mechanizmami bezpieczeństwa. O ile Fable 5 został udostępniony szerokiej publiczności, o tyle jest on poddawany surowej cenzurze, aby zapobiec wykorzystaniu go do cyberataków czy tworzenia broni biologicznej.

 

Koniec z „promptowaniem” - czas na zarządzanie pętlami

 

Najważniejszą zmianą w architekturze Fable 5 jest przejście od modelu „pytanie-odpowiedź” do długoterminowej autonomii. Jak zauważają testerzy, model ma domyślnie włączony tryb ciągłego analitycznego myślenia (thinking is always on). Powoduje to, że generowanie odpowiedzi trwa dłużej, ale system jest w stanie rozwiązywać problemy, które wcześniej wymagały interwencji człowieka.

Zmienia się wręcz sam paradygmat obsługi sztucznej inteligencji. Zamiast tworzyć skomplikowane polecenia (prompty), eksperci zalecają po prostu określenie celu i pozwolenie modelowi na samodzielną pracę w pętlach (tzw. loops). Producent wprost radzi użytkownikom, aby porzucili stare, zbyt szczegółowe instrukcje – nowy Claude działa najlepiej, gdy daje mu się swobodę, a rola człowieka sprowadza się do weryfikacji efektów jego wielogodzinnej pracy.

 

Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

 

Zdolności weryfikowalne w praktyce

 

Skok wydajnościowy widać nie w sztucznych testach, ale w realnych wdrożeniach:

  • Programowanie: w najnowszym benchmarku Frontier Code od firmy Cognition (mierzącym czy wygenerowany kod faktycznie nadaje się do wdrożenia w popularnych repozytoriach open-source, a nie tylko czy przechodzi testy jednostkowe), Fable 5 deklasuje konkurencję. Wydajność modelu skaluje się wraz z czasem poświęconym na obliczenia – im dłużej pozwolimy mu analizować problem, tym lepszy kod wyprodukuje. Skuteczność tej metody potwierdza firma Stripe, której Fable 5 w jeden dzień przeniósł 50 milionów linii kodu – zadanie wyceniane na dwa miesiące pracy całego zespołu.
  • Orientacja przestrzenna: zdolności wizyjne modelu osiągnęły poziom pozwalający na interakcję z systemami bez żadnego interfejsu tekstowego. Fable 5 przeszedł grę Pokémon FireRed od początku do końca, analizując wyłącznie surowe zrzuty ekranu, bez dostępu do ukrytych danych gry. Model potrafi również generować zaawansowane modele przestrzenne (tzw. Vibe CAD) przy użyciu naturalnego języka oraz symulować zjawiska fizyczne, takie jak zaćmienia słońca.

 

 

 

Rygorystyczne bezpieczeństwo i mechanizm „Fallback”

 

Ze względu na ryzyko zastosowania AI do ataków i produkcji broni biologicznej, w Fable 5 wprowadzono system niezależnych klasyfikatorów bezpieczeństwa. Jeśli model uzna zapytanie za ryzykowne (np. zahaczające o cyberbezpieczeństwo lub biologię eksperymentalną), główne procesy są natychmiast blokowane.

Zamiast jednak standardowego komunikatu o błędzie, system przekazuje zapytanie do słabszego, starszego modelu – Claude Opus 4.8. Twórcy ostrzegają, że ze względu na zwiększoną ostrożność w dostrojeniu filtrów, w początkowej fazie użytkownicy mogą spotkać się ze zwiększoną liczbą fałszywych alarmów (odmów) przy całkowicie nieszkodliwych zapytaniach.

 

Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

 

Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

 

Haczyk w cenniku i limity subskrypcji

 

Rozwój autonomii ma swoją cenę. Fable 5 i Mythos 5 należą do najdroższych modeli na rynku, kosztując 10 dolarów za milion tokenów wejściowych i 50 dolarów za milion tokenów wyjściowych.

Prawdziwym problemem dla użytkowników detalicznych jest jednak polityka dostępu. Choć Fable 5 pojawił się w płatnych planach subskrypcyjnych (Pro, Max, Team) bez dodatkowych opłat, stan ten potrwa tylko do 22 czerwca. Po tej dacie, ze względu na przewidywane ogromne obciążenie serwerów, dostęp w ramach abonamentu zostanie wyłączony. Użytkownicy, którzy będą chcieli nadal z niego korzystać z poziomu aplikacji webowej, będą musieli dokupować pakiety kredytów i płacić za rzeczywiste zużycie – niezależnie od posiadanej subskrypcji.

To bezprecedensowy ruch w branży LLM, który doskonale obrazuje, jak ogromnych nakładów obliczeniowych wymaga ciągłe myślenie i agentowe działanie nowych systemów sztucznej inteligencji. Pełny, nielimitowany dostęp do modelu Mythos 5, pozbawionego barier, pozostaje tymczasem zarezerwowany wyłącznie dla zaufanych partnerów infrastrukturalnych i badawczych na szczeblu rządowym.

 

 

Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

 

Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

 

Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

 

Debiut Claude Fable 5 i Mythos 5: nowe możliwości obarczone wysoką ceną i rygorystycznymi limitami

 

Opinie:

Rekomendowane:

Akcje partnerskie: