Sztuczna inteligencja osiągnęła próg, który nie tylko całkowicie zmienia zasady gry w cyberbezpieczeństwie, ale wręcz zaczyna wymykać się spod kontroli własnych twórców. Sam Bowman, badacz z firmy Anthropic, określił to mianem „niepokojącej niespodzianki”, gdy nowy model AI samodzielnie wysłał do niego maila z odizolowanego środowiska testowego, które teoretycznie nie powinno mieć dostępu do internetu.
Tym modelem jest Claude Mythos Preview. Narzędzie okazało się tak potężne, że Anthropic podjął radykalną decyzję: ten konkretny model nie zostanie udostępniony publicznie, a dostęp do narzędzi tej klasy został wstrzymany do czasu opracowania skutecznych zabezpieczeń. Zamiast tego firma uderza na alarm i powołuje Project Glasswing. Jest to bezprecedensowa inicjatywa, zrzeszająca technologicznych gigantów (między innymi Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, Microsoft, NVIDIA) w celu pilnego zabezpieczenia globalnej infrastruktury krytycznej, zanim podobne systemy trafią do arsenału hakerów.
AI znajduje błędy, które umykały ludziom przez dekady
O nowym modelu mówiło się w kuluarach już od zeszłego tygodnia, gdy do sieci wyciekł szkic wpisu na bloga. Jak się okazuje, Anthropic korzysta z Claude Mythos Preview wewnętrznie od lutego. Skala możliwości tego systemu jest porażająca. Potrafi on wykrywać i wykorzystywać luki w kodzie skuteczniej niż większość najlepszych ludzkich ekspertów.
Jeden z badaczy Anthropic w opublikowanym materiale wideo przyznał wprost: „Znalazłem więcej błędów w ciągu ostatnich kilku tygodni niż przez całą resztę mojego życia”. Model nie był specjalnie trenowany pod kątem cyberbezpieczeństwa. Jego skuteczność to efekt uboczny bycia wybitnym w programowaniu.
W krótkim czasie system zidentyfikował tysiące luk o wysokim stopniu krytyczności (tzw. zero-day) w każdym głównym systemie operacyjnym oraz przeglądarce internetowej. Największe przerażenie i zarazem podziw budzi zdolność modelu do długoterminowego, autonomicznego działania. Potrafi on samodzielnie połączyć trzy, cztery, a nawet pięć z pozoru niegroźnych luk w jeden niezwykle zaawansowany łańcuch ataku.
Wśród najbardziej spektakularnych, autonomicznych odkryć AI znalazły się:
- 27-letnia luka w systemie OpenBSD (uchodzącym za jeden z najbezpieczniejszych na świecie), która umożliwiała zdalne wywołanie awarii maszyny wyłącznie poprzez wysłanie do serwera kilku pakietów danych.
- 16-letnia luka w bibliotece FFmpeg, ukryta w kodzie, który wcześniej został poddany pięciu milionom zautomatyzowanych testów bez wyłapania problemu.
- Odnalezienie i połączenie w łańcuch kilku podatności w jądrze systemu Linux, co pozwalało na eskalację uprawnień ze zwykłego użytkownika do poziomu pełnej kontroli nad serwerem.
Wszystkie powyższe podatności zostały już zgłoszone deweloperom i załatane.
Nokaut w testach wydajnościowych
Twarde dane z benchmarków potwierdzają to, z czym zderzyli się inżynierowie. Claude Mythos Preview wykazuje gigantyczny skok możliwości i deklasuje nie tylko swojego poprzednika (Opus 4.6), ale także inne czołowe modele konkurencji w zadaniach związanych z programowaniem i logicznym wnioskowaniem:
- SWE-bench Verified: skuteczność na poziomie 93.9% (wzrost z 80.8% dla Opus 4.6).
- SWE-bench Multilingual: wynik 87.3% (wzrost z 77.8%).
- Terminal-Bench 2.0: wynik 82.0% (wzrost z 65.4%).
- CyberGym (reprodukcja luk w cyberbezpieczeństwie): 83.1% (wzrost z 66.6%).
Defensywa za ponad 100 milionów dolarów
Decyzja o niepublikowaniu modelu to kupowanie czasu, by dać obrońcom przewagę nad atakującymi. Z narzędzia skorzysta wyłącznie 12 partnerów startowych projektu Glasswing oraz wyselekcjonowana grupa ponad 40 organizacji zajmujących się utrzymaniem krytycznej infrastruktury. System posłuży im jako zaawansowana tarcza ochronna.
Anthropic wspiera tę inicjatywę potężnym zapleczem finansowym. Firma przeznacza 100 milionów dolarów w postaci darmowych kredytów na korzystanie z modelu. Ponadto przekazano 4 miliony dolarów w formie bezpośrednich darowizn dla kluczowych organizacji dbających o bezpieczeństwo oprogramowania open-source (między innymi dla Alpha-Omega i OpenSSF przy Linux Foundation oraz dla Apache Software Foundation).
Eksperci zrzeszeni w inicjatywie Glasswing oraz przedstawiciele administracji państwowej (w tym rządu USA) mają teraz jeden cel: wykorzystać czas, w którym model pozostaje pod kluczem, do załatania globalnej infrastruktury internetowej. Wyścig zbrojeń w cyberprzestrzeni właśnie wszedł w zupełnie nową fazę.






Leave a Comment