Claude Mythos: Anthropic выпустила самую мощную модель, но не для всех

Claude Mythos Preview — новый фронтир от Anthropic, пока закрытый. Запускается в рамках Project Glasswing: инициатива с AWS, Google, Microsoft, Apple, Cisco, CrowdStrike, NVIDIA и ещё несколькими компаниями. Задача — кибербезопасность.

За несколько недель модель автономно нашла тысячи уязвимостей нулевого дня — в каждой крупной ОС и каждом крупном браузере. Три примера: уязвимость в OpenBSD возрастом 27 лет, баг в FFmpeg, по которому автоматические тесты прошлись пять миллионов раз без результата, и цепочка дыр в ядре Linux, дающая полный контроль над машиной.

Месяц назад Anthropic опубликовала кейс с Firefox — тогда работал ещё Opus 4.6, предыдущая модель. Она нашла 22 уязвимости за две недели, 14 из которых Mozilla классифицировала как высокой критичности — почти пятая часть всех серьёзных Firefox-уязвимостей, закрытых за весь 2025 год. Это был разогрев. Mythos — другой уровень.

На бенчмарках: SWE-bench Verified — 93.9% (Opus 4.6: 80.8%), GPQA Diamond — 94.6%, Humanity's Last Exam без инструментов — 56.8%.

Сейчас доступ к Mythos есть только у 12 крупных партнёров (частично закрытый список). Мейнтейнеры значимых open source проектов могут подать заявку отдельно. Все остальные ждут следующего Claude Opus, который выйдет в открытый доступ — уже с встроенными защитными механизмами.

После исчерпания выделенных $100M в кредитах участники платят $25/$125 за миллион токенов. Звучит дорого. Но по исследованию цен на нейросети (96 моделей, 6 бенчмарков) — так запускается любой топ-релиз, а через год всё это стоит в разы дешевле.

Подробности на anthropic.com