iQuest Coder 40B: опенсорс, который обходит Sonnet и GPT-5.1

Опенсорс на 40B бьёт рекорд Terminal-Bench и обходит Sonnet/GPT-5.1. Но главное — это начало эпохи автономных локальных агентов, которые работают в вашем контуре.

Автор: Michael Kokin ·

Новая китайская опенсорс-модель, которая по главным бенчмаркам опережает топовые модели от OpenAI и Anthropic.

iQuest Coder (модель от китайской iQuest Lab) — это 40B-модель (влезет на одну-две видеокарты 4090), которая обходит гигантов вроде Sonnet-4.5 и GPT-5.1.

Самое интересное — в цифрах:

SWE-Bench Verified: 76.2%. Это «золотой стандарт» кодинга — тест на решение реальных тикетов с GitHub. Грубо говоря, модель успешно закрывает 3 из 4 настоящих багов в чужом коде. Это уровень топовых сеньоров (и лучших проприетарных моделей).

Terminal-Bench: 51.3% (Абсолютный рекорд). Самое важное. Это тест на умение жить в консоли Linux: установить пакет, найти файл грепом, поправить конфиг nginx, перезапустить сервис. Обычные LLM тут не справляются (у них ~35%), а iQuest реально умеет админить.

Bird-SQL: ~70%. Тест на сложные запросы к базам данных. Наконец-то нейронка понимает структуру реальных БД и может написать сложный JOIN, не выдумывая несуществующие таблицы.

Главная фича — Code-Flow Training. Модель учили не просто на файлах кода, а на истории git-коммитов. Она понимает *логику изменений*: «было — стало — почему поменяли».

⚠️ Disclaimer: В комьюнити уже начался срач — говорят, на некоторых тестах модель могла «подглядывать» в ответы через git history. Но даже если срезать ей 10% за хитрость, для локальной модели весом в 40B это всё равно космос.

Забрать веса и почитать пейпер можно тут.

---

Почему это важно

Почему я так зацепился за этот релиз? Дело не в цифрах, а в том, что эта модель позволяет делать.

Мы привыкли к парадигме кодинг-ассистентов (копайлотов): ты пишешь код, AI дополняет строчки. Это уровень нормального джуна.

iQuest (и новые инструменты, которые сейчас обсуждают на Hacker News) открывает эру автономных локальных агентов.

Рекордный скор в работе с терминалом означает, что модель может не просто генерировать текст, а действовать:

1. Сама поднять окружение.
2. Сама прогнать тесты, увидеть ошибку в логах, найти нужный файл и пофиксить.
3. Всё это полностью локально, без отправки кода в облако.

Это возвращает нам цифровой суверенитет. Сейчас, чтобы получить «умного агента», нужно платить $20/мес (скорее даже $200) и сливать свои данные в облако. Имея iQuest на локальном сервере, вы можете собрать собственного AI-сотрудника, который знает ваши секретные ключи, имеет доступ к прод-базе и при этом никуда не отправляет данные.

Эпоха чат-ботов стремительно заканчивается. Начинается эпоха AI-коллег, которые работают в вашем контуре.