Новая китайская опенсорс-модель, которая по главным бенчмаркам опережает топовые модели от OpenAI и Anthropic.
iQuest Coder (модель от китайской iQuest Lab) — это 40B-модель (влезет на одну-две видеокарты 4090), которая обходит гигантов вроде Sonnet-4.5 и GPT-5.1.
Самое интересное — в цифрах:
SWE-Bench Verified: 76.2%. Это «золотой стандарт» кодинга — тест на решение реальных тикетов с GitHub. Грубо говоря, модель успешно закрывает 3 из 4 настоящих багов в чужом коде. Это уровень топовых сеньоров (и лучших проприетарных моделей).
Terminal-Bench: 51.3% (Абсолютный рекорд). Самое важное. Это тест на умение жить в консоли Linux: установить пакет, найти файл грепом, поправить конфиг nginx, перезапустить сервис. Обычные LLM тут не справляются (у них ~35%), а iQuest реально умеет админить.
Bird-SQL: ~70%. Тест на сложные запросы к базам данных. Наконец-то нейронка понимает структуру реальных БД и может написать сложный JOIN, не выдумывая несуществующие таблицы.
Главная фича — Code-Flow Training. Модель учили не просто на файлах кода, а на истории git-коммитов. Она понимает *логику изменений*: «было — стало — почему поменяли».
⚠️ Disclaimer: В комьюнити уже начался срач — говорят, на некоторых тестах модель могла «подглядывать» в ответы через git history. Но даже если срезать ей 10% за хитрость, для локальной модели весом в 40B это всё равно космос.
Забрать веса и почитать пейпер можно тут.
---
Почему это важно
Почему я так зацепился за этот релиз? Дело не в цифрах, а в том, что эта модель позволяет делать.
Мы привыкли к парадигме кодинг-ассистентов (копайлотов): ты пишешь код, AI дополняет строчки. Это уровень нормального джуна.
iQuest (и новые инструменты, которые сейчас обсуждают на Hacker News) открывает эру автономных локальных агентов.
Рекордный скор в работе с терминалом означает, что модель может не просто генерировать текст, а действовать:
1. Сама поднять окружение.
2. Сама прогнать тесты, увидеть ошибку в логах, найти нужный файл и пофиксить.
3. Всё это полностью локально, без отправки кода в облако.
Это возвращает нам цифровой суверенитет. Сейчас, чтобы получить «умного агента», нужно платить $20/мес (скорее даже $200) и сливать свои данные в облако. Имея iQuest на локальном сервере, вы можете собрать собственного AI-сотрудника, который знает ваши секретные ключи, имеет доступ к прод-базе и при этом никуда не отправляет данные.
Эпоха чат-ботов стремительно заканчивается. Начинается эпоха AI-коллег, которые работают в вашем контуре.