Anthropic тестирует AI Score — рейтинг того, как вы работаете с ИИ

Система анализирует историю чатов и логи Claude Code по 11 индикаторам из исследования AI Fluency Index, где проверили почти 10 000 диалогов.

Автор: Michael Kokin ·

Anthropic тестирует фичу, которая будет оценивать пользователей по 11 привычкам. Скоро в настройках появится отдельный экран с персональным отчётом — нейросеть сама расскажет, насколько грамотно (или бездарно) вы с ней общаетесь.

Идея выросла из их недавнего исследования AI Fluency Index: инженеры разобрали почти 10 тысяч диалогов и вывели 11 индикаторов, отличающих профи от новичка. Система сканирует всё — историю чатов, работу в Cowork, логи Claude Code — и выдает оценку, показывая, где именно вы халтурите.

Главный инсайт из этого массива данных: мы катастрофически доверяем красивой вёрстке.

Если ИИ выдает аккуратно отформатированный код или ровненькую таблицу, пользователи спорят с ним в 5,6 раза реже, чем с «сырым» текстом. Качественный UI буквально усыпляет бдительность. По-хорошему, к отполированному ответу нужно применять *больше* скепсиса, а по факту мы просто киваем и забираем результат. Новый скорборд как раз и должен бить по рукам за такую лень, заставляя проверять факты и спорить с моделью.

Вот полный чек-лист от Anthropic. Проверьте, где вы недожимаете свои промпты:

1. Делегирование

2. Постановка задачи

3. Критическое мышление (здесь сыпятся почти все)

Официальный трекер от Anthropic пока в закрытом доступе, но я собрал свой инструмент — AI Score, чтобы вы могли примерить эту метрику на себя уже сейчас. Закидываете туда свой типичный диалог (из Claude, ChatGPT или Gemini), и алгоритм подсвечивает ваши слепые зоны. Всё безопасно: текст обрабатывается один раз и сразу удаляется с сервера.

Для тех, кто предпочитает полную конфиденциальность (прекрасно вас понимаю), я упаковал ту же логику в отдельный скилл на GitHub. Его можно загрузить прямо в свой чат с Claude и анализировать логи локально.