Anthropic тестирует AI Score — рейтинг того, как вы работаете с ИИ

Anthropic тестирует фичу, которая будет оценивать пользователей по 11 привычкам. Скоро в настройках появится отдельный экран с персональным отчётом — нейросеть сама расскажет, насколько грамотно (или бездарно) вы с ней общаетесь.

Идея выросла из их недавнего исследования AI Fluency Index: инженеры разобрали почти 10 тысяч диалогов и вывели 11 индикаторов, отличающих профи от новичка. Система сканирует всё — историю чатов, работу в Cowork, логи Claude Code — и выдает оценку, показывая, где именно вы халтурите.

Главный инсайт из этого массива данных: мы катастрофически доверяем красивой вёрстке.

Если ИИ выдает аккуратно отформатированный код или ровненькую таблицу, пользователи спорят с ним в 5,6 раза реже, чем с «сырым» текстом. Качественный UI буквально усыпляет бдительность. По-хорошему, к отполированному ответу нужно применять *больше* скепсиса, а по факту мы просто киваем и забираем результат. Новый скорборд как раз и должен бить по рукам за такую лень, заставляя проверять факты и спорить с моделью.

Вот полный чек-лист от Anthropic. Проверьте, где вы недожимаете свои промпты:

1. Делегирование

**Определитесь на берегу:** Формулируйте цель *до* того, как начать писать запрос.
**Сначала стратегия:** Посоветуйтесь с моделью о подходе к задаче, и только потом требуйте выполнения.

2. Постановка задачи

**Контекст — король:** Указывайте аудиторию (для кого это) и нужный тон.
**Формат и примеры:** Не ждите, что ИИ сам угадает структуру. Дайте референс.
**Прямое управление:** Явно задавайте роль и жесткие рамки (например, «отвечай без преамбулы»).
**Итерации:** Доводите результат напильником. Никогда не забирайте первый же черновик.

3. Критическое мышление (здесь сыпятся почти все)

**Фактчек:** ИИ выдумывает. Перепроверяйте цифры и факты.
**Спор:** Ловите модель на логических дырах и не стесняйтесь указывать на них.
**Слепые зоны:** Скармливайте ИИ контекст, который он просто не мог знать изначально.

Официальный трекер от Anthropic пока в закрытом доступе, но я собрал свой инструмент — AI Score, чтобы вы могли примерить эту метрику на себя уже сейчас. Закидываете туда свой типичный диалог (из Claude, ChatGPT или Gemini), и алгоритм подсвечивает ваши слепые зоны. Всё безопасно: текст обрабатывается один раз и сразу удаляется с сервера.

Для тех, кто предпочитает полную конфиденциальность (прекрасно вас понимаю), я упаковал ту же логику в отдельный скилл на GitHub. Его можно загрузить прямо в свой чат с Claude и анализировать логи локально.