На WWDC 2026 Apple представила AFM 3 Core Advanced — флагманскую мультимодальную модель третьего поколения. Нейросеть работает полностью локально на iPhone и iPad, не отправляя личные данные на серверы. Разобрался, как они это сделали.
Как это устроено
- **Разреженная архитектура.** Вместо того чтобы задействовать все 20 млрд параметров одновременно, модель [активирует](https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models) лишь 1–4 млрд нейронов под каждый запрос.
- **Хранение во флеш-памяти.** Обычно тяжёлые модели требуют загрузки всех весов в быструю оперативную память. Apple хранит модель в медленной NAND-флеш, чтобы не перегружать ресурсы устройства — оперативки в смартфонах всегда впритык.
- **Инновационный роутинг.** Стандартные нейросети переключают вычислительные блоки на каждом токене. Пропускная способность мобильной памяти для этого слишком мала, поэтому AFM 3 принимает решение о маршрутизации один раз на весь запрос.
- **Умное разделение.** У системы есть базовый набор всегда активных «общих экспертов» и специализированные узлы, которые подгружаются в оперативку только тогда, когда действительно нужны.
Где применяется
Модель глубоко встроена в iOS 27 и другие новые операционки Apple — для работы обновлённой Siri, генерации изображений и продвинутого распознавания голоса. MacStories называют это историческим прорывом: инженеры Apple применили метод Instruction-Following Pruning — алгоритм, который элегантно обходит узкое «горлышко» мобильной памяти.
Ограничения
Архитектура глубоко оптимизирована, но раскрывает потенциал только на последних чипах Apple Silicon. Старым устройствам придётся по-прежнему делегировать сложные задачи в облако.