Последние поколения ARM-процессоров, на которых строятся актуальные версии iPhone и макбуков, в силу особенностей архитектуры способны исполнять генеративные ИИ-модели локально с приемлемой производительностью. Так что в Apple пока решено не полагаться на облачные ИИ-сервисы для iOS, а реализовать генеративные модели на локальном смартфонном «железе».
Искусственный интеллект – тема нынче более чем горячая: согласно Стэнфордскому обзору 2024 AI Index, за 2023 г. суммарные частные инвестиции только в генеративный ИИ превысили 25,2 млрд долл. – против менее чем 2,9 млрд в 2022-м.
В подавляющем большинстве случаев создающие контент модели исполняются сегодня в облаках, поскольку требуют огромных объемов памяти и значительного числа параллельно действующих аппаратных вычислительных узлов (процессорных ядер).
Ориентированные на локальную генерацию ИИ-модели также существуют и применяются, однако для их запуска необходимо мощное «железо» – солидные игровые ПК или высокопроизводительные графические рабочие станции.
Неудивительно, что рост интереса к генеративному ИИ создает изрядную дополнительную нагрузку на облачную инфраструктуру. Упомянутый отчет свидетельствует, что «углеродный след» далеко не самой передовой на сегодня модели GPT-3 со 175 млрд рабочих параметров (предшественницы GPT-3.5, на которую опиралась первая завоевавшая всемирную популярность в конце 2022 г. версия бота ChatGPT) превышает 500 тонн в эквивалентных выбросах CO2 (для сравнения: в среднем по миру каждый человек в процессе своей жизнедеятельности производит чуть более 5,5 т углекислого газа за год).
Возможно, руководствуясь в том числе и соображениями сокращения «углеродного следа», Apple приняла решение не полагаться на облачные ИИ-сервисы для iOS до версии 18 – а реализовать генеративные модели на локальном смартфонном «железе».
По крайней мере, о высокой вероятности принятия такого решения говорит Марк Гурман, информированный ИТ-аналитик Bloomberg. Суть в том, что последние поколения ARM-процессоров, на которых строятся актуальные версии iPhone и макбуков, за счет достаточного количества вычислительных ядер и возможности адресовать весь доступный объем оперативной памяти (а не только выделенное видеоОЗУ, как в случае архитектуры x86) для требовательных задач вполне способны исполнять генеративные ИИ-модели локально – и с приемлемой производительностью. Эксперт уверен, что в ходе очередного мероприятия WWDC, которое в 2024 г. состоится 10-го июня, Apple анонсирует iOS 18 – наряду с обновлениями других своих операционных систем, watchOS 11 и macOS 15.
Традиционно ожидаемый осенью релиз очередной серии смартфонов, iPhone 16, скорее всего будет включать готовую к еще более производительным ИИ-вычислениям аппаратную платформу с усиленным нейроускорителем Neural Engine. Однако уже на iPhone 15 и ряде совместимых моделей, по утверждению М. Гурмана, только за счет обновления ОС до iOS 18 уже будут доступны новые ИИ-возможности голосового помощника Siri, умного поиска Spotlight Search и ряд других.
Впрочем, как сообщали ранее другие специализирующиеся на Apple аналитики, к примеру Мин-Чи Ко (Ming-Chi Kuo) и Джефф Пу (Jeff Pu), отсутствие в списке ИИ-обновлений для iOS умного чат-бота может быть связано как раз с тем, что производительность локального «железа» недостаточна, чтобы адекватно исполнять его прямо на смартфоне. Вероятно, Apple все же вынуждена будет создать собственный облачный сервис такого рода, чтобы уверенно конкурировать с ChatGPT и Google Gemini. Но пока об этом речи не идет.