Эксплуатация генеративных нейросетей требует в миллионы раз меньше вычислительных ресурсов, чем их создание. Поэтому расчет параметров сети есть смысл отдать внешнему поставщику услуг. В мире уже существуют провайдеры ИИ-услуг с большими вычислительными ресурсами, готовые, например, дообучать предобученные нейросети для корпоративных задач.
Создание генеративных нейросетей, которые способны поддерживать конструктивный диалог с живыми людьми и характеризуются десятками миллиардов параметров, требует огромных вычислительных ресурсов. Это, естественно, стимулирует спрос на нейропроцессоры и другое специализированное «железо», существенно ускоряющее выполнение соответствующих алгоритмов.
В то же время для эксплуатации нейросетей вычислительных ресурсов нужно совсем не так много – в миллионы раз меньше, по оценке Алексея Арустамова, генерального директора компании Loginom, разработчика ПО, имеющего опыт создания и эксплуатации GPT-сервиса, ориентированного на потребителей продуктов компании.
«Обучение нейросети, – поясняет А. Арустамов, – это подбор её параметров, в процессе которого огромные данные миллионы, а может быть, и миллиарды раз прогоняются через сетку, которая подбирает веса. А эксплуатация нейросети – это минимальные расчеты, в большинстве своем связанные с умножением весов и сложением коэффициентов, на что вычислительных ресурсов требуется в миллионы раз меньше. Именно поэтому расчет параметров нашей специализированной нейросети (и еженедельное уточнение этих параметров на основе подготовленных нами данных) мы отдали внешнему поставщику услуг, располагающему огромными вычислительными ресурсами. Такого рода услуги, кстати говоря, стоят относительно недорого».
Кроме того, отмечает Алексей Арустамов, существуют предобученные нейросети, предназначенные для организации линий техподдержки. Понятие предобученной нейросети хорошо описывается следующей аналогией: выпускник вуза, которого для использования на конкретном рабочем месте, как правило, надо дополнительно обучить. Но в большинстве случаев это значительно проще, чем обучить с нуля полного «чайника».
Нечто подобное происходит и при использовании нейросетевых технологий для решения корпоративных задач – их, как правило, не разрабатывают «с нуля». И существуют провайдеры, имеющие доступ к большим вычислительным ресурсам, которые готовы за определенную плату дообучить эти сети для конкретных линий техподдержки с использованием данных, размеченных заказчиком.
К сожалению, в нашей стране провайдеров такого рода ИИ-услуг пока нет.
Но рано или поздно они появятся, полагает А. Арустамов: «Ничего принципиально невозможного тут нет. Просто нужно больше «железа». Уверен, что провайдеры, такие как Яндекс или Сбер, располагающие огромными ИТ-инфраструктурами, такого рода услуги скоро будут предлагать. Если у них уже есть предобученные генеративные нейросети, то ничего не мешает предложить их корпоративному рынку для дообучения».