Блог

ИИ научили спорить с руководителями: топ-менеджеры крупных компаний в ИТ протестировали новых бизнес-ассистентов

ИИ научили спорить с руководителями: топ-менеджеры крупных компаний в ИТ протестировали новых бизнес-ассистентов

Компании активно внедряют искусственный интеллект в разработку и аналитику, однако он редко участвует управленческих решениях, которые принимаются интуитивно за счет опыта менеджеров. Громкой новостью стало заявление Марка Цукерберга, о создании собственного ассистента, цель которого — помощь в принятии решений для генерального директора. Сообщества AI Talent Hub Университета ИТМО и South HUB предложили топ-менеджерам из Сбер, Cloud.ru, X5 Tech, Яндекс B2B и других технологичных компаний создать прототипы аналогичных систем на первом хакатоне в России для управленцев в ИТ.

Участникам нужно было всего за восемь часов создать ИИ-ассистента директора по технологиям и искусственному интеллекту. Его главная функция — формировать обоснованную позицию с помощью отчетов, операционных показателей и финансовых данных, независимо от разрозненно поступающих от стейкхолдеров компании требований. Ключевое отличие таких ассистентов — устойчивость к давлению со стороны топ-менеджеров в условиях конфликта между ролями и противоречий в данных. Например, в одной из разработок ассистент рекомендовал отложить масштабирование продукта, несмотря на давление со стороны бизнеса, так как показатели юнит-экономики не подтверждали целесообразность роста.

«Мы сместили фокус с разработки инструментов на проектирование логики принятия решений. Речь шла не о создании бота для автоматизации, а о бизнес-ассистенте, который способен занять позицию и обосновать её через данные и экономику. Главная задача интенсива – показать участникам, какие возможности и ограничения дает ИИ», — прокомментировал Дмитрий Ботов, сооснователь AI Talent Hub, руководитель магистратуры по искусственному интеллекту Университета ИТМО.

Лучшее решение предложила команда топ-менеджеров из «ПСБ Финанс», Т-Банка и WILIX. В сжатые сроки они подготовили двух ассистентов, но на финальный тест подали более простой и эффективный вариант. Его главный плюс — крайне низкое потребление токенов (единиц вычислительной мощности). Разработчики отметили, что при дальнейшей «шлифовке» проекта и расширении функционала по универсальности ИИ-ассистент сможет обрабатывать больше разных кейсов.

«Такой ассистент мог бы снять большую часть работы по обработке поступающего контекста для принятия решения. Он может в теории заменить часть промежуточного менеджмента, но все равно итоговые решения должен проверять человек, так как загрузить в него все возможные факторы, влияющие на решение, скорее всего невозможно. Есть много того, что не попадает в его "поле зрения": личное общение "за кулером" или на встречах, где не ведется запись, плюс эмоциональный подтекст. Но все же очень хочется это попробовать — такого рода системы создают много спорных моментов, к ним нужно приспособиться, но если получится прочувствовать эффективность от внедрения или частичного внедрения, то это определенно того стоит. Дополнительная консультация с таким ассистентом — это обзор всех факторов, которые иногда сложно удержать в голове», — отметил Дмитрий Алоян, участник команды-победителя, генеральный директор компании WILIX и руководитель Yonote и Loop.

Хакатон прошел в рамках мероприятия от сообщества South HUB — Snow BASE, закрытого выезда для 200 руководителей высшего звена в сфере данных и искусственного интеллекта. В интенсиве приняли участие порядка 40 топ-руководителей по данным, ИИ и цифровым продуктам в компаниях, отвечающих за развитие ИИ и данных в бизнесе. Cloud.ru стал одним из партнеров Snow BASE и предоставил вычислительные ресурсы — виртуальные машины Сloud.ru Evolution и токены для работы с большими языковыми моделями из каталога Evolution Foundation Models, а также с платформы OpenRouter.

Для хакатона командой сообщества AI Talent Hub Университета ИТМО был разработан ИИ-агент — LLM-as-a-Judge (LLM в роли судьи), который оценивал решения участников через специальные стресс-тесты, а также удобство интерфейса и дополнительную функциональность, придуманную командами. 70% оценки решений выставляла мультиагентная система, которая в режиме реального времени просматривала ход разработки участников и выводила результаты на лидерборд. Итоговый вердикт и 30% оценки вынесло жюри от компаний-партнёров хакатона из Сбер, Cloud.ru, X5 Тech, Yandex B2B Tech. Победители хакатона планируют доработать проект и внедрить его в рабочий процесс.
Пресс-релизы Мероприятия