Омнимодальный и агентный: как будет развиваться ИИ и сможет ли он самостоятельно завоевать мир

Искусственный интеллект становится всё более самостоятельным, и уже бывает сложно отличить, какой контент создан нейросетями, а какой — руками людей. Какие тренды развития ИИ наблюдаются в настоящее время, как дальше он будет развиваться и способен ли существовать автономно от человека, разобрались вместе с руководителем отдела машинного обучения МТС Линк Дмитрием Крюковым и генеральным директором разработчика решений ВКС VINTEO Романом Самойловым.

Новый тренд — омнимодальность

В 2024 году компания OpenAI представила новую языковую модель gpt-4о, а Google — модель Gemini 1.5. Схожесть этих моделей — в омнимодальности, которая стала одним из главных трендов ИИ в России и во всём мире. Омнимодальность означает, что искусственный интеллект теперь может анализировать в одном запросе текст, картинки, видео и аудио.

По словам руководителя отдела машинного обучения МТС Линк Дмитрия Крюкова, GPT-4o от OpenAI может анализировать видео, распознавать речь и генерировать текстовые ответы в режиме реального времени. Gemini 1.5 Pro от Google тоже демонстрирует высокую эффективность в обработке длинных контекстов (до 2 млн токенов) и мультимодальных данных.

Дмитрий Крюков рассказал, в чём, по его мнению, польза новых моделей для частного применения и для бизнеса.

Создание персонализированных помощников

Виртуальный ассистент может анализировать фото товара, голосовой запрос и историю покупок, чтобы рекомендовать пользователям подходящие варианты.

Оптимизация работы преподавателей и учителей

В корпоративном обучении ИИ-тренды 2025 года всё так же связаны с подачей материала обучающимся. Ученики могут получать объяснение материала через видео, аудио и интерактивные тексты, адаптированные под их стиль обучения.

Совершенствование клиентского сервиса

ИИ поможет автоматизировать поддержку через анализ голосовых сообщений, видеочатов и текстовых запросов. Например, ИИ может распознать эмоции в голосе клиента и подобрать оптимальный ответ.

Оптимизация производства

Компьютерное зрение и аудиоанализ помогают выявлять дефекты, например, на конвейере или оптимизировать логистику.

Развитие агентного ИИ

Агентный ИИ называют технологией, способной изменить нашу жизнь. Это один из главных трендов ИИ в 2025 году. ИИ-агенты могут взять на себя большинство задач, которые сегодня выполняет человек. По словам генерального директора VINTEO Романа Самойлова, агентный ИИ — это система, которая не просто отвечает на запросы пользователя, а действует автономно для выполнения задач, может принимать решения на основе контекста и самостоятельно инициировать действия. Фактически агентный ИИ открывает путь к созданию умных ассистентов, которые могут работать как полноценные помощники или даже сотрудники, в том числе с возможностью анализировать большие объёмы данных и принимать решения на основе полученной информации.

Эксперт МТС Линк Дмитрий Крюков приводит примеры использования технологии: «В логистике ИИ-агенты автоматически корректируют маршруты доставки, учитывая пробки, погоду и загрузку складов. Особенность ИИ-агентов в том, что они обрабатывают данные в реальном времени — это крайне важно, к примеру, для финансовых рынков или экстренных служб. ИИ-агенты могут одновременно управлять тысячами процессов, что недоступно человеку».

ИИ-ассистент платформы МТС Линк, например, напоминает о встречах, анализирует статистику по прошедшим мероприятиям, формирует саммари переписок в рабочих чатах. Виртуальному помощнику можно доверить рутинные задачи, а освободившееся время посвятить вопросам, требующим реального человеческого участия.

Потенциал развития ИИ в онлайн-коммуникациях

Многие тренды в ИИ в 2025 году тесно связаны со сферой общения в интернете. Нейросети уже сейчас активно используются в онлайн-коммуникациях. С их помощью можно делать рассылки, напоминать о встречах, подводить итоги мероприятий.

Роман Самойлов отметил три ключевых направления в сегменте ВКС, которые обладают значительным потенциалом:

  1. Искусственный интеллект может помочь в генерации кадров в видеообмене для обеспечения качественной картинки на нестабильных каналах связи. Это необходимо для онлайн-встреч, где видео является критически важным для восприятия информации и взаимодействия между участниками.
  2. ИИ способен детектировать дипфейки видео и голоса. Случаев использования дипфейков становится всё больше, и здесь ИИ может применяться для анализа контента в реальном времени — например, выявлять манипуляции и подделки, что значительно повысит безопасность онлайн-встреч и защитит участников от потенциальных угроз.
  3. Новые возможности в развитии технологий телеприсутствия. ИИ под силу вывести этот формат на новый уровень, создавая более реалистичные и интерактивные виртуальные среды. Так, технологии дополненной и виртуальной реальности, управляемые ИИ, могут позволить участникам видеовстреч взаимодействовать с максимально полным эффектом присутствия.

Может ли ИИ стать полностью самостоятельным

По словам Романа Самойлова, современные модели обучаются и работают в рамках заданных алгоритмов, соответственно, они не обладают настоящим сознанием или интуицией. При этом даже самые продвинутые модели нуждаются в контроле для обновления информации и корректировки целей. Безусловно, ИИ может развиваться в направлении большей автономии и адаптивности, но полная самостоятельность, которая подразумевает независимое мышление и самосознание, скорее, останется предметом научной фантастики.

Омнимодальный и агентный: как будет развиваться ИИ и сможет ли он самостоятельно завоевать мир | Фото  ИИ 2

Также в вопросах развития технологии много этических ограничений: полностью самостоятельный ИИ будет нести риски неконтролируемого поведения, что потребует ограничений со стороны закона.

Дмитрий Крюков добавил, что к 2030 году ожидается рост автономности ИИ в узких задачах (например, в управлении цепочками поставок), но полная самостоятельность маловероятна из-за необходимости человеческого контроля. Ограничение также заключается в отсутствии креативности. ИИ генерирует решения на основе данных, но не способен к абстрактному мышлению, как человек. Нельзя забывать и об этических рисках: автономные системы могут принимать предвзятые решения, если обучались на некачественных данных.

Подводя итоги, можно сказать, что возможности искусственного интеллекта становятся всё более впечатляющими и за трендами в ИИ следит весь мир. Однако пока рано говорить о том, что искусственный интеллект способен принимать решения самостоятельно. ИИ создан человеком, и на данный момент в этом тандеме человек остаётся главным. 

Подпишитесь на рассылку МТС Линк Медиа

Каждую пятницу присылаем самые интересные статьи об эффективной работе и коммуникациях в онлайне на почту