Enclava
← Блог8 мин

AI-новости 20 мая 2026: Google I/O штурмует фронт, OpenAI защищает CEO, а Chrome становится агентом

Google I/O 2026 представил Gemini 3.5 и Omni, OpenAI выпустил три аудио модели и укрепил защиту CEO, Chrome обзавёлся агентами. Разбираем главные AI-события дня.

AI-новости 20 мая 2026: Google I/O штурмует фронт, OpenAI защищает CEO, а Chrome становится агентом

20 мая 2026 года запомнится как день, когда Google решил напомнить всем, кто здесь главный. Конференция I/O превратилась в артиллерийский обстрел анонсами: Gemini 3.5, Gemini Omni, AI Search, Android XR, автоматизация Workspace, агентные возможности в Chrome, облачные платформы для enterprise и даже инструменты для проверки подлинности контента. Пока Mountain View раскатывал красную дорожку для своей AI-экосистемы, OpenAI продолжал жить своей драматичной жизнью – три новых аудио модели для real-time голоса выпустили параллельно с очередным витком корпоративных баррикад вокруг Сэма Альтмана.

В этом дайджесте разбираем, что именно Google анонсировал на I/O (и что мы умудрились пропустить в первом чтении), почему OpenAI поднимает порог для увольнения CEO, зачем Chrome учат быть агентом, и что новый стартап Thinking Machines предлагает против монополии больших моделей. А ещё – как Google борется с AI-хакерами, эксплуатирующими zero-day уязвимости. Спойлер: корпоративное AI перестаёт быть игрушкой.

Google I/O 2026: от Gemini 3.5 до Android XR

Google I/O – это не просто конференция, это ежегодная демонстрация силы. В 2026 году компания выкатила столько анонсов, что их хватило бы на три отдельных мероприятия. Центральным элементом стали новые модели Gemini 3.5 и Gemini Omni, обновления AI Search, платформа Android XR и глубокая интеграция искусственного интеллекта в Workspace.

Gemini 3.5 и Omni: новое поколение frontier-моделей

Gemini 3.5 позиционируется как следующее поколение frontier-моделей Google, конкурирующих с GPT-5.5 от OpenAI и Claude Jupiter от Anthropic. Омни-версия обещает мультимодальность "из коробки" – текст, изображения, аудио и видео обрабатываются единой архитектурой без промежуточных преобразований. Звучит амбициозно, но детали пока скудные: ни benchmarks, ни сроков публичного доступа, ни внятного объяснения, чем именно Omni отличается от уже существующих мультимодальных моделей.

Впрочем, главное для Google – не столько технические спецификации, сколько дистрибуция. Gemini встраивается в Search, Workspace, Chrome, Android и Google Cloud. Это означает миллиарды пользователей, которые начнут взаимодействовать с AI, даже не замечая этого.

AI в Chrome и Workspace: агенты повсюду

Одним из самых интересных (и пропущенных нами в первом чтении) анонсов стало превращение Chrome в агентную платформу. Браузер получает встроенные AI-модели, возможности для автономных действий от имени пользователя и нативную интеграцию с Gemini. Представьте: вы просите Chrome "найти и забронировать отель в Берлине на июнь" – и он это делает, переключаясь между вкладками, заполняя формы, сравнивая цены.

В Workspace автоматизация становится ещё агрессивнее. Google обещает, что AI сможет писать не только черновики писем, но и полноценные отчёты, презентации, таблицы – на основе данных из Gmail, Calendar, Drive и Meet. Вопрос только в том, насколько пользователи готовы доверить машине управление своим рабочим процессом. И насколько Google готов отвечать за ошибки этих машин.

Android XR: ставка на смешанную реальность

Android XR – это попытка Google занять место в гонке за spatial computing, где Apple уже показал Vision Pro, а Meta продолжает давить объёмами Quest. Платформа обещает поддержку AR/VR-устройств, интеграцию с Gemini для контекстного понимания окружения и открытую экосистему для разработчиков.

Проблема в том, что рынок XR всё ещё ищет killer use case. Пока это дорогие игрушки для энтузиастов и узкоспециализированные инструменты для enterprise. Сможет ли Google переломить ситуацию – большой вопрос.

OpenAI: голосовые модели и корпоративные баррикады

Пока Google праздновал I/O, OpenAI жил своей насыщенной корпоративной драмой. Три новых аудио модели для real-time голосовых задач, повышение порога для увольнения CEO и показания Сатьи Наделлы в суде Маск против Альтмана – всё в один день.

Три новых аудио модели: голос как интерфейс

OpenAI анонсировал три специализированных модели для работы с аудио в реальном времени. Детали скудные, но известно, что модели ориентированы на разные сценарии: транскрибация, синтез речи и понимание контекста в диалогах. Это логичный шаг, учитывая, что голосовые интерфейсы становятся основным способом взаимодействия с AI-агентами – от ChatGPT Voice до виртуальных ассистентов в автомобилях и умных домах.

Реальное время – это критичный параметр. Задержка даже в полсекунды делает диалог неестественным. Если OpenAI действительно решил эту проблему на уровне архитектуры модели (а не костылей на уровне инфраструктуры), это может сдвинуть рынок. Но пока мы видим только анонс, без публичного API и демо.

Защита CEO и суд с Маском: корпоративный театр продолжается

OpenAI поднял порог для увольнения CEO. Теперь, чтобы снять Сэма Альтмана с должности, совету директоров нужно больше голосов, чем раньше. Это прямой ответ на ноябрьский кризис 2023 года, когда Альтмана уволили, а затем вернули под давлением сотрудников и инвесторов.

Параллельно в суде по делу Маск против Альтмана свидетельствует Сатья Наделла, CEO Microsoft. Илон Маск обвиняет Альтмана в том, что тот отклонился от миссии OpenAI как некоммерческой организации, превратив её в коммерческий проект под контролем Microsoft. Наделла, вероятно, объясняет, почему инвестиции Microsoft в размере $13 млрд – это не контроль, а партнёрство.

Вся эта корпоративная драма важна не только для сплетен. Стабильность руководства OpenAI влияет на разработку моделей, отношения с регуляторами, доверие enterprise-клиентов и стратегические решения. Если компания будет тратить энергию на внутренние конфликты, конкуренты (вроде Google и Anthropic) только спасибо скажут.

Google укрепляет позиции: облако, безопасность и контент

Google I/O – это не только потребительские продукты. Компания анонсировала целый набор enterprise-решений, инструменты для борьбы с AI-угрозами и систему проверки подлинности контента.

Google Cloud и Gemini Enterprise: платформа для корпораций

Google Cloud выкатил сразу несколько продуктов: Gemini Enterprise (управляемая платформа для развёртывания моделей), Gemini Spark (облегчённая версия для специфических задач), Google Antigravity (название интригует, но детали не раскрыты) и Managed Agents API – инфраструктура для разработки и оркестрации AI-агентов.

Это мы пропустили в первом чтении, и зря. Enterprise AI – это миллиарды долларов выручки, долгосрочные контракты и стратегический контроль над тем, как крупные организации внедряют машинное обучение. Managed Agents API особенно интересен: если Google сможет стать стандартной платформой для агентов (как AWS стал стандартом для облачной инфраструктуры), это изменит расстановку сил.

Борьба с AI-хакерами: zero-day и реальные угрозы

Google заблокировал атаку, эксплуатирующую неизвестную ранее уязвимость (zero-day) с использованием AI. Детали не раскрыты, но сам факт показателен: AI используется не только для генерации котиков, но и для поиска уязвимостей, автоматизации атак и обхода защиты. А защитники, соответственно, используют AI для детектирования аномалий и быстрого реагирования.

Это гонка вооружений, и она только ускоряется. Вопрос в том, успевают ли регуляторы и стандарты безопасности за темпом развития технологий. Пока что – нет.

Провенанс контента: борьба с AI-подделками

Google анонсировал инструменты для проверки происхождения и подлинности контента. Это ответ на растущую проблему: отличить фото, снятое камерой, от сгенерированного Midjourney или DALL-E становится всё сложнее. Инструменты будут встроены в поиск, YouTube и другие продукты.

Звучит полезно, но дьявол в деталях. Какие метаданные используются? Как защититься от их подделки? Будет ли система работать с контентом, созданным конкурентами (OpenAI, Anthropic, Stability AI)? Пока больше вопросов, чем ответов.

Thinking Machines: новый игрок в мультимодальной гонке

На фоне гигантов вроде Google и OpenAI легко пропустить стартапы. Но Thinking Machines заслуживает внимания: компания показала превью "Interaction Models" – моделей, обученных с нуля для real-time мультимодального взаимодействия.

Interaction Models: ставка на специализацию

Вместо того чтобы брать универсальную языковую модель и навешивать на неё мультимодальность через адаптеры, Thinking Machines обучает модели, где текст, аудио, видео и другие модальности интегрированы на уровне архитектуры. Это похоже на подход Gemini Omni, но от стартапа, который обещает более лёгкие и специализированные решения.

Проблема: обучение мультимодальных моделей с нуля требует огромных датасетов, вычислительных мощностей и экспертизы. Сможет ли стартап конкурировать с Google, OpenAI и Anthropic – большой вопрос. Но сам факт появления альтернативных архитектур говорит о том, что рынок ещё не устоялся.

Похожие темы

Если вас интересует контекст сегодняшних событий, рекомендуем:

FAQ

Что такое Gemini Omni и чем он отличается от Gemini 3.5?

Gemini Omni – это мультимодальная версия модели Gemini 3.5, где текст, изображения, аудио и видео обрабатываются единой архитектурой. В отличие от моделей, где разные модальности обрабатываются отдельными компонентами и затем объединяются, Omni делает это нативно. Детали архитектуры Google пока не раскрыл.

Зачем OpenAI повышает порог для увольнения CEO?

Это ответ на кризис ноября 2023 года, когда совет директоров уволил Сэма Альтмана, но затем вернул под давлением сотрудников и инвесторов. Повышение порога делает увольнение более сложным и требует большего консенсуса среди директоров, что должно обеспечить стабильность руководства.

Что такое Managed Agents API от Google Cloud?

Managed Agents API – это платформа для разработки, развёртывания и оркестрации AI-агентов в корпоративной среде. Она позволяет компаниям создавать автономных агентов для автоматизации задач, интегрировать их с внутренними системами и управлять безопасностью и соответствием регуляторным требованиям.

Что дальше?

20 мая показало, что Google всё ещё способен впечатлять масштабом и скоростью интеграции AI в свою экосистему. OpenAI продолжает балансировать между технологическим лидерством и корпоративными драмами. Chrome учится быть агентом, облачные платформы превращаются в фабрики для enterprise AI, а стартапы пытаются найти свою нишу в мире, где доминируют гиганты.

Остаётся вопрос: насколько быстро пользователи и организации готовы принять этот новый мир, где AI встроен в каждый инструмент, каждый браузер, каждое рабочее приложение? И что произойдёт, когда эти системы начнут ошибаться – не в лаборатории, а в продакшене, на миллиардах устройств?

AI-новостиGoogle I/OOpenAIGeminiChromeдайджест

Хотите такую же автоматизацию?

Настроим AI-фабрику контента для вашего бизнеса за 3 дня.

Обсудить проект