Gemini, Gemini, Gemini и ни слова об Android 15: вот, что показали на Google I/O — Wylsacom

Gemini, Gemini, Gemini и ни слова об Android 15: вот, что показали на Google I/O

Обзор двухчасовой презентации.

Иллюстрация: Светлана Чувилёва / Wylsacom Media

Вопреки слухам и ожиданиям, Google I/O была полностью посвящена искусственному интеллекту и продуктам на базе него — Gemini, Project Astra и Veo.

Gemini

Gemini — самая технологичная ИИ-модель Google. В новой версии она поддерживает до двух миллионов токенов. Это позволит ей обработать ещё более длинные текстовые запросы и формировать развёрнутые ответы.

На презентации показали две новые версии Gemini 1.5: Pro и Flash.

«Прошка» предназначена для работы с большим объёмом данных. Она сможет анализировать сотни страниц текста и несколько часов аудиозаписей, обобщать информацию из писем Gmail, делать пересказ основных моментов из записей Google Meet, искать конкретные предметы, события и людей на снимках в Google Photo.

Версия Flash будет выполнять более простые задачи и давать быстрые ответы. Она отлично подойдёт для чат-ботов.

Что будут делать?

Gemini бустит поисковик. Теперь вопросы можно будет задавать не только через текст и аудио, но и видео. ИИ сможет найти решение задачи и объяснить его. Это потенциально облегчит жизнь миллионов учеников.

В поиске Google появится окно Overviews. В нём будет «выжимка» из найденных статей. Чем длиннее будет запрос, тем лучше ИИ поймёт задачу и сможет дать более точный ответ. Эта функция будет доступна в конце этого года только пользователям из США.

IMG_0018
IMG_0019
IMG_0020

Искусственный интеллект появится в YouTube. При просмотре видео пользователи смогут открывать чат-бот и задавать уточняющие вопросы. Например, искать определение термина, который услышали в ролике.

IMG_0029
IMG_0027
IMG_0028

Модель Gemini Nano будет работать в Android. Например, она сможет отвечать на вопросы, искать конкретный момент в видео YouTube, защитит от спам-звонков и многое другое. Часть функций будет доступна даже без подключения к интернету.

Project Astra — замена «Google Ассистенту»?

Project Astra станет продвинутым голосовым помощником, который работает с аудио- и видеозапросами. Он сможет анализировать пространство вокруг и беседовать с пользователем, сможет собирать информацию о человеке и адаптироваться под него. Например, можно будет спросить, где в доме лежат какие-то вещи.

Astra будет доступен и в умных аксессуарах, например в очках. Функция кажется очень полезной для людей с ограниченными возможностями, например, для людей с нарушениями зрения.

Графика и видео

Google также анонсировала третью версию Imagen — нейросети для генерации изображений. Кадры из неё должны стать реалистичнее и детализированнее.

IMG_0345
IMG_0348
IMG_0349
IMG_0350
IMG_0351
IMG_0352

Компания также представила Veo — нейросеть для генерации видео длительностью более минуты и разрешением 1080p на основе теста, фото или других видео. Для неё можно будет указывать, в каком стиле хочется получить материал.

Google заявляет, что очень ответственно относится к разработке искусственного интеллекта. Проводит множество тестов и пытается самостоятельно взламывать собственные продукты. Всё, чтобы пользователи были уверены в сохранности своих данных. Также она предусматривает водяные знаки SynthID для контента, сделанного нейросетями.

Анонсированные фишки прикольные и могут помочь ускорить работу пользователей в будущем. Сама же компания время зрителей не бережёт: 2 часа презентации были посвящены ИИ. Google проигнорировала и свежий Android, и Pixel 9. Возможно, разработчикам было бы интересно узнать больше технических деталей, но для них предусмотрены отдельные мероприятия. Обычные же пользователи могли просто уснуть при просмотре. Впрочем, в этом нет ничего нового. Типичная Google.