ruDALL-E — нейросеть «Сбера», генерирующая изображения по описанию — Wylsacom

ruDALL-E — нейросеть «Сбера», генерирующая изображения по описанию

Поддерживаются запросы на русском языке.

Иллюстрация: Светлана Чувилёва / Wylsacom Media

«Сбер» представил нейросеть ruDALL-E, которая создаёт изображения по описанию. К слову, это первая нейросеть, которая работает с запросами на русском языке, и это самый масштабный вычислительный проект в России и СНГ.

ruDALL-E обучается одновременно на картинках и текстах. Создавать можно неограниченное количество изображений, но нужно ждать: сейчас запрос обрабатывается порядка 30 минут из-за наплыва желающих.

Сгенерированные изображения по запросу «очень красивая собака». Источник: ruDALL-E

Всего задействуется три нейросети: первая анализирует запрос и генерирует заданное число изображений, вторая выбирает самые удачные картинки, а третья увеличивает их размер без потери качества.

Все модели доступны на GitHub и скоро появятся на платформе ML Space.

«Пирожные с красными ягодами». Источник: ruDALL-E

Нейросеть на английском была представлена в начале года. Её разработали в OpenAI. Команды SberDevices, Sber AI и SberCloud воспроизвели код и запустили обучение модели на платформе ML Space. На это потребовалось 23 тысячи GPU-часов с использованием 120 млн пар текст-изображение.

Предложения магазинов
  • Аноним

    Почему этого в примерах нет😂

  • http://twitter.com/MKataranov MKataranov

    Нейросеть Сбера ruDALL-E изобразила по запросу «Путин» вот это нечто. Это капец,товарищи.

  • Аноним

    чисто что мне снится

Комментарии для сайта Cackle