Ян Дашевский 25 ноября 2024 Комментировать 1384

Нейросети научились писать подкасты по загруженному документу

Нажать кнопку, чтобы сделать.

Иллюстрация: Светлана Чувилёва / Wylsacom Media

PlayAI — это «голосовой интерфейс» для текстовых нейросетей. Проект сильно поднатаскался в задаче озвучания текста и тут составляет конкуренцию ElevenLabs. Он позволяет получить готовую аудиодорожку по одному файлу да ещё и гибко настроить голос.

В сервисе появилась «песочница», которая даёт возможность поиграть с нейронкой. Кидаем в неё текст, фотографию, видео или аудио, а на выходе получаем подкаст, сказку или саммари по предмету обсуждения. Можно ещё и настроить голос, и скопировать свой (или чужой).

Естественно, выходит пока не без ошибок и галлюцинаций, но даже в таком виде это очень слушабельно — на первый взгляд от реальной записи не отличить. Как только нейросети научатся подражать живым голосам лучше, можно будет даже новости не готовить: загрузил в нейронку пару статей, дал задание и выпуск готов. Или гостя на подкаст не звать, а скопировать его голос и загрузить корпус старых интервью. А потом ещё и видео сгенерировать под дорожку: тяп-ляп и новый ролик на YouTube готов.

Ну что, ждём такое будущее или надеемся, что оно проскочит мимо?

Источник:

TechCrunch

Нейросети научились писать подкасты по загруженному документу

Сегодня читают

Рассказываем о важных событиях в мире технологий

О проекте

Приложения

Samsung представила Galaxy A57 и A37 с крохотулечными изменениями