Нейросети научились писать подкасты по загруженному документу
Нажать кнопку, чтобы сделать.
PlayAI — это «голосовой интерфейс» для текстовых нейросетей. Проект сильно поднатаскался в задаче озвучания текста и тут составляет конкуренцию ElevenLabs. Он позволяет получить готовую аудиодорожку по одному файлу да ещё и гибко настроить голос.
В сервисе появилась «песочница», которая даёт возможность поиграть с нейронкой. Кидаем в неё текст, фотографию, видео или аудио, а на выходе получаем подкаст, сказку или саммари по предмету обсуждения. Можно ещё и настроить голос, и скопировать свой (или чужой).
Естественно, выходит пока не без ошибок и галлюцинаций, но даже в таком виде это очень слушабельно — на первый взгляд от реальной записи не отличить. Как только нейросети научатся подражать живым голосам лучше, можно будет даже новости не готовить: загрузил в нейронку пару статей, дал задание и выпуск готов. Или гостя на подкаст не звать, а скопировать его голос и загрузить корпус старых интервью. А потом ещё и видео сгенерировать под дорожку: тяп-ляп и новый ролик на YouTube готов.
Ну что, ждём такое будущее или надеемся, что оно проскочит мимо?