NVIDIA обучала нейросети на контенте с YouTube
Естественно, делать так было нельзя.
Компания использовала защищённый копирайтом контент для обучения моделей в своих проектах, сообщает 404 Media. Сотрудникам были выданы распоряжения загружать видео из Neftlix, YouTube. Чтобы YouTube не засёк масштабный парсинг видео, работники NVIDIA загружали видео через виртуальные машины, меняя IP-адреса.
Представитель YouTube, комментируя новость, отослал издание Engadget к позиции, озвученной ещё в апреле (во время аналогичного скандала с OpenAI): использование видео с хостинга для обучения ИИ-моделей нарушает правила использования сервиса.
NVIDIA же оправдывается, заявляя, что соблюдает законы об авторском праве: мол, она не контент берёт, а общедоступные факты, идеи и информацию. А то, что это всё содержится в закопирайченных роликах, — ну и какая разница?
Похоже, что стратегия компании пришла из пабликов с волчьими цитатами: «Лучше сделать и жалеть, чем не сделать и пожалеть, ауф».