Reddit запретил Wayback Machine архивировать большинство страниц сайта — Wylsacom

Reddit запретил Wayback Machine архивировать большинство страниц сайта

Угадайте почему.

Маскот «Реддита». Источник: Reddit

Архивами интернета пользуются ИИ-компании, которые обучают на пользовательских данных свои нейросети, несмотря на запреты и политику конфиденциальности. Reddit якобы ратует за безопасность, но на деле может хотеть денег.

Компания ранее заявляла, что не будет ограничивать индексацию страниц для добросовестных компаний вроде Internet Archive (им принадлежит сервис Wayback Machine). Но сейчас Reddit прознал, что недобросовестные разработчики нейросеток этими архивами пользуются: берут снимки тредов и обучают на них ИИ-модели. Так что всё — никакого больше сохранения старых страниц, по крайней мере до того момента, как архивы интернета смогут защитить собранную информацию от использования в нейронках.

Со стороны звучит доблестно, но есть нюанс: Reddit продаёт те же данные OpenAI и Google для обучения их нейросетей. Так что компания может быть против того, чтобы кто-то обучал нейронки на данных пользователей… на халяву.