Apple заявила, что ворованные субтитры не использовались для обучения Apple Intelligence
Всё только ради науки.
Пару дней назад издание Proof News выяснило, что такие крупные компании, как Apple, Anthropic и NVIDIA, использовали для обучения своих ИИ набор данных The Pile. В нём содержались субтитры из 170 тысяч видео на YouTube, на использование которых никто не давал разрешение. Прецедент может грозить судом, поэтому купертиновцы поспешили оправдаться.
Компания утверждает, что датасет The Pile использовался только для обучения нейронки OpenELM с открытым исходным кодом, которая была создана исключительно в научных целях, чтобы ускорить развитие больших языковых моделей. Последняя не легла в основу ни одной функции Apple Intelligence и даже в машинном обучении никак не была задействована.
По словам представителей Apple, нейронки для Apple Intelligence обучаются только на лицензированных, а также общедоступных данных. В компании подчеркнули, что новых версий OpenELM больше не будет.