ШІ компанії незаконно тренували моделі на YouTube-відео

18.07.2024 08:48

NextUI hero Image

Привіт!

Як твої справи? Тиждень вже добігає кінця, сподіваємось встигаєш з усім

Нове розслідування Proof News виявило, що технологічні гіганти, включаючи Apple, Anthropic, Nvidia та Salesforce, використовували контент з понад 170,000 відео YouTube для навчання своїх ШІ-моделей без згоди авторів.

Що відомо?

- Розслідувачі знайшли набір даних під назвою «YouTube Subtitles», котрий містить транскрипти з понад 48,000 каналів, включаючи популярних кріейторів, новинні канали, навчальні канали та інші.

- Некомерційна організація EleutherAI зібрала ці дані як частину більшої колекції під назвою 'The Pile', призначеної для надання навчальних матеріалів розробникам та науковцям.

- Автори не знали, що їхній контент використовувався для навчання ШІ, а умови використання YouTube також забороняють таке використання без дозволу.

- Повідомляється, що Apple використовувала цей набір даних для навчання OpenELM, моделі, пов'язаної з новими функціями ШІ для iPhone та MacBook.

Чому це важливо?

Хоча використання цих транскриптів не створить найкращого враження для авторів контенту, на додачу, ми ще не бачили юридичних наслідків для компаній у таких випадках. Оскільки цей набір даних також є публічно доступним через EleutherAI, важко уявити, що цей звіт призведе до чогось іншого, крім негативного PR, незважаючи на етичні/моральні проблеми, які він піднімає.

GPTDude.pro

Знаходь Штучний Інтелект для твоїх потреб.
@ 2024 GPTDude.pro