Скандал з OpenAI: чи використовували вони чужий контент без дозволу

ГоловнаТехнологіїСкандал з OpenAI: чи використовували вони чужий контент без дозволу

-

OpenAI знову під прицілом. Автори, програмісти та інші правовласники звинувачують компанію у використанні їхніх робіт (книг, програмного коду тощо) для тренування AI-моделей без дозволу, пише Techcrunch.

Компанія завжди стверджувала, що це “добросовісне використання”, але нове дослідження може все змінити. Вчені з Університету Вашингтона, Копенгагена та Стенфорда розробили новий спосіб виявлення “запам’ятованих” моделлю фрагментів.

Як працює метод

Все просто – моделі AI іноді буквально запам’ятовують уривки з тренувальних даних. Дослідники шукали незвичайні слова, які випадають із контексту:

  • Наприклад, слово “радар” у реченні “Ми з Джеком сиділи нерухомо, а радар гув”;
  • Такі слова називають “high-surprisal” – вони рідкісні та неочікувані;
  • Якщо модель правильно вгадує такі слова – вона їх запам’ятала.

Що виявили

Тестували GPT-4 та GPT-3.5. Результати:

  • Моделі показали знання уривків з популярних книг;
  • Частково запам’ятали статті New York Times;
  • Особливо багато “забутих” фрагментів з набору BookMIA (захищені авторським правом електронні книги).

Абхілаша Равічандер, одна з авторів дослідження, каже:

Нам потрібні моделі, які можна перевіряти. Але справжня проблема – відсутність прозорості в даних.

OpenAI активно лобіює послаблення авторських прав для тренування AI. Водночас:

  • Пропонують механізми “відмови” для правовласників;
  • Укладають окремі угоди з контент-провайдерами;
  • Але продовжують наполягати на “добросовісному використанні”.

Ця історія може стати поворотною точкою для всієї індустрії штучного інтелекту. А поки що – питання залишається відкритим.

Ми в соціальних мережах

Останні новини

Как выбрать магазин для оружия: надежность, материалы и советы

Современный рынок оружейных комплектующих постоянно развивается, предлагая пользователям всё более надежные и функциональные решения....

Парные кольца, которые остаются модными вне сезона

Фото: Золота Королева Мода на украшения меняется, но есть вещи, которые всегда остаются актуальными. Именно...

Палац «Україна»: головна концертна локація Києва для яскравих подій

Київ пропонує десятки варіантів для культурного відпочинку, але є місця, які роками залишаються поза...

Ліпома: коли варто видаляти та чому не слід відкладати візит до лікаря

Ліпома — це доброякісне утворення з жирової тканини, яке часто виглядає як м’яке ущільнення...

Можливо вам сподобається

Какие существуют разновидности современных систем видеонаблюдения

Ассортимент современных решений для защиты от несанкционированного проникновения на объект включает самые разнообразные системы...

Медичні інновації у МЦ Святої Параскеви: як новітні технології покращують ваш досвід лікування 

Розповідаємо як у львівському Медичному центрі Святої Параскеви впроваджують і використовують технологічні напрацювання. Все – з...

Серверы для бизнеса и IT-инфраструктуры: как выбрать надежный сервер компьютер

Серверы играют ключевую роль в работе современных компаний, интернет-сервисов и корпоративных сетей. Практически любой...