Open AI medger: Kan ej träna AI utan upphovsrättsskyddat material
Sam Altman, vd på Open AI, och New York Times kontor på Manhattan. Foto: Flickr @Techcrunch, Adobe stock
Open AI har lämnat in ett dokument till det brittiska parlamentets överhus där man erkänner att det inte går att träna upp stora språkmodeller, såsom GPT 4.0, utan att använda sig av upphovsrättsskyddat material. Bolaget menar däremot att New York Times stämningsansökan angående upphovsrätt är grundlös.
“Eftersom upphovsrätten i dag täcker nästan varje form av mänskligt uttryck - inklusive blogginlägg, fotografier, foruminlägg, och statliga dokument - skulle det vara omöjligt att träna dagens ledande AI-modeller utan att använda upphovsrättsskyddat material", skriver Open AI i dokumentet.
Bolaget skriver vidare att det skulle vara intressant men inte lika användbart med en modell tränad endast på allmän egendom.
"Att begränsa träningsdatan till böcker och teckningar som är allmän egendom och skapades för mer än ett sekel sedan skulle kunna resultera i ett intressant experiment, men det skulle inte resultera i AI-system som uppfyller behov för dagens medborgare."
"New York Times stämningsansökan är grundlös"
Sedan tidigare har New York Times stämt Open AI för att de tränat upp AI-modeller på tidningens upphovsrättsskyddade material utan tillåtelse. Open AI kommenterar nu att tidningens stämningsansökan är grundlös och att användandet av New York Times artiklar faller under den amerikanska rättsliga principen “fair use” (skäligt bruk). Skäligt bruk innebär att man exempelvis får återge stycken ur ett verk i en beskrivning eller kritik av verket.
Open AI hävdar att träning av AI-modeller också faller under denna princip, och man påtalar även att det finns en funktion där upphovsrättsmakare kan ta bort sitt material från träningsmaterial. Detta gjorde The New York Times i augusti förra året. Utöver tidningen har även ett antal författare stämt Open AI för användning av upphovsrättsskyddat material.
Läs mer om ämnet: