Юристы The New York Times и Daily News, которые судиться OpenAI за то, что они якобы без разрешения удалили их работы для обучения своих моделей ИИ, говорят, что инженеры OpenAI случайно удалили данные, потенциально имеющие отношение к делу.
Ранее этой осенью OpenAI согласилась предоставить две виртуальные машины, чтобы консультанты The Times и Daily News могли выполнять поиск их контента, защищенного авторским правом, в своих обучающих наборах для искусственного интеллекта. (Виртуальные машины — это компьютеры на базе программного обеспечения, существующие в операционной системе другого компьютера и часто используемые для целей тестирования, резервного копирования данных и запуска приложений.) письмоАдвокаты издателей говорят, что они и нанятые ими эксперты с 1 ноября потратили более 150 часов на поиск обучающих данных OpenAI.
Но 14 ноября инженеры OpenAI удалили все данные поиска издателей, хранящиеся на одной из виртуальных машин, говорится в вышеупомянутом письме, которое было подано в Окружной суд США по Южному округу Нью-Йорка поздно вечером в среду.
OpenAI попыталась восстановить данные — и в основном ей это удалось. Однако, поскольку структура папок и имена файлов были «безвозвратно» утеряны, восстановленные данные «не могут быть использованы для определения того, где скопированные статьи новостных истцов были использованы для создания [OpenAI’s] модели», согласно письму.
«Истцы News были вынуждены воссоздавать свою работу с нуля, затрачивая значительное количество человеко-часов и компьютерного времени», — написал адвокат The Times и Daily News. «Только вчера новостные истцы узнали, что восстановленные данные непригодны для использования и что работу экспертов и юристов, проделанную за целую неделю, необходимо переделать, поэтому сегодня подается дополнительное письмо».
Адвокат истцов ясно дает понять, что у них нет оснований полагать, что удаление было преднамеренным. Но они говорят, что этот инцидент подчеркивает, что OpenAI «находится в лучшем положении для поиска в своих собственных наборах данных» контента, потенциально нарушающего авторские права, используя свои собственные инструменты.
Представитель OpenAI отказался предоставить какое-либо заявление.
Но поздно вечером в пятницу, 22 ноября, адвокат OpenAI подал иск. ответ на письмо, отправленное юристами The Times и Daily News в среду. В своем ответе адвокаты OpenAI однозначно отрицали, что OpenAI удалила какие-либо доказательства, и вместо этого предположили, что истцы виноваты в неправильной настройке системы, которая привела к технической проблеме.
«Истцы потребовали изменить конфигурацию одной из нескольких машин, которые OpenAI предоставила для поиска в наборах обучающих данных», — написал адвокат OpenAI. «Однако реализация запрошенного истцами изменения привела к удалению структуры папок и некоторых имен файлов на одном жестком диске — диске, который должен был использоваться в качестве временного кэша… В любом случае нет оснований полагать, что какие-либо файлы были фактически потеряны».
В этом и других случаях OpenAI утверждает, что модели обучения с использованием общедоступных данных, включая статьи из The Times и Daily News, являются добросовестным использованием. Другими словами, при создании моделей типа ГПТ-4окоторые «учатся» на миллиардах примеров электронных книг, эссе и т. д. для создания текста, звучащего по-человечески, OpenAI считает, что от нее не требуется лицензировать или иным образом платить за примеры — даже если она зарабатывает деньги на этих моделях .
При этом OpenAI подписывает лицензионные соглашения с растущим числом новых издателей, включая Associated Press, владельца Business Insider Акселя Спрингера, Financial Times, материнскую компанию People Dotdash Meredith и News Corp. OpenAI отказалась принять условия этих соглашений. сделки публичны, но один партнер по контенту, Dotdash, как сообщается платят не менее 16 миллионов долларов в год.
OpenAI не подтвердила и не опровергла тот факт, что она без разрешения обучала свои системы искусственного интеллекта каким-либо конкретным произведениям, защищенным авторским правом.
Обновление: добавлен ответ OpenAI на обвинения.