Разработчики нейросетей массово используют пиратские библиотеки для обучения ИИ | PintNews

Разработчики нейросетей массово используют пиратские библиотеки для обучения ИИ

Крупные компании, занимающиеся разработкой искусственного интеллекта, нашли радикальный способ обхода авторских прав — обучение нейросетей на материалах из пиратских онлайн-библиотек. Как выяснилось, особой популярностью среди разработчиков пользуется электронная база LibGen (Library Genesis), содержащая более 7,5 миллионов книг и 81 миллион научных статей.

Хотя основу ресурса составляют научные публикации, в его архивах также представлены художественные произведения, изображения и другие материалы, защищённые авторским правом. Этот гигантский массив данных позволяет обучать ИИ без необходимости выплачивать компенсации правообладателям.

Юридические владельцы контента уже готовят коллективные иски, однако столкнулись с серьёзной проблемой: LibGen и аналогичные ресурсы работают через зеркала и не зарегистрированы в юрисдикциях, где возможно эффективное преследование за нарушение авторских прав.

Эксперты отмечают, что попытки ограничить использование таких данных нейросетями напоминают «битву с ветряными мельницами» — технологические компании в любом случае найдут способы обучать свои алгоритмы. При этом масштабы доходов корпораций, занимающихся разработкой ИИ, делают их нежелание платить авторам и издателям особенно заметным на фоне громких заявлений о соблюдении этических норм в технологической сфере.

Сложившаяся ситуация вновь поднимает вопрос о необходимости глобального пересмотра системы авторского права в эпоху искусственного интеллекта, когда традиционные механизмы защиты интеллектуальной собственности оказываются неэффективными против новых технологических реалий.