O treino de modelos de IA requer a utilização de enormes quantidades de dados para melhorar os seus resultados, o que pode por vezes levar à utilização indevida de conteúdos, sobretudo disponíveis 'online', incluindo os que estão protegidos por direitos de autor.
Esta situação levou um grupo de escritores a processar a empresa Anthropic em agosto do ano passado, acusando-a de roubar "centenas de milhares de livros protegidos por direitos de autor" ao utilizar livros físicos e um conjunto de dados de fonte aberta para treinar os seus modelos de IA, incluindo uma biblioteca de livros eletrónicos pirateados.
Agora, uma decisão judicial americana decidiu que o treino de modelos de IA com livros adquiridos legalmente, mesmo sem a autorização dos autores, constitui uma utilização justa.
Assim, o tribunal norte-americano salienta que a Anthropic poderá utilizar livros adquiridos em formato físico e posteriormente digitalizados pela empresa, numa ação que não viola os direitos de autor, embora a sua utilização deva limitar-se apenas ao treino de ferramentas de IA.
Apesar disso, a empresa continua a ser responsabilizada e tem agora de ir a julgamento sobre a forma como adquiriu livros anteriormente, descarregando-os a partir de páginas 'online' de cópias pirateadas.
Leia Também: Reddit acusa Anthropic de acessos (sem permissão) para treinar IA