Início Política Empresas de tecnologia lutam contra criadores de conteúdo pelo uso de material...

Empresas de tecnologia lutam contra criadores de conteúdo pelo uso de material protegido por direitos autorais para treinar modelos de IA

7

Os criadores e editores canadenses querem que o governo faça algo a respeito do uso não autorizado e geralmente não relatado de seu conteúdo para treinar sistemas geradores de inteligência artificial.

Mas as empresas de IA afirmam que a utilização do material para treinar os seus sistemas não viola os direitos de autor e dizem que limitar a sua utilização impediria o desenvolvimento da IA ​​no Canadá.

Os dois lados estão defendendo seus argumentos em submissões publicadas recentemente para uma consulta sobre direitos autorais e IA que está sendo realizada pelo governo federal enquanto considera como as leis de direitos autorais do Canadá deveriam abordar o surgimento de sistemas de IA generativos como o ChatGPT da OpenAI.

A IA generativa pode criar texto, imagens, vídeos e código de computador com base em um prompt simples, mas para fazer isso, os sistemas devem primeiro estudar grandes quantidades de conteúdo existente.

Em sua apresentação ao governo, a Access Copyright argumentou que a maioria e potencialmente todos os grandes modelos de linguagem “estão atualmente lucrando com o uso e a reprodução não autorizados de obras protegidas por direitos autorais”.

Criadores irritados com a ‘caixa preta’ dos direitos autorais

Está acontecendo em uma “caixa preta”, de acordo com a Access Copyright, que representa escritores, artistas visuais e editores.

“Os detentores de direitos sabem que isso está acontecendo, mas devido à assimetria de informações entre eles e as plataformas de IA, eles não conseguem determinar quem está conduzindo a atividade, com quais obras e não têm nenhum mecanismo para impedir que isso aconteça.”

A Music Canada, que representa as principais gravadoras do país, disse no ano passado que uma música falsa gerada por IA imitando as vozes de Drake e The Weeknd “deixou uma coisa bem clara: modelos e sistemas de IA já ingeriram grandes quantidades de conjuntos de dados proprietários sem autorização da fonte dos dados ou dos detentores dos direitos”.

O Writers’ Guild of Canada pediu ao governo para começar a implementar obrigações básicas de divulgação e relatórios. Ele disse que os desenvolvedores têm todo o conhecimento do trabalho que está sendo minerado e como ele está sendo usado, enquanto os criadores não têm nenhuma dessas informações.

ASSISTA | Escritores falam sobre o risco da IA ​​em seu trabalho:

Por que os escritores de Montreal querem que a IA pare de roubar seu trabalho

Escritores locais, como Heather O’Neill, Trevor Ferguson e Rosemary Sullivan, dizem que estão interessados ​​em participar de ações legais contra empresas de inteligência artificial por usarem seus textos para treinar bots para imitar seus estilos de escrita.

Algumas organizações assinaram acordos de licenciamento com empresas de IA. Mas a Associação Canadense de Autores disse que os detentores de direitos enfrentam “imensos obstáculos” no licenciamento de seu conteúdo “porque são mantidos no escuro sobre quais de suas obras estão sendo usadas” e por quais empresas.

Solicitou ao Canadá que esclarecesse que a mineração de textos e dados está sujeita às leis de direitos autorais.

Numerosos processos estão em curso nos Estados Unidos sobre a utilização de materiais protegidos por direitos de autor por sistemas generativos de IA, incluindo um lançado esta semana pelas maiores editoras discográficas do mundo contra dois geradores de música de IA.

Disparidade de informação é um problema, dizem artistas

A Associação Canadense de Produtores de Mídia disse que os casos legais ilustram o problema colocado pela falta de transparência, citando um caso em que a empresa de IA argumentou que o detentor dos direitos não poderia prosseguir com a alegação de violação a menos que pudesse especificar o trabalho exato usado para o treinamento.

“Os titulares de direitos também enfrentarão, sem dúvida, problemas probatórios semelhantes, já que muitos conjuntos de dados usados ​​para treinar sistemas de IA generativos são supostamente destruídos após a conclusão do treinamento inicial”, afirmou.

O grupo disse que é uma questão que “exige atenção imediata” e pediu ao governo que implemente requisitos de transparência.

Mas as empresas de IA afirmam que o tipo de transparência que os detentores de direitos pedem não é realista.

A Microsoft disse ao governo que o treinamento de sistemas de IA em grande escala envolve “vastos volumes” de dados, e as empresas não deveriam ter que manter registros disso ou divulgar o conteúdo usado para treinamento.

“Não seria viável registrar tais informações e qualquer exigência desse tipo inibiria o desenvolvimento da IA”, afirmou.

A empresa argumentou que não é “violação de direitos autorais analisar obras e aprender conceitos e fatos”.

O Google disse que o treinamento de IA já está isento pela lei de direitos autorais existente, embora o governo deva adotar uma isenção para tornar isso explícito.

OUÇA | O crescente realismo da IA:

Queimador Frontal27:52É possível ter um relacionamento “real” com uma IA?

OpenAI está exibindo a versão mais recente de seu software ChatGPT em um novo conjunto de vídeos promocionais, soando quase humano na maneira como fala com os usuários, convidando a todos os tipos de comparações de ficção científica. Mas os chatbots de IA já estão aqui, usando grandes modelos de linguagem para simular a fala humana, as emoções – e até mesmo os relacionamentos. À medida que esta tecnologia se torna cada vez mais popular, o que significará para as nossas relações na “vida real”? Você pode realmente ter um relacionamento significativo com um programa de computador? E se você puder… isso é algo que você deseja confiar em uma empresa de tecnologia? A instrutora de filosofia Jill Fellows aborda as grandes questões sobre o futuro dos companheiros de IA.

O Google disse que exigir permissão para usar conteúdo para fins de treinamento exporia informações competitivamente sensíveis e “bloquearia efetivamente o desenvolvimento e o uso de grandes modelos de linguagem e outros tipos de IA de ponta”.

Ele também disse que os desenvolvedores de IA não têm acesso a informações precisas sobre o status dos direitos autorais.

“Na verdade, não existe tal fonte de verdade em nenhum lugar do mundo. Assim, o cumprimento das regras de divulgação pode simplesmente revelar-se impossível desde o início.”

A empresa canadense de IA Cohere disse que usar conteúdo para treinar sistemas de IA funciona de forma semelhante à forma como um indivíduo lê livros para se tornar mais informado.

A empresa disse que o processo não viola direitos autorais e argumentou que isso precisa ficar claro na lei. Caso contrário, “as ambições do Canadá de ser o lar de empresas e ecossistemas de IA líderes mundiais” podem ser prejudicadas.

O Council of Canadian Innovators, que representa o setor de tecnologia canadense, disse que os requisitos de divulgação prejudicariam empresas menores em oposição às suas rivais Big Tech. Ele alertou que isso “prejudicaria seriamente o potencial das empresas canadenses de escalar significativamente”.

Fuente