Recentemente, a NVIDIA foi acusada de coletar vídeos do YouTube, Netflix e outras fontes sem permissão para treinar seus modelos de inteligência artificial. A descoberta ocorreu em 2023 através de documentos vazados obtidos pelo site 404 Media, que revelaram as práticas clandestinas da empresa.
Para não ser descoberta enquanto coletava dados dessas plataformas, a NVIDIA usou máquinas virtuais. Nem os criadores de conteúdo nem os donos das plataformas, como YouTube e Netflix, autorizaram essa prática. Neal Mohan, CEO do YouTube, deixou clara sua discordância, dizendo que isso violava os termos de serviço.
As atividades de coleta de dados ocorreram nos últimos anos, com documentos internos e e-mails vazados datando desde 2022. A prática envolveu diversas fontes de vídeo, incluindo bibliotecas acadêmicas destinadas exclusivamente à pesquisa.
A empresa defende suas ações, afirmando que estão em conformidade com a lei de direitos autorais e alegando que a prática se encaixa na categoria de uso transformativo. No entanto, essa interpretação é contestada por plataformas como YouTube, que veem a prática como uma clara violação.
Funcionários que levantaram questões éticas ou legais foram informados por Ming-Yu Liu, vice-presidente de pesquisa da NVIDIA, que a prática era aprovada pelos níveis mais altos da empresa. A operação envolveu não apenas vídeos do YouTube, mas também outras bibliotecas de dados, como MovieNet e WebVid.
As práticas da NVIDIA levantaram várias preocupações éticas e legais, principalmente sobre a qualidade dos dados raspados e a falta de transparência. Especialistas sugerem que as empresas de IA forneçam uma “conta de materiais” para mostrar de onde vêm os dados usados no treinamento, ajudando a aumentar a confiança. A controvérsia em torno dessas práticas mostra os desafios entre a inovação tecnológica e as questões éticas. Conforme a indústria de IA evolui, fica cada vez mais evidente que precisamos de práticas mais abertas e confiáveis.
Fontes: 404media – tomsguide.com