A Cloudflare começou a bloquear, por padrão, o acesso de bots de inteligência artificial aos sites que protege, exigindo consentimento explícito dos proprietários
A Cloudflare anunciou uma alteração estrutural na forma como os rastreadores de Inteligência Artificial (IA) acedem a conteúdos online. A partir de agora, o acesso por parte de bots de IA passa a ser bloqueado por padrão em todos os websites geridos pela empresa, sendo apenas autorizado mediante consentimento explícito dos proprietários. “A Cloudflare é agora o primeiro fornecedor de infraestruturas de internet a bloquear, por padrão, o acesso dos rastreadores de IA a conteúdos sem permissão ou compensação”, afirmou a organização num comunicado oficial. Esta decisão surge num momento de crescente debate em torno da recolha de dados online para o treino de modelos de linguagem de grande escala (LLM), como o ChatGPT, Llama ou Grok. A prática de scraping, que consiste em recolher conteúdo da web para alimentar estes modelos, tem levantado preocupações sobre direitos de autor, privacidade e sustentabilidade económica da internet. Embora a legalidade do scraping varie conforme a jurisdição, continua a ser uma zona cinzenta. Na Europa, os reguladores enfrentam dificuldades em aplicar medidas consistentes. O caso da Meta é ilustrativo: apesar de críticas, a empresa continua a recolher dados das redes sociais Facebook e Instagram para treinar o seu modelo Llama. Decisões judiciais e administrativas na Alemanha e Irlanda revelaram também falta de alinhamento entre autoridades nacionais e incerteza jurídica à escala europeia. Além do enquadramento legal, a Cloudflare destaca os impactos económicos da recolha automatizada de conteúdos. Ao permitir que LLM respondam a utilizadores sem encaminhá-los para os sites originais, as plataformas de IA podem desviar tráfego e afetar receitas publicitárias, prejudicando os criadores de conteúdo. “Se a internet vai sobreviver à era da IA, precisamos de dar aos editores o controlo que merecem”, defendeu Matthew Prince, cofundador e CEO da Cloudflare. “Queremos salvaguardar o futuro de uma internet livre e vibrante com um novo modelo que funcione para todos — criadores, consumidores e inovadores de IA”. A nova funcionalidade da Cloudflare permite agora aos websites definir regras específicas para o rastreio por IA, incluindo a finalidade do acesso: seja para treino de modelos, inferência ou simples pesquisa. Muitos editores mostram-se mais recetivos a permitir o acesso para fins de pesquisa, mas impõem restrições mais severas no que toca ao treino de IA. Com esta medida, a Cloudflare assume um papel de autorregulação tecnológica, procurando criar um equilíbrio entre inovação, respeito pelos criadores e responsabilidade digital. Ao mesmo tempo, evidencia um problema fundamental: a tecnologia avança mais depressa do que a legislação, e os regulamentos continuam presos a fronteiras nacionais num ambiente digital global. |