Escassez de dados originais ameaça progresso da IA e dados sintéticos surgem como solução estratégica

Especialista destaca que gerar dados sintéticos permitirá avanços em setores como farmacêutica, finanças e energia, acelerando inovação e competitividade

Escassez de dados originais ameaça progresso da IA e dados sintéticos surgem como solução estratégica

A Inteligência Artificial (IA) enfrenta uma escassez de dados originais disponíveis para treino, condicionando a sua evolução, conforme expõe Jack Hidary, CEO da SandboxAQ, num artigo para o site do Fórum Económico Mundial.

Apesar do aumento global do volume de dados, os modelos de IA consomem informação mais rapidamente do que novos dados inéditos são produzidos. Isto limita a capacidade de obtenção de novas perceções e soluções, especialmente em áreas quantitativas complexas como as ciências farmacêuticas, financeiras ou químicas, onde as combinações e variações são vastas mas geralmente exploradas apenas através de experimentação física cara e lenta.

Uma alternativa emergente é a geração de dados sintéticos, obtida através de dois métodos principais: a automação de experiências físicas com robótica avançada e a simulação computacional digital, esta última focada na criação de grandes modelos quantitativos (LQM). Estes modelos são treinados em princípios fundamentais da física, química e biologia, oferecendo simulações precisas que geram não só dados novos, mas explicações causais audíveis dos resultados.

Estes avanços permitem, por exemplo, acelerar o desenvolvimento de medicamentos ao simular interações e toxicidades de candidatos em larga escala previamente a testes laboratoriais, tornando a investigação mais eficiente e direcionada, incluindo em domínios ainda pouco explorados ou em condições médicas difíceis de tratar.

O impacto da geração sintética de dados depende, contudo, de um ecossistema de inovação que tenha acesso facilitado a conjuntos de dados essenciais, preservando a propriedade intelectual e garantindo a privacidade e segurança. Plataformas específicas estão a democratizar o acesso, permitindo que a inteligência coletiva contribua para avanços em várias áreas, desde ensaios virtuais médicos até a aplicações em ciência dos materiais, finanças e energias.

A geração de dados é considerada uma vantagem estratégica crucial. Empresas e governos que adotarem ciclos de trabalho rápidos baseados em simulações, em vez do tradicional método lento de teste físico, estarão numa posição de liderança. Exemplos práticos incluem a redução de custos e tempos no desenvolvimento farmacêutico, a simulação de mercados financeiros para identificar riscos inéditos, a descoberta acelerada de novos materiais na indústria e o aperfeiçoamento da sustentabilidade e inovação energética.

Hidary alerta que o futuro económico e científico será definido por quem dominar a criação de dados, não por quem acumular dados históricos. O executivo defende que é necessário implementar uma arquitetura focada na geração de dados para desbloquear todo o potencial da inteligência artificial colectiva e impulsionar o progresso.

“Estamos num ponto de inflexão entre a dependência de dados finitos e históricos e a vantagem dos dados gerados”, conclui, apelando a líderes empresariais e governamentais para investirem em métodos inovadores de criação de dados, promovendo talento, parcerias e novos quadros que potenciem uma nova era de inovação sustentada pela abundância do possível, e não pela escassez do que é observado.

Tags

NOTÍCIAS RELACIONADAS

RECOMENDADO PELOS LEITORES

REVISTA DIGITAL

IT INSIGHT Nº 58 Novembro 2025

IT INSIGHT Nº 58 Novembro 2025

NEWSLETTER

Receba todas as novidades na sua caixa de correio!

O nosso website usa cookies para garantir uma melhor experiência de utilização.