Especialista destaca que gerar dados sintéticos permitirá avanços em setores como farmacêutica, finanças e energia, acelerando inovação e competitividade
|
A Inteligência Artificial (IA) enfrenta uma escassez de dados originais disponíveis para treino, condicionando a sua evolução, conforme expõe Jack Hidary, CEO da SandboxAQ, num artigo para o site do Fórum Económico Mundial. Apesar do aumento global do volume de dados, os modelos de IA consomem informação mais rapidamente do que novos dados inéditos são produzidos. Isto limita a capacidade de obtenção de novas perceções e soluções, especialmente em áreas quantitativas complexas como as ciências farmacêuticas, financeiras ou químicas, onde as combinações e variações são vastas mas geralmente exploradas apenas através de experimentação física cara e lenta. Uma alternativa emergente é a geração de dados sintéticos, obtida através de dois métodos principais: a automação de experiências físicas com robótica avançada e a simulação computacional digital, esta última focada na criação de grandes modelos quantitativos (LQM). Estes modelos são treinados em princípios fundamentais da física, química e biologia, oferecendo simulações precisas que geram não só dados novos, mas explicações causais audíveis dos resultados. Estes avanços permitem, por exemplo, acelerar o desenvolvimento de medicamentos ao simular interações e toxicidades de candidatos em larga escala previamente a testes laboratoriais, tornando a investigação mais eficiente e direcionada, incluindo em domínios ainda pouco explorados ou em condições médicas difíceis de tratar. O impacto da geração sintética de dados depende, contudo, de um ecossistema de inovação que tenha acesso facilitado a conjuntos de dados essenciais, preservando a propriedade intelectual e garantindo a privacidade e segurança. Plataformas específicas estão a democratizar o acesso, permitindo que a inteligência coletiva contribua para avanços em várias áreas, desde ensaios virtuais médicos até a aplicações em ciência dos materiais, finanças e energias. A geração de dados é considerada uma vantagem estratégica crucial. Empresas e governos que adotarem ciclos de trabalho rápidos baseados em simulações, em vez do tradicional método lento de teste físico, estarão numa posição de liderança. Exemplos práticos incluem a redução de custos e tempos no desenvolvimento farmacêutico, a simulação de mercados financeiros para identificar riscos inéditos, a descoberta acelerada de novos materiais na indústria e o aperfeiçoamento da sustentabilidade e inovação energética. Hidary alerta que o futuro económico e científico será definido por quem dominar a criação de dados, não por quem acumular dados históricos. O executivo defende que é necessário implementar uma arquitetura focada na geração de dados para desbloquear todo o potencial da inteligência artificial colectiva e impulsionar o progresso. “Estamos num ponto de inflexão entre a dependência de dados finitos e históricos e a vantagem dos dados gerados”, conclui, apelando a líderes empresariais e governamentais para investirem em métodos inovadores de criação de dados, promovendo talento, parcerias e novos quadros que potenciem uma nova era de inovação sustentada pela abundância do possível, e não pela escassez do que é observado. |