“Temos que formar a base, capacitar o país de alto a baixo”

A ciência dos dados é ainda embrionária em Portugal. Faltam recursos especializados, mas também posicionamento estratégico nas organizações. As boas notícias, diz Guilherme Ramos Pereira, Diretor Executivo da DSPA – Data Science Portuguese Association, é que já se fala sobre o tema, muito à boleia da transição digital acelerada pela pandemia

“Temos que formar a base, capacitar o país de alto a baixo”

O recente escândalo de fuga de informação – Pandora Papers – soma 2,94 terabytes de dados, depois de armazenados, em suporte digital, mais de 1,2 milhões de emails, 2,9 milhões de imagens, 476 mil gráficos, 8.500 apresentações, entre muitos outros elementos que suportam a investigação feita por um consórcio mundial de jornalistas. Uma quantidade difícil de quantificar, mas que, apesar de parecer um enorme volume, representa apenas uma gota no oceano dos dados produzidos diariamente no mundo inteiro. Em 2019, por exemplo, o ritmo de produção de dados era de, em média, 2,2 milhões de terabytes diários. Um número que cresceu ainda mais durante a pandemia, com o Instituto Gartner a estimar um total de 40 triliões de gigabytes produzidos em 12 meses. Este cenário impõe desafios a empresários e organizações que, de entre este mundo de dados, terão que retirar informação relevante para os seus negócios.

Guilherme Ramos Pereira, Diretor Executivo da DSPA, assumiu há três anos a missão de evangelizar o mercado nacional para o tema da ciência dos dados, e de procurar que as empresas nacionais percebam a urgência de definir estratégias em que a Data Science seja uma componente essencial para o sucesso dos negócios. Num mundo cada vez mais digital, não há como escapar. “As opções para as organizações são sim, ou sim”, diz em entrevista à IT Insight. Contudo, alerta, “há muito para fazer: falta literacia dos dados, é preciso capacitar recursos para trabalhar na área, e redefinir o posicionamento estratégico das organizações para que sejam ‘data-driven’”.

Podemos dizer que já existe um setor de Data Science em Portugal?

Existem os princípios de um setor. Estamos manifestamente atrasados, numa perspetiva de radar internacional e de competitividade, em relação a muitíssimos países, e atrás de países europeus com os quais concorremos nos mercados internacionais.

Quais as principais razões para este atraso?

Por um lado, a falta de cultura de dados na sociedade e nas organizações é um problema que existe e que permanece, assim como a falta de literacia e de um posicionamento que coloque os dados no centro da equação e no centro das organizações. Por outro lado, temos vindo a assistir a um bom hype no mercado sobre este tema. De facto, as empresas, as autarquias, as universidades, os politécnicos, os stakeholders deste país, começam a falar. A maior parte deles, diria que nem sabem do que estão a falar, mas é muito bom que estejam a falar da chamada transformação e transição digital. Temos é de ter consciência plena que nos últimos dois anos fomos muitíssimo ajudados pelo fenómeno da pandemia, como é evidente.

A DSPA tem também o papel de ajudar a criar o setor…

Sim. A DSPA tem pouco mais de três anos de existência, enquanto associação que nasceu para ser uma plataforma agregadora dos stakeholders e dos negócios. E os stakeholders são todos: os que são estudantes nestas áreas e os que não são, os profissionais, os practioners, os professores, os investigadores, o C-level das organizações, os profissionais de ambos os lados da barricada… No fundo, tanto os que prestam serviços ligados à Data Science, como os que compram e implementam dentro das suas empresas e organizações e que criam áreas de analítica.

O mundo está hoje a produzir dados a uma velocidade estonteante. Como gerir e lidar com esta explosão de dados?

Logicamente, quando falamos em empresas, falamos de organizações em geral, e de realidades muito diferentes. Se olharmos especificamente para Portugal, temos um país pequeno, um mercado pequeno e mais de 90% do tecido empresarial constituído por PME. As empresas já perceberam que é uma oportunidade perdida se não olharem para os dados, se não os trabalharem, questionarem e extraírem os insights para a melhor performance dos seus negócios. E sabem que não têm opção.

O mundo corre freneticamente atrás da melhor forma de extrair valor dessa tal quantidade diabólica de dados. Porque isto do Data Science sempre existiu, porque é uma questão de gestão e de otimização. Ou seja, se eu tenho acesso a dados e sou curioso o suficiente para fazer as perguntas necessárias para trazerem respostas que vão servir a otimização do meu negócio, então fantástico.

Para os menos atentos, quando falamos de ciência de dados, estamos a falar apenas da extração de informação útil a partir dos dados, ou é muito mais do que isso?

Quando falamos do Data Science falamos, obviamente, de disciplinas com algum grau de especificidade. Falamos das matemáticas, das estatísticas, e o Data Science por si é uma coisa aplicada ao negócio ou a um projeto. Não estamos a falar de estatística pura e dura, mas a algoritmia, o desenvolvimento de modelos matemáticos alimenta um Data Science mais evoluído, e isto tudo tem camadas de complexidade.

Ou seja, é um empowerment de uma transformação quase cultural porque depois entramos, de facto, em territórios muito técnicos quando falamos de machine learning, deep learning, inteligência artificial – claro que todas estas áreas são peças que muitas vezes nem consideramos parte do Data Science –, mas são parceiras do Data Science, e estão ao serviço desta otimização de resultados, qualquer que seja a questão que temos.

Diria que, de uma ótica mais conservadora, claro que todos os projetos começam por uma analítica mais básica, em que o primeiro passo é saber qual é a informação que tenho dentro de casa e qual a que vou buscar fora. Depois, começou a aparecer esta geração colossal diária de dados, mas também começou a aparecer a tal capacidade que nos permite trabalhar, observar, analisar e correlacionar estes dados todos.

Ora, diria que o caminho chapa três é académico, e isto é algo que se deveria estar a ensinar no ensino básico: a capacidade de saber observar os dados que já temos. E aqui vem toda a parte de visualização de dados, dos dashboards, que já são conceitos e instrumentos muito antigos de gestão.

Agora, diria que quando uma organização tem uma boa capacidade analítica de observar o que tem dentro de casa, os seus dados, está lançada para fazer a evolução de utilizar a analítica, não só, numa perspetiva de observação de informação, como para desenvolver a previsão a partir daquilo que já tem e daquilo que sabe que afeta o seu negócio. Depois, claro, começa a ir buscar dados estruturados ou não estruturados fora da organização, a trazê-los para dentro, e a correlacionar com os dados que já tem. Ao trazermos isto para dentro das nossas organizações, passamos a poder fazer análise preditiva e preventiva, por exemplo, na indústria 4.0, interoperabilidade, etc.

Trata-se, por exemplo, de perceber se um novo produto terá ou não sucesso no mercado?

Sim, o que é algo muito relevante, mas, infelizmente, um conceito pouco utilizado em Portugal. Uma das coisas que Portugal precisa de fazer para se desenvolver nesta área é, não só, fazer este processo da literacia dos dados, mas também o pró conceito de test before invest, ou seja, os test beds, que são absolutamente fundamentais para testar.

Um dos trabalhos que a DSPA tem vindo a fazer – através de um projeto com financiamento do Compete –, passa justamente por contar esta história da literacia dos dados e por procurar criar dinâmicas de test beds regionais, para que as empresas percebam que têm de se desafiar e testar ideias que possam ter de desenvolvimento de produtos ou serviços, sem ter de ter o ónus do grande custo de investimento. E este tema cruza-se também com um outro projeto, que está no IAPMEI e na Agência Nacional de Inovação em processo de aprovação, de definição do mapa nacional de Digital Inovation Hubs. Na DSPA liderámos uma candidatura, criámos um consórcio, viemos a fundi-lo depois com outro consórcio, ambos dentro dos eixos da supercomputação, do Data Science e da Inteligência Artificial, que tem no centro do conceito um Digital Inovation Hub, com uma dimensão muito grande de test before invest.

Uma espécie de grande laboratório…

Sim. A ideia é termos um laboratório, um centro nacional para que as ideias, as soluções, os produtos e serviços das empresas, possam ser testados antes de dar os passos seguintes. O processo está à espera de validação das candidaturas e do fecho desta rede nacional de Digital Inovation Hubs e até da sua integração na rede europeia de Digital Inovation Hubs. Creio que poderá ser uma peça aceleradora da transformação de perceções, de experiências e da atividade das organizações. Trata- -se de facilitarmos a vida às pessoas, de lhes mostrarmos caminhos e disponibilizar ferramentas para as coisas serem testadas. Já fizemos workshops em Lisboa e no Fundão, e em novembro estaremos em Bragança, Guarda, Aveiro e Braga, para apresentar casos de estudo, em setores até mais tradicionais, para que os stakeholders locais compreendam o que é possível fazer. É com base nesses exemplos de setores mais tradicionais que podemos mostrar aos outros que, com vontade e alguma formação de base, é possível replicar isto nos seus negócios.

É preciso, contudo, formar as pessoas.

A capacitação das pessoas é uma urgência do nosso país e de todos os países. Temos de capacitar as pessoas, as organizações, as sociedades, e isto é um trabalho que tem de ser feito, mas que demora. No nosso projeto temos vindo a disseminar informação sobre a capacitação das PME, das pessoas e dos profissionais. Um tema que serve um outro processo, que também estamos a desenvolver, que é o da capacitação por via da certificação de profissionais. Para tal, criámos um manual sobre o que é a profissão de Data Scientist, para facilitar um bocadinho e estruturar estas áreas. Por outro lado, o que também estamos a fazer com esta disseminação de informação é procurar pô-la ao dispor de parceiros para, numa perspetiva regional, se servirem da nossa informação para todos falarmos uma só linguagem.

Segundo o Observatório da DSPA, entre os maiores desafios na implementação de projetos de Data Science, estão a inconsistência dos dados e a maturidade tecnológica. Como podemos ultrapassar estes obstáculos?

Bom, com a inconsistência dos dados voltamos sempre ao mesmo sítio, ou seja, ao princípio da equação. Dados há muitos, mas o que importa é ver que dados me servem ou podem servir. Temos de fazer a pergunta certa e ter a preocupação de ser curioso e fazer um bom tratamento de dados. A inconsistência dos dados relaciona-se com a literacia e cultura dos dados, porque os dados têm de ser bons, têm de ser tratados, têm de ser trabalhados e validados, têm de estar no centro de tudo.

Por outro lado, é preciso ter a inteligência da máquina a trabalhar os dados, portanto, o tema da tecnologia é vital. Ora, existe tecnologia, existem muitas soluções e ofertas no mercado, passou a existir muita tecnologia disponível e é preciso ir acompanhando essa evolução e trabalhar em comunidade, trabalhar em rede, e procurar onde estão os test beds, onde a tecnologia é disponibilizada para tratar os dados e onde é utilizada lado a lado com modelos que devo utilizar para obter respostas dos meus dados. E temos a vantagem de que, cada vez que esses modelos forem alimentados com mais dados, mais ricos ficam. É preciso a mentalidade, enquanto país, de reforçar o conceito de test before invest. Os laboratórios colaborativos que fazem o interface tecnológico são vitais para o desenvolvimento de um país, dos ecossistemas empresariais e setoriais.

A escassez de recursos que afeta o setor das TI, em geral, estende-se a esta área, que é ainda muito recente. O meio académico está a criar a oferta necessária à formação destes recursos especializados?

Diria que as empresas grandes, as médias e até mesmo algumas pequenas, fazem a aproximação às universidades e aos politécnicos e dizem o que procuram, porque não têm outro remédio. As que têm maior dimensão conseguem ter a capacidade de formatar, patrocinar e encabeçar ações de formação, o que acelera muito. Contratam academias, juntam-se e criam academias. Repare, por exemplo, o programa Upskill nasce de uma ideia quase privada, de um conjunto de empresas, de criarem a academia para se servirem elas do produto da academia. Existe essa formação à medida, muito mais ágil, muito mais prática e com a possibilidade – porque são as empresas que são os dínamos dessas iniciativas –, de pegar nesses recursos e trazê-los imediatamente para o ambiente profissional, assim como levar o ambiente profissional para a formação e fazer a indução destes conhecimentos.

De facto, tudo isso tem vindo a ser feito, mas há coisas que não conseguimos combater, como o tema da demografia, ou o tema da concorrência com outros mercados, que nos rouba tanto talento. São guerras muito difíceis.

E como é que se combate?

Temos de requalificar e começar na base, com conteúdos para o ensino básico, tal como há outros países que trazem a programação para o ensino básico. Há uma organização nossa associada - a Junior Achievement -, que tem um conjunto de eixos de atuação, mas o que faz é justamente, através da rede escolar, implementar um modelo de formação de ensino e capacitação, através de competições saudáveis que levam conhecimento às crianças. Estamos a trabalhar com eles para desenhar conteúdos que nos permitam levar as primeiras luzes e ideias do que são os dados e do que são os dados trabalhados, para ilustrar como podemos transformar os dados em informação, através de exemplos muito concretos e divertidos. Temos que formar a base, capacitar o país de alto a baixo, e há muita população ativa que tem de ser requalificada, e que quer ser requalificada, seja por sobrevivência ou curiosidade.

Para já, apenas as grandes empresas começam a olhar para a ciência dos dados como um fator crítico de sucesso. Mas para as pequenas empresas poderá ser um passo mais complicado fazer esta implementação?

Acho que vai depender da mentalidade. É lógico que uma microempresa não tem capacidade, mas já fazem o seu Data Science sem sequer pensarem nisso, porque já olham para os dados dos seus clientes. Mas a empresa pode sempre ser otimizada, mesmo com a utilização de ferramentas básicas. Os dados estão na curiosidade, estão na necessidade, na sustentabilidade e no crescimento. As ferramentas existem, é preciso tempo, é preciso curiosidade, e tudo isto é potenciado se houver mindset para fazê-lo.

Conjugada com a IA, a Data Science torna-se uma ferramenta muito poderosa. Quais os desafios éticos associados à utilização destas ferramentas?

Há desafios enormes aqui e que são temas muito quentes. Na DSPA, um dos primeiros desafios para que se atirou quando começou a sua atividade foi desenvolver um código de ética e de conduta para os profissionais do Data Science. Fizemos uma consulta aberta aos associados, e recolhemos os inputs que nos deram, mas fizemos também muito benchmarking internacional. A ética é um tema muito importante para todos e, por isso, é fundamental termos princípios norteados pelas melhores práticas da atividade.

Mais do que impor regras de conduta às pessoas, é importante olharmos para uma outra questão muito importante: a ética das máquinas. As máquinas comunicam entre elas e têm ‘cérebros’ que as tornam capazes de tomar decisões que podem ir contra os princípios éticos da humanidade. E isto pode ser crítico em áreas como a saúde, na indústria ou nos transportes. Como ultrapassar estas questões?

À medida que os fabricantes lançam ferramentas para a automatização de tarefas que antes eram muito especializadas em termos da ciência dos dados, crê que poderemos ver a emergência de novas camadas de ‘practitioners’ de data science que não necessariamente os data scientists? Assistiremos à emergência de um citizen data scientist?

Numa sociedade muito evoluída nestes domínios podemos, no limite, ter um data scientist em cada cidadão. No fundo, já somos todos um pouco data scientists com os nossos telemóveis, que nos ajudam a tomar uma série de decisões. A aceleração destas possibilidades pela capacidade computacional das máquinas coloca, no entanto, desafios muito exigentes como, por exemplo, os desafios éticos que serão sempre mais simples de ultrapassar se soubermos do que estamos a falar. A sociedade será mais avançada pelo conhecimento.

Tags

REVISTA DIGITAL

IT INSIGHT Nº 38 Julho 2022

IT INSIGHT Nº 38 Julho 2022

NEWSLETTER

Receba todas as novidades na sua caixa de correio!

O nosso website usa cookies para garantir uma melhor experiência de utilização.