Dados: as perguntas certas

Volume, velocidade, variabilidade. Quando se fala de big data, estes são alguns dos V que ajudam a definir o conceito

Dados: as perguntas certas

Existem outros, consoante os autores - mas a definição original da Gartner, então chamada Meta Group, mantém-se e foi até incorporada em normas e definições oficiais. O que na altura em que a definição foi, pela primeira vez, sugerida num relatório, se consideraria Big Data, seriam hoje considerados dados de média dimensão, numa escala já processável de forma eficiente com plataformas correntes.

Hoje, a questão de como armazenar volumes crescentes de dados, como aqueles a que temos vindo a assistir nas empresas e organizações, está relativamente bem resolvida. Com bons casos de exemplo, as grandes empresas no espaço da Internet, nomeadamente a Google ou a Meta, já tiveram de o resolver a uma escala que empresas e organizações cujo modelo de negócio não passe pelo armazenamento de dados de milhões de utilizadores ou de milhares de milhões de páginas, dificilmente atingirão nos próximos anos. Ou seja, existe atualmente margem de manobra e conhecimento para se armazenar, sem problemas de escalabilidade e desempenho, volumes de dados equivalentes aos geridos pelas maiores empresas da Internet.

Para lá da infraestrutura

O problema mais premente ligado ao crescimento exponencial dos dados ao nosso dispor não é infraestrutural. A infraestrutura tem as suas próprias leis exponenciais (Moore, por exemplo) e acompanha esse crescimento.

A questão está em como extrair informação relevante dos dados, não apenas recorrendo a especialistas, mas cada vez mais dando tal possibilidade de utilizadores finais. E não apenas informação retrospetiva, mas também preditiva e prescritiva, ou seja, que indique possíveis caminhos de futuro e que permita fazer recomendações.

 


A pergunta assistida, a arte e ciência de fazer perguntas aos dados, não apenas de forma ad hoc, casuística, não estruturada, mas de forma metódica e geradora de conhecimento, será a próxima barreira a ser endereçada na literacia dos dados


 

Há alguns anos, a Meta, então Facebook, deparando- se com tal problema começou a desenvolver ferramentas, que entretanto colocou em código aberto e que permitiam que utilizadores sem experiência de programação em linguagens como Java fossem capazes de interrogar os dados usando ferramentas baseadas em SQL, por exemplo. Uma barreira alta, decerto, mas não tanto como serem capazes de programar em Java. A ideia seria os próprios utilizadores finais poderem, eles próprios, explorar grandes volumes de dados sem necessidade de recorrer aos sempre escassos recursos de programação da empresa.

A próxima fronteira

A questão principal, neste momento é, portanto, o de literacia de dados, mas particularmente de um tipo de literacia que permita aos utilizadores finais tirarem partido dos dados das organizações e de, com eles conseguirem um melhor conhecimento dos clientes, do mercado e uma melhor orientação estratégica e operacional.

Os fornecedores de software e de cloud têm colocado uma grande ênfase nas ferramentas de visualização – Microsoft, Google, Salesforce ou Amazon, todos têm excelentes produtos que permitem aos utilizadores explorar os dados de forma visual. Contudo, há algo que tem faltado, uma lacuna que urge colmatar e que tem que ver com que perguntas se podem colocar aos dados e como colocá-las. Porque apenas as perguntas certas permitem obter resultados com significado. Se muitas organizações têm programas de formação para introduzir tais ferramentas de visualização, ou seja, o respetivo aspeto operacional, muito poucas o têm no que se refere ao aspeto mais exploratório – quase científico, diríamos. E científico até na replicabilidade – isto é, na forma como esse conhecimento pode ser reproduzido sistematicamente nas organizações. A pergunta assistida, a arte e ciência de fazer perguntas aos dados, não apenas de forma ad hoc, casuística, não estruturada, mas de forma metódica e geradora de conhecimento, será a próxima barreira a ser endereçada na literacia dos dados. Quanto mais depressa as organizações o entenderem e nesse sentido começarem a trabalhar, mais competitivas serão.

Tags

REVISTA DIGITAL

IT INSIGHT Nº 48 Março 2024

IT INSIGHT Nº 48 Março 2024

NEWSLETTER

Receba todas as novidades na sua caixa de correio!

O nosso website usa cookies para garantir uma melhor experiência de utilização.