Qual o impacto dos dados para a produção científica? Para tentar responder a esta questão, levantada pela pesquisadora italiana Sabina Leonelli, a Editora Fiocruz lançou no final de maio o título “A Pesquisa Científica na Era do Big Data: cinco maneiras que mostram como o Big Data prejudica a ciência, e como podemos salvá-la”. O livro de Leonelli reúne ideias para que os dados sejam melhor utilizados pela ciência.

A obra reúne ideias e lições extraídas dos anos de estudos da pesquisadora. Em entrevista divulgada pela Fiocruz, Leonelli destaca que “a verdadeira promessa do Big Data é permitir o estabelecimento de conexões entre setores e abordagens que, no passado, se mostraram difíceis, tanto por barreiras sociais quanto por razões técnicas, de dialogar diretamente”.

A autora sugere deixar de lado definições físicas para o Big Data para se concentrar no modo como ele é utilizado. Segundo ela, dados de diversos tipos e origens se relacionam, de várias formas e para vários propósitos, mas devem facilitar a produção de novos procedimentos de análise e conhecimento.

Para Leonardo Pedroso Costa, especialista em ciência de dados, a publicação traz para o centro da pauta a relação entre Big Data e a ciência, mostrando como é possível haver uma melhor sinergia entre as duas.

“Com o uso do Big Data, as áreas de Medicina de Precisão, Prontuário eletrônico de Pacientes e IoT (internet das coisas, em português) podem ser aprimoradas a ponto de obter melhores resultados e agilidade no atendimento dos pacientes”, afirma. “Saber se um anticoagulante resolve o mesmo problema em todos os pacientes é impossível: talvez ele não funcione para grávidas, tabagistas, pacientes oncológicos, e a medicina de precisão (precision medicine) tem como objetivo ajudar a resolver esse problema”, completa.

Em vez de prescrever o mesmo anticoagulante oral para todos os pacientes, prossegue, espera-se que, um dia, seja possível indicá-lo apenas a indivíduos para os quais o medicamento funcione, de fato, por meio do Big Data e análise de dados. “A realidade brasileira é que cada unidade de saúde, seja ela particular ou não, tem um prontuário eletrônico próprio para cada paciente, podendo ser digitalizado ou em papel – o que dificulta a obtenção de melhores diagnósticos”, informa ele.

Ciência de dados beneficia área científica e mercado corporativo

De acordo com Costa, a ciência de dados pode ajudar a acelerar os estudos científicos, pois centenas de padrões podem ser facilmente testados e aprovados com apenas alguns cliques e processamentos. “Os padrões podem ser usados como validação de resultados, onde o cientista faz a análise, testa, e depois utiliza a ciência de dados como contraprova do seu resultado”.

O especialista conta que a ciência de dados começou para valer no início dos anos 2000. Antes disso, o custo computacional era muito caro, não havia programas com interface GUI para o usuário entrar com os dados e obter as saídas, era preciso programar cada etapa do software e dependia de máquinas externas para processamento. “Essas máquinas eram restritas a universidades, governos e grandes companhias, fazendo com que o custo e o acesso se tornassem altíssimos”.

Segundo Costa, foi com a popularização dos computadores, e com o aumento da oferta de vagas nas universidades, que a Ciência de Dados passou a ser utilizada de forma ampla. Conforme os avanços tecnológicos e de conhecimento aconteceram, a ciência de dados foi surgindo e evoluindo de forma natural para corresponder aos anseios e possibilidades de se trabalhar com dados nas organizações.

“Em 2013, a IBM compartilhou estatísticas mostrando que 90% dos dados do mundo tinham sido criados nos últimos dois anos, o que aponta para um futuro ainda muito promissor para a área de dados”, reporta.

