Fiocruz

Fundação Oswaldo Cruz uma instituição a serviço da vida

Início do conteúdo

Big Data: uma questão ética em aberto


04/05/2015

Por Carlos Tautz / Portal Fiocruz

Compartilhar:

Quais os limites para o uso dos dados produzidos por todos os cidadãos ao navegar na internet? Quem pode acessá-los? Para quais fins? Essas são algumas das questões éticas que estão por trás dos usos do chamado Big Data (grandes dados, em tradução livre). O conceito se refere a estratégias e ferramentas para captura, armazenamento, análise e visualização de grandes volumes e formatos variados de dados, que dentre outros tipos abarcam a informação que todos nós produzimos diariamente ao circular pela internet; e seus usos têm a ver com a tradução e aplicação dessas informações em atividades práticas, entre elas a saúde.

Os números que envolvem o conceito Big Data são, de tão grandes, espantosos. Segundo a IBM, gigante multinacional da informática, todos os vídeos, fotografias, comentários em redes sociais e dispositivos móveis como celulares e iPads produzem cerca de 15 petabytes (PB), ou 215 bytes diariamente. A empresa calcula que esse volume de dados é o mesmo que toda a internet abarcava em 2009.

O volume de dados agiganta-se a cada ano devido à crescente sofisticação da rede e de suas aplicações. É que pesquisar no Google, postar em redes sociais, e até se deslocar portando um celular com o sistema de localização GPS ligado gera dados. E isso é importante por que toda essa informação, se corretamente captada, analisada e traduzida revela perfis de comportamento e preferências de enormes contingentes humanos. 

Coletivo x particular

Utilizadas em prol da sociedade, as informações do Big Data são capazes de predizer situações que exijam influência do poder público. No campo da saúde, esses dados podem indicar, por exemplo, onde, quando e em que situação há maior probabilidade de ocorrer surtos epidêmicos. Sabendo isso, os governos poderiam mobilizar recursos para mitigar os problemas mais rapidamente. Por outro lado, se utilizadas em prol de interesses particulares, essas mesmas informações podem dar a grupos econômicos a possibilidade de induzir padrões de consumo, dirigir sua estratégia comercial para excluir clientes indesejados ou simplesmente recusar, através de subterfúgios, consumidores exigentes.

É por esse tipo de questão ética que o Projeto Big Data em Saúde, desenvolvido pelo Laboratório de Informação em Saúde (LIS), do Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz), tem a segurança da informação como questão de importância central. É por isso também que Marcel Pedroso, coordenador do projeto ao lado de Christovam Barcellos, defende a regulação dos usos do big data

No projeto da Fiocruz, a estratégia é criar uma Plataforma de Big Data em Saúde, que irá acessar os bancos de dados publicos como o do SUS e do IBGE e os de parceiros envolvidos no projeto para criar vários tipos de soluções para a área de saúde. Atualmente, o Departamento de Informática do SUS (DataSUS), o Centro Nacional de Monitoramento e Alertas de Desastres Naturais (Cemaden), o Instituto Nacional de Pesquisas Espaciais (Inpe) e o Laboratório Nacional de Computação Científica (LNCC) são parceiros da Fiocruz no Projeto e oferecem o acesso a seus bancos de dados, assim como utitlizam os dados disponibilizados pelos outros órgãos.

Atualmente, já existem exemplos de análise de informações na área de saúde. É possível identificar em que regiões há riscos consideráveis de surtos epidêmicos através do registro de menções em redes sociais de palavras associadas ao problema, como “tosse”, “dores no corpo” etc. “O Google faz isso com o Google Flu Trends, que usa dados agregados para estimar o risco de eventos relacionados à gripe em tempo real no mundo inteiro”, informa Marcel Pedroso.

Entre os dados que serão analisados, há desde fontes atualizadas diariamente, como aquelas fornecidas pelo Inpe, até o censo demográfico realizado pelo IBGE, que é realizado a cada 10 anos. “Recolhidas de diferentes fontes entre os anos 2000 e 2013, as informações formam uma grande massa de dados que será atualizada permanentemente, de acordo com a periodicidade de divulgação adotada por cada fonte, e o nosso projeto vai aproveitá-las continuamente”, como explica Pedroso.

O objetivo do Big Data em Saúde é coletar, processar e analisar os grandes volumes de informações para planejar, monitorar e avaliar políticas públicas e serviços de saúde em tempo real. Segundo Pedroso, essa estratégia deverá gerar indicadores de alerta e painéis de monitoramento bastante específicos, como a concentração de particulados no ar, o que indica a possibilidade de surtos de doenças respiratórias.

Para se ter uma ideia do volume de dados de que o Big Data em Saúde trata, basta observar os números iniciais do projeto: as informações são relativas a aproximadamente 164 milhões de internações, 35 milhões de registros de nascimentos, 12 milhões de declarações de óbito, 20 bilhões de procedimentos ambulatoriais, dois bilhões de doses de vacina. E as fontes continuarão a produzí-los.

O projeto se torna complexo no que se refere à produção de informações para a saúde ao utilizar o DataSUS, sistema que produz dados públicos justamente para subsidiar políticas e ações no campo da saúde pública. O problema é que esses mesmos subsídios, uma vez tornados públicos, podem ser utilizados por empresas, eventualmente para gerar perfis de clientes indesejados e, assim, restringir o acesso deles ao serviço. “Temos de estabelecer algum tipo de compromisso ético com o uso que se fará com as predições que vamos construir”, diz Pedroso.

Regulação dos usos

A tese da necessidade de regulação, longe de ser exclusiva do LIS, já foi defendida até mesmo pela vetusta The Economist, principal guardiã dos valores ultraliberais na imprensa internacional, na sua edição de 25 de fevereiro de 2010. Com o explícito título “Novas regras para big data”, a revista inglesa publicou artigo em que afirmava: “Os reguladores terão de repensar suas abordagens. As regras de privacidade tendem a tratar informações pessoais no campo do direito de propriedade. Assim, é razoável imaginar que o rastro de dados que um indivíduo deixa para trás a partir de cliques em motores de busca ou para gravar preferências de compra pertencem a esse indivíduo e não à entidade que o recolheu”.

Vão na mesma linha de Pedroso e da Economist três pesquisadores do Centro Paula Souza, autarquia do governo de São Paulo que administra as escolas técnicas e as faculdades de tecnologia estaduais. No artigo “O crescimento do big data e as possíveis implicações éticas do seu uso na análise das redes sociais”, Rafael Fernandes Novo, José Manoel Souza das Neves e Marilia Macorin de Azevedo afirmam que “é necessário que o indivíduo tenha maior controle sobre quem pode acessar suas informações e qual o uso que as empresas estão fazendo destes dados, porém o tema ainda carece de regulamentações que estabeleçam padrões de identificação e de segurança dos dados pessoais”.

“Uma hipótese seria a marcação de dados, para que eles só tivessem usos legais e autorizados”, sugere Renato Rocha Souza, coordenador da pós-graduação da Escola de Matemática Aplicada, da Fundação Getúlio Vargas, no Rio de Janeiro. O especialista chama atenção para a responsabilidade individual dessas informações que produzimos a cada instante, seja em redes sociais ou quaisquer outros programas que acessamos.

“Quando abrimos uma conta no Gmail, por exemplo, aceitamos os termos e as condições de uso dessas informações. E eles são muito claros em dizer que as informações coletadas serão, sim, usadas para fins comerciais”, ressalta. “O problema é um cidadão médio viver sem assinar o Gmail, o Facebook ou usar a o Google”.

Para Souza, a Fiocruz tem um desafio mais específico por sua missão institucional e por operar em um campo de atuação quase único, de produção de informações voltadas para elaboração de políticas públicas. “Nessa condição, a Fiocruz só é comparável ao da Embrapa, a Empresa Brasileira de Pesquisa Agropecuária”, sugere Souza, da FGV, apontando desafios que precisam ser superados em paralelo a uma evolução fantástica das tecnologias de informação e comunicação.

Voltar ao topoVoltar