Jornalismo de Dados
O uso de dados aumenta a credibilidade e qualidade das notícias
A revolução da incorporação de dados no cotidiano jornalístico permite a produção de informações mais valiosas, confiáveis, completas e adaptadas à modelos visuais que facilitam a compreensão de evidências pelos leitores.



Navegue Bem | Caso não saiba o que são dados abertos, aproveite primeiro as seções que explicam o assunto (as noções básicas e a História no País). Além disso, listamos aqui o tronco essencial das principais plataformas, mas dedicamos seções especiais para detalhar ainda outras, voltadas para Fiscalização Cidadã, Finanças Públicas, Eleições, e também iniciativas colaborativas da sociedade civil.
O Brasil é o 9º país no ranking mundial de dados abertos, e movimentos como outros milhões são coletados por empresas, rastreados por think tanks e acadêmicos, e obtidos por repórteres por meio de solicitações da Lei de Liberdade de Informação (embora nem sempre sem batalha). . Você também pode monitorar respostas da lei de Acesso a Informação, iniciativas como o Volt Data Lab e relatórios emitidos por organizações privadas. A Controladoria Geral da União mantém em seu website um banco de respostas à pedidos, assim como a Transparência Brasil/Abraji.
Essa grande quantidade de informações pode ser uma fonte para alavancar a qualidade do trabalho jornalístico. Para obter informações consistentes e inteligíveis, é preciso aliar ferramentas tecnológicas ao faro jornalístico, que permite encontrar histórias escondidas por trás dos números. Por isso, os jornalistas precisam se capacitar para aprender a identificar dados importantes, relacionar diferentes fontes e extrair conclusões significativas da investigação.
Embora a prática não seja nova, o volume de dados é algo sem precedentes na história - nos tempos atuais, chegam de várias frentes e em grandes quantidades. O volume enorme de informação disponível cria um problema: dar um sentido a todo esse material. Além do catálogo federal, o portal de dados de Recife, o primeiro de uma capital no país, contém mais de 240 bases e o do governo estadual, outras xx.
No momento em que a crença nas notícias e em um conjunto compartilhado de fatos está em dúvida todos os dias, o jornalismo de dados pode iluminar o caminho para nós, trazendo fatos e evidências à luz de uma maneira acessível. ajuda a diminuir a polarização, porque sai do espectro da opinião, de um lado contra o outro, e mostra os dados e o contexto para que o debate seja feito
O jornalismo de dados já tem uma trajetória longa nos meios de comunicação. A diferença é que, agora, ele tem se fortalecido como nunca e é uma forte tendência para o futuro.
□ História e Panorama
“Revelar ao mundo algo que lhe interessa profundamente e que até então ignorava, mostrar-lhe que foi enganado em algum ponto vital a seus interesses temporais ou espirituais, é o maior serviço que um ser humano pode prestar a seus semelhantes." (John Stuart Mill)
Como podíamos esperar, a prática do uso de dados para incrementar a reportagem é tão antiga quanto a própria existência dos dados. Como Simon Rogers aponta, o primeiro exemplo de jornalismo de dados no The Guardian remonta a 1821. Foi uma lista, obtida de fonte não oficial, que relacionava as escolas da cidade de Manchester ao número de alunos e aos custos de cada uma. De acordo com Rogers, a lista ajudou a mostrar o verdadeiro número de alunos que recebiam educação gratuita, muito maior do que os números oficiais revelavam.
Outro exemplo seminal na Europa é Florence Nightingale e seu relato fundamental, “Mortalidade no Exército Britânico”, publicado em 1858. No seu relato ao Parlamento inglês, ela usou gráficos multicoloridos para defender o aperfeiçoamento do serviço de saúde do exército britânico. O mais famoso é o seu gráfico crista de galo, uma espiral de seções em que cada uma representa as mortes a cada mês, que destacava que a imensa maioria das mortes foi consequência de doenças preveníveis em vez de tiros.
De fato, os repórteres usaram dados para manter o poder responsável por séculos, como atesta uma investigação conduzida por dados que descobriu gastos excessivos de políticos, incluindo o então congressista Abraham Lincoln.
Jornalismo de dados (ou jornalismo guiado por dados) como o conhecemos atualmente é um termo que surgiu na metade da década de 2000 e que se refere às práticas jornalísticas que utilizam dados como base para gerarem notícias - foi utilizado pela primeira vez pelo desenvolvedor de software Adrian Holovaty, em 2006, no texto “A fundamental way newspaper sites need to change”, em que expressa a importância de usar técnicas de gerenciamento de dados na redação dos jornais, advogando a necessidade de o jornalista se capacitar para explorar o Big Data. No cenário hiper-tecnológico de hoje, o caminho predito por Holovaty tornou-se indispensável.
Apesar de o termo ter sido cunhado recentemente, pode ser considerado um desenvolvimento de outros dois conceitos: jornalismo de precisão (JP) e reportagem assistida por computador (RAC) - propostos entre o final da década de 1960 e início de 1970, e que foram surgiram no contexto dos avanços tecnológicos (o projeto de 2011, Reading the Motins do Guardian, chegou a aplicar as técnicas de relatórios assistidas por computador de Phil Meyer na década de 1960 a um surto de violência em toda a Inglaterra, um ano antes da publicação da primeira edição do Manual de Jornalismo de Dados, que sistematizou de maneira iniciadora essa nova maneira de trabalhar, contando histórias de maneiras inovadoras).
Apesar de todas as dificuldades, em 10 anos, o jornalismo de dados passou de um exercício de reportagem de nicho para se tornar uma parte essencial das redações em todo o mundo. Para descobrir como o jornalismo de dados avançou na última década, confira uma entrevista com Simon Rogers, fundador do Guardian Datablog que publicou seu primeiro conjunto de dados em 2009 - ano que marcou também o início da revolução dos dados abertos com o lançamento do primeiro portal de dados abertos governamental do mundo: o Data.gov do governo dos EUA foi lançado em maio daquele ano com 47 conjuntos de dados.
□ Diferenciais
-
Não são influenciáveis a interesses particulares (maior credibilidade);
-
Aumentam a qualidade das produções;
-
Evidências com base em dados e não em opiniões;
-
Transparência de produção (verificação);
-
Humanização por meio de um relato jornalístico de informações contidas em bases de dados cruas;
-
A visualização de dados ajuda a contar a história;
-
Potencializa o jornalismo investigativo.
▫ Crowdsourcing
A abertura para colaboração (crowdsourcing se tornou uma ferramenta de redação estabelecida) é uma delas e rendeu apurações importantíssimas - como detalhes de gastos de parlamentares, um relatório contabilizando número de crianças e adolescentes que morrem devido à facas (escala de crimes), e até mesmo um mapeamento de atentados terroristas em Gaza. Essa maneira colaborativa de trabalhar está no centro do que a equipe de dados faz. Em vez de focar em números ou estatísticas, usa-se dados para encontrar os assuntos sobre os quais devem se reportar, onde fazer isso, com quem conversar e que perguntas fazer (assim prega o The Guardian). Algumas das melhores peças de jornalismo de dados podem não ter números.
> José Roberto de Toledo, jornalista da Revista Piauí, explica os primeiros passos para começar a trabalhar com jornalismo de dados.

Para desenvolver conteúdos a partir de dados, o jornalista precisa levar em consideração uma série de fatores: 1) fazer a análise de dados; 2) contar com ferramentas e profissionais de programação e matemáticos - para fazer a mineração dos dados; 3) desenvolver uma apresentação criativa e detalhada (assim eles podem ser bem visualizados e interpretados pelos leitores). Confira abaixo um modelo simples, ou uma mapa visual do processo de produção do Guardian Datablog aqui.
Mergulhar em plataformas que já disponibilizam bastante conteúdo (como os portais de dados abertos) e também participar do ecossistema de tecnologia do estado pode ajudar a conhecer mais ferramentas, como o Python. Atualmente também já existem poderosas ferramentas gratuitas de visualização e limpeza de dados, como Open Refine, Google Fusion Tables, Many Eyes (da IBM), Datawrapper, Tableau Public, entre outras (veja uma apresentação sobre opções aqui). Nos EUA há redações como o Texas Tribune e a ProPublica, que começaram a criar operações em torno desses dados. O conhecimento da pesquisa, limpeza e visualização de dados também é transformador para a profissão de coleta de informações.
| Raspagem de Dados
-
Você também pode começar a explorar web scraping sem um profundo conhecimento de programação. Web scraping permite recolher informações a partir de sites com uma determinada quantidade de automação (em outras palavras, não ter que copiar / colar cada pequena coisa que você está procurando). ProPublica montou um Manual de Scraper que traz excelentes recursos para iniciantes que querem começar a raspar site e bancos de dados para obter informações para as suas histórias. Um web aplicativo livre para Chrome chamado Table Capture permite que você copie rapidamente tabelas de sites e cole-as em outra planilha. O Centro Knight também reuniu uma lista de ferramentas de raspagem de dados para “libertar” planilhas presas em arquivos PDF;
-
Ao trabalhar com várias planilhas, você já deve ter se deparado com um dos aspectos mais demorados do jornalismo de dados – limpar bases de dados bagunçadas. Google Refine é outro programa gratuito que unifica nomenclaturas de planilhas diferentes. ProPublica também mostra como usar o Refine para limpar seus bancos de dados;
-
9 de Julho > projeto em raspagem e formatação de dados da AssembleiaSP. Projeto open-source de agregação de info pública dos parlamentares e servidores da casa.
| Cursos Virtuais
-
Escola de Dados

-
DataJournalism
O DataJournalism.com foi criado pelo Centro Europeu de Jornalismo e é apoiado pelo Google News Initiative. Após 10 anos de experiência na execução de programas de jornalismo de dados. Fornecem aos jornalistas de dados recursos gratuitos, materiais, cursos em vídeo on-line e fóruns da comunidade.
-
New York Times
□ Referências Globais

La Nación Data é a unidade de jornalismo de dados da LA NACION na Argentina. Desde 2011, quando foi lançado como uma iniciativa de jornalismo de dados abertos, sua estratégia era a mesma: fazer jornalismo de dados E abrir dados: promover o uso e o acesso a informações no país como evidência para manter os governos responsáveis, aumentar a transparência e permitir a colaboração dos cidadãos no processo de jornalismo (o que fez em diversas ocasiões).
Sua história começou em 2010, quando o repórter político Diego Cabot recebeu um vazamento com enorme potencial: um CD com 26.000 e-mails do ministro dos Transportes da então presidente, Cristina Kirchner. Durante duas semanas, quatro jornalistas do jornal examinaram milhares de documentos à mão. Mas o então gerente de TI do jornal, Ricardo Brom, construiu um mecanismo de busca que permitiu vasculhar os documentos de maneira automatizada, e então eles conseguiram sua primeira informação em 40 minutos. A experiência foi o estopim para transformar o caminho deste que veio a se tornar a maior referência em jornalismo de dados da América Latina: a experiência mostrou à direção que aproximar a área de tecnologia da editorial poderia render bons frutos (confira mais detalhes aqui).
Enquanto veículos de mídia enxugam custos e demitem jornalistas, o La Nación viu no investimento em uma unidade de jornalismo de dados um caminho de sucesso para produzir conteúdo diferenciado e de qualidade para suas várias plataformas, que em 2020 completa 150 anos de atuação, anunciou ter superado a marca dos 200 mil assinantes digitais. Para se manter na vanguarda do jornalismo de dados, treinamentos, hackatons, conversas com especialistas e participações em eventos internacionais de dados abertos fazem parte da rotina da equipe, que coleciona prêmios nacionais e internacionais, incluindo o prestigioso Data Journalism Award, o Oscar da área - no qual, desde a primeira edição da premiação, em 2012, o jornal marcou presença como finalista todos os anos e saiu vitorioso quatro vezes consecutivas - de 2013 a 2016.
□ O potencial do Jornalismo Investigativo
Embora não deixe de ter as vulnerabilidades do jornalismo tradicional, para os defensores do jornalismo de código aberto, a transparência narrativa é crucial para a credibilidade da prática, além de ter se provado útil quando seus praticantes são atacados pelos governos que investigam.
Acompanhe nas Redes Sociais



Fontes Consultadas


