Jornalismo de Dados

O uso de dados aumenta a credibilidade e qualidade das notícias

A revolução da incorporação de dados no cotidiano jornalístico permite a produção de informações mais valiosas, confiáveis, completas e adaptadas à modelos visuais que facilitam a compreensão de evidências pelos leitores.

Navegue Bem | Caso não saiba o que são dados abertos, aproveite primeiro as seções que explicam o assunto (as noções básicas e a História no País). Além disso, listamos aqui o tronco essencial das principais plataformas, mas dedicamos seções especiais para detalhar ainda outras, voltadas para Fiscalização Cidadã, Finanças Públicas, Eleições, e também iniciativas colaborativas da sociedade civil

O Brasil é o 9º país no ranking mundial de dados abertos, e movimentos como outros milhões são coletados por empresas, rastreados por think tanks e acadêmicos, e obtidos por repórteres por meio de solicitações da Lei de Liberdade de Informação (embora nem sempre sem batalha). . Você também pode monitorar respostas da lei de Acesso a Informação, iniciativas como o Volt Data Lab e relatórios emitidos por organizações privadas. A Controladoria Geral da União mantém em seu website um banco de respostas à pedidos, assim como a Transparência Brasil/Abraji.

 

Essa grande quantidade de informações pode ser uma fonte para alavancar a qualidade do trabalho jornalístico. Para obter informações consistentes e inteligíveis, é preciso aliar ferramentas tecnológicas ao faro jornalístico, que permite encontrar histórias escondidas por trás dos números. Por isso, os jornalistas precisam se capacitar para aprender a identificar dados importantes, relacionar diferentes fontes e extrair conclusões significativas da investigação.

Embora a prática não seja nova, o volume de dados é algo sem precedentes na história - nos tempos atuais, chegam de várias frentes e em grandes quantidades. O volume enorme de informação disponível cria um problema: dar um sentido a todo esse material. Além do catálogo federal, o portal de dados de Recife, o primeiro de uma capital no país, contém mais de 240 bases e o do governo estadual, outras xx.

 No momento em que a crença nas notícias e em um conjunto compartilhado de fatos está em dúvida todos os dias, o jornalismo de dados pode iluminar o caminho para nós, trazendo fatos e evidências à luz de uma maneira acessível. ajuda a diminuir a polarização, porque sai do espectro da opinião, de um lado contra o outro, e mostra os dados e o contexto para que o debate seja feito 

O jornalismo de dados já tem uma trajetória longa nos meios de comunicação. A diferença é que, agora, ele tem se fortalecido como nunca e é uma forte tendência para o futuro.

□ História e Panorama

Revelar ao mundo algo que lhe interessa profundamente e que até então ignorava, mostrar-lhe que foi enganado em algum ponto vital a seus interesses temporais ou espirituais, é o maior serviço que um ser humano pode prestar a seus semelhantes." (John Stuart Mill)

Como podíamos esperar, a prática do uso de dados para incrementar a reportagem é tão antiga quanto a própria existência dos dados. Como Simon Rogers aponta, o primeiro exemplo de jornalismo de dados no The Guardian remonta a 1821. Foi uma lista, obtida de fonte não oficial, que relacionava as escolas da cidade de Manchester ao número de alunos e aos custos de cada uma. De acordo com Rogers, a lista ajudou a mostrar o verdadeiro número de alunos que recebiam educação gratuita, muito maior do que os números oficiais revelavam.

Outro exemplo seminal na Europa é Florence Nightingale e seu relato fundamental, “Mortalidade no Exército Britânico”, publicado em 1858. No seu relato ao Parlamento inglês, ela usou gráficos multicoloridos para defender o aperfeiçoamento do serviço de saúde do exército britânico. O mais famoso é o seu gráfico crista de galo, uma espiral de seções em que cada uma representa as mortes a cada mês, que destacava que a imensa maioria das mortes foi consequência de doenças preveníveis em vez de tiros.

De fato, os repórteres usaram dados para manter o poder responsável por séculos, como atesta uma investigação conduzida por dados que descobriu gastos excessivos de políticos, incluindo o então congressista Abraham Lincoln.

Jornalismo de dados (ou jornalismo guiado por dados) como o conhecemos atualmente é um termo que surgiu na metade da década de 2000 e que se refere às práticas jornalísticas que utilizam dados como base para gerarem notícias - foi utilizado pela primeira vez pelo desenvolvedor de software Adrian Holovaty, em 2006, no texto “A fundamental way newspaper sites need to change”, em que  expressa a importância de usar técnicas de gerenciamento de dados na redação dos jornais, advogando a necessidade de o jornalista se capacitar para explorar o Big Data. No cenário hiper-tecnológico de hoje, o caminho predito por Holovaty tornou-se indispensável.

 

Apesar de o termo ter sido cunhado recentemente, pode ser considerado um desenvolvimento de outros dois conceitos: jornalismo de precisão (JP) e reportagem assistida por computador (RAC) - propostos entre o final da década de 1960 e início de 1970, e que foram surgiram no contexto dos avanços tecnológicos (o projeto de 2011, Reading the Motins do Guardian, chegou a aplicar as técnicas de relatórios assistidas por computador de Phil Meyer na década de 1960 a um surto de violência em toda a Inglaterra, um ano antes da publicação da primeira edição do Manual de Jornalismo de Dados, que sistematizou de maneira iniciadora essa nova maneira de trabalhar, contando histórias de maneiras inovadoras).

Apesar de todas as dificuldades, em 10 anos, o jornalismo de dados passou de um exercício de reportagem de nicho para se tornar uma parte essencial das redações em todo o mundo. Para descobrir como o jornalismo de dados avançou na última década, confira uma entrevista com Simon Rogers, fundador do Guardian Datablog que publicou seu primeiro conjunto de dados em 2009 - ano que marcou também o início da revolução dos dados abertos com o lançamento do primeiro portal de dados abertos governamental do mundo: o Data.gov do governo dos EUA foi lançado em maio daquele ano com 47 conjuntos de dados. 

Debate Configurações |  Com o objetivo de gerar notícias, como o processo de bases de dados está sendo implantado no Brasil? A incorporação dessas técnicas no cotidiano das redações, com a função de facilitar o trabalho diário da reportagem, é eficiente?

□ Diferenciais
  • Não são influenciáveis a interesses particulares (maior credibilidade);

  • Aumentam a qualidade das produções;

  • Evidências com base em dados e não em opiniões;

  • Transparência de produção (verificação);

  • Humanização por meio de um relato jornalístico de informações contidas em bases de dados cruas;

  • A visualização de dados ajuda a contar a história;

  • Potencializa o jornalismo investigativo.

Tendo em conta que a informação de qualidade é a principal matéria prima da investigação jornalística, é fundamental que ela venha de fontes confiáveis e que não sejam influenciadas por interesses comerciais ou ideológicos. E quem pode ser melhor que os números para garantir uma origem isenta para os fatos? Ou seja, o jornalismo de dados é aquele em que são utilizadas estatísticas e outras informações que dão base para a formulação de reportagens. Além disso, ele proporciona um conteúdo mais rico e instigante para o leitor.

Hoje, as notícias estão fluindo à medida que acontecem, de várias fontes, testemunhas oculares, blogs e o que aconteceu é filtrado por uma vasta rede de conexões sociais, sendo classificado, comentado e mais frequentemente: ignorado. É por isso que o jornalismo de dados é tão importante. Reunir, filtrar e visualizar o que está acontecendo além do que os olhos podem ver tem um valor crescente. Confiança nas informações é o que todos nós procuramos. Podem ajudar em questões coditianas - seja comprando um carro, uma casa, decidindo sobre uma trajetória educacional ou profissional na vida ou fazendo uma verificação rigorosa dos custos para evitar dívidas e também analisar a dinâmica de uma situação complexa, como tumultos ou debates políticos, mostrar as falácias e ajudar todos a ver possíveis soluções.

Segundo a experiente jornalista Sandra Crucianelli, há três marcas básicas do jornalismo de dados: "a primeira é que oferece ao público documentos de respaldo sobre os quais a reportagem se baseou, muitas vezes compartilhados a partir de uma plataforma externa; a segunda é que o repórter explica seus métodos para que seu trabalho resista a revisão crítica -- o que significa que se um leitor ou outro jornalista fosse utilizar os mesmos documentos da mesma forma, chegaria à mesma conclusão. E, finalmente, inclui uma visualização adequada de dados, acompanhada por textos não muito extensos".

▫ Crowdsourcing

A abertura para colaboração (crowdsourcing se tornou uma ferramenta de redação estabelecida) é uma delas e rendeu apurações importantíssimas - como detalhes de gastos de parlamentares, um relatório contabilizando número de crianças e adolescentes que morrem devido à facas (escala de crimes), e até mesmo um mapeamento de atentados terroristas em Gaza. Essa maneira colaborativa de trabalhar está no centro do que a equipe de dados faz. Em vez de focar em números ou estatísticas, usa-se dados para encontrar os assuntos sobre os quais devem se reportar, onde fazer isso, com quem conversar e que perguntas fazer (assim prega o The Guardian). Algumas das melhores peças de jornalismo de dados podem não ter números.

| A Visualização de Dados

A premissa principal do jornalismo de dados é apresentar com facilidade e limpeza as informações numéricas relacionadas ao tema do conteúdo, permitindo que a avaliação do leitor seja embasada em estatísticas e não em suposições ou versões pessoais, que muitas vezes são distorcidas pelas fontes convencionais das entrevistas. Exemplos de grandes veículos que apostam em conteúdo especial focado na visualização incluem a BBC, Guardian, Reuters, Washington Post, Wall Street Journal. O Guardian mantém ainda um grupo no Flickr, com imagens dos infográficos produzidos.

O jornalismo de dados pode ajudar um jornalista a contar uma história complexa através de infográficos envolventes. As espetaculares palestras de Hans Rosling sobre a visualização da pobreza mundial com Gapminder, por exemplo, atraíram milhões de pontos de vista em todo o mundo. E o trabalho popular de David McCandless para destilar grandes números - como contextualizar os gastos públicos ou a poluição gerada e evitada pelo vulcão islandês - mostra a importância do design claro em Information is Beautiful.

À medida que os dados se tornam mais centrais em nossas vidas pessoais e profissionais, a prática de visualização de dados se torna cada vez mais importante. A Data Visualization Society visa coletar e estabelecer as melhores práticas, promovendo uma comunidade que apóia os membros e profissionais à medida que crescem e desenvolvem habilidades de visualização de dados. 

□ Caminhos de um Jornalista de Dados: Primeiros Passos 

Os dados podem ser a fonte do jornalismo de dados ou a ferramenta com a qual a história é contada - ou podem ser os dois. O que diferencia o jornalismo de dados do restante? Talvez sejam as novas possibilidades que se abrem diante da combinação do tradicional 'faro para notícias' e a capacidade de contar uma história convincente, com a enorme escala e variedade de informações digitais agora disponíveis - e essas possibilidades podem surgir em qualquer estágio do processo do jornalista.

Por isso, o mais importante é ainda pensar na história. É sobre contar a história da melhor maneira possível. Às vezes, isso será uma visualização ou um mapa, outras, só divulgar algum número - é a flexibilidade de procurar novas formas de contar histórias. "Você pode se tornar um codificador de excelência, se quiser. Mas a tarefa maior é pensar nos dados como jornalista, e não como analista. O que é interessante sobre esses números? O que há de novo? O que aconteceria se eu misturasse com outra coisa? Responder a essas perguntas é mais importante do que qualquer outra coisa" - esclarece o vanguardista Simon Rogers.

Com o jornalismo de dados, a lógica se inverte. Em vez de se propor um tema de investigação e depois partir para a busca ativa das informações, os editores e repórteres mergulham nos acervos de dados coletados e identificam lacunas ou pontos de conexão que valem ser explorados com mais profundidade. Portanto, é a análise de dados que dá início ao processo de produção de notícias, ganhando um papel muito mais significativo.

Neste momento você pode estar se perguntando: mas como os jornalistas estão trabalhando tão bem com os números, mesmo sendo de humanas? Apesar de ser necessária uma capacidade analítica razoável para produzir notícias orientadas a dados, a resposta do sucesso está na série de ferramentas e recursos digitais que as empresas de comunicação têm sabido aproveitar para guiar suas iniciativas.

Ele representa a convergência de áreas diferentes que são independentes entre si – desde pesquisa investigativa e estatística, até design e programação. A ideia de combinar essas habilidades para contar histórias importantes é muito poderosa – mas também, muito intimidadora. Quem consegue fazer tudo isso?

Fonte: http://tutano.trampos.co/16858-como-ser-um-jornalista-de-dados/

> José Roberto de Toledo, jornalista da Revista Piauí, explica os primeiros passos para começar a trabalhar com jornalismo de dados.

Para desenvolver conteúdos a partir de dados, o jornalista precisa levar em consideração uma série de fatores: 1) fazer a análise de dados; 2) contar com ferramentas e profissionais de programação e matemáticos - para fazer a mineração dos dados; 3) desenvolver uma apresentação criativa e detalhada (assim eles podem ser bem visualizados e interpretados pelos leitores). Confira abaixo um modelo simples, ou uma mapa visual do processo de produção do Guardian Datablog aqui.

 

Mergulhar em plataformas que já disponibilizam bastante conteúdo (como os portais de dados abertos) e também participar do ecossistema de tecnologia do estado pode ajudar a conhecer mais ferramentas, como o Python. Atualmente também já existem poderosas ferramentas gratuitas de visualização e limpeza de dados, como Open Refine, Google Fusion Tables, Many Eyes (da IBM), Datawrapper, Tableau Public, entre outras (veja uma apresentação sobre opções aqui). Nos EUA há redações como o Texas Tribune e a ProPublica, que começaram a criar operações em torno desses dados. O conhecimento da pesquisa, limpeza e visualização de dados também é transformador para a profissão de coleta de informações.

  • O que muitos especialistas em jornalismo de dados ressaltam é que, antes de qualquer coisa, devemos lembrar que a finalidade é contar uma história. Levin destaca que construir algo primeiro é realmente uma ferramenta de aprendizagem mais valiosa – e mais divertida – que programar por programar. Comece com um projeto específico em mente e siga a partir dele.

  • Comece pelo Básico: Embora os resultados sejam excitantes, o processo de programar não é. Felizmente, uma das ferramentas mais básicas do jornalismo de dados é a humilde planilha.  Especialistas entrevistados para o Manual de Jornalismo de dados regularmente citaram o Excel e o Google Spreadsheets como algumas das ferramentas mais utilizadas em suas atividades diárias.  Há muitas direções que pode seguir com seu projeto de dados sem a necessidade de escrever qualquer código. Google Fusion Tables permite mesclar duas planilhas ou arquivos CSV para visualizar dados em tabelas, gráficos e até mesmo mapas interativos. Embora ainda esteja em beta, o Google Fusion Tables é muito usado por grandes nomes como o Guardian Data Blog para suas visualizações.

| Raspagem de Dados

“Raspagem de dados é como se chama o método para extrair os dados escondidos em documentos como páginas da web e PDFs e torná-los usáveis, possíveis de serem processados. A raspagem de dados é uma das habilidades mais úteis se você vai investigar dados, e na maioria da vezes não é algo muito difícil” Escola de Dados

 Trabalhar com dados é como entrar em um território vasto e desconhecido. À primeira vista, os dados brutos são intrigantes para os olhos e a mente. Os dados são difíceis de manejar. É muito difícil moldá-lo corretamente para visualização. Ele precisa de jornalistas experientes, que tenham a resistência necessária para analisar dados brutos muitas vezes confusos e entediantes e "ver" as histórias ocultas.

 

A inteligência artificial, ou aprendizado de máquina, tornou-se uma ferramenta para o jornalismo de dados, como evidenciado pelo trabalho de Peter Aldhous no Buzzfeed . Enquanto isso, o acesso a novas tecnologias, como Virtual e Realidade Aumentada, pode permitir que os designers mostrem dados em notícias e de maneiras mais interessantes, tornando uma história real e visceral ao público.

A maneira como organizações de mídia como Guardian e New York Times lidaram com as grandes quantidades de dados divulgadas pelo Wikileaks é uma das principais etapas que destacaram o termo. Naquela época, o termo começou a ter um uso mais amplo, juntamente com 'reportagem assistida por computador', para descrever como os jornalistas estavam usando os dados para melhorar sua cobertura e para aprofundar investigações sobre um determinado tópico. Utilizar programação para automatizar o processo de coleta e combinação de informações do governo local, polícia e outras fontes cívicas, como Adrian Holovaty fez com ChicagoCrime e EveryBlock. Ou usando o software para encontrar conexões entre centenas de milhares de documentos, como o The Telegraph fez com as despesas dos deputados.

  • Você também pode começar a explorar web scraping sem um profundo conhecimento de programação. Web scraping permite recolher informações a partir de sites com uma determinada quantidade de automação (em outras palavras, não ter que copiar / colar cada pequena coisa que você está procurando). ProPublica montou um Manual de Scraper que traz excelentes recursos para iniciantes que querem começar a raspar site e bancos de dados para obter informações para as suas histórias. Um web aplicativo livre para Chrome chamado Table Capture permite que você copie rapidamente tabelas de sites e cole-as em outra planilha. O Centro Knight também reuniu uma lista de ferramentas de raspagem de dados para “libertar” planilhas presas em arquivos PDF;

  • Ao trabalhar com várias planilhas, você já deve ter se deparado com um dos aspectos mais demorados do jornalismo de dados – limpar bases de dados bagunçadas. Google Refine é outro programa gratuito que unifica nomenclaturas de planilhas diferentes. ProPublica também mostra como usar o Refine para limpar seus bancos de dados;

  • 9 de Julho > projeto em raspagem e formatação de dados da AssembleiaSP. Projeto open-source de agregação de info pública dos parlamentares e servidores da casa.

□ Guias Importantes

Não há ainda treinamento formal em jornalismo de dados nas universidades, com algumas exceções. Portanto, os futuros jornalistas de dados precisam investir, principalmente em tempo, para obterem sua própria formação nessa disciplina. O jornalismo de dados requer treinamento permanente e conhecimento de assuntos que estão geralmente longe das preferências do jornalista convencional. As fontes aceitas não são suficientes: é preciso conhecer o funcionamento da administração pública, saber interpretar leis, decretos e ordenanças. Se um jornalista não entende como as instituições do seu país funcionam, dificilmente pode seguir o caminho com sucesso. Fluência em inglês é um fator importante, já que as ferramentas mais utilizadas estão nesse idioma.

| Cursos Virtuais 

  • Escola de Dados

Em seu maior e mais completo curso online aberto e massivo (MOOC, na sigla em inglês), o Centro Knight de Jornalismo nas Américas se uniu à especialistas para ensinar aos alunos como produzir histórias atraentes usando dados e visualização. O objetivo do curso é cobrir o passo a passo de produção de uma reportagem de jornalismo de dados, reunindo, organizando e limpando os dados, transformando-os e depois explorando-os, tentando encontrar possíveis histórias potenciais. 

Para os jornalistas brasileiros, o curso foi desenvolvido em parceria com a Escola de Dados - uma rede global que ajuda organizações sociais, jornalistas, agentes públicos e cidadãos a tirar o máximo proveito dos dados para resolver problemas reais em prol de sociedades mais conscientes, sustentáveis e justas, e é uma iniciativa da Open Knowledge. Esta página de recursos apresenta o conteúdo na íntegra do MOOC “Introdução ao jornalismo de dados: Como entrevistar dados para reportagens investigativas”, realizado pelo Centro Knight para o Jornalismo nas Américas. A formação em português de cinco semanas aconteceu 5 de agosto - 8 de setembro de 2019. Agora,  o conteúdo está disponível gratuitamente para qualquer pessoa interessada em aprender sobre os conceitos básicos de Jornalismo de Dados.

 

Ministrado por quatro reconhecidos profissionais: Natália MazotteAdriano BelisárioÁlvaro Justen e Rodrigo Menegat. O material do curso inclui aulas em vídeo e tutoriais, leituras, exercícios e muito mais.

  • DataJournalism

O DataJournalism.com foi criado pelo Centro Europeu de Jornalismo e é apoiado pelo Google News InitiativeApós 10 anos de experiência na execução de programas de jornalismo de dados. Fornecem aos jornalistas de dados recursos gratuitos, materiais, cursos em vídeo on-line e fóruns da comunidade.

  • New York Times

Numa forma produtiva de capacitar seus jornalistas para a produção de matérias e conteúdos sempre refinados, o New York Times já há algum tempo mantém ativo um curso de codificação para sua equipe de jornalismo. Mesmo em redações menores, dedicar tempo para ensinar habilidades de dados a alguém traz benefícios a longo prazo. Mas pode ser difícil e demorado criar materiais adequados, especialmente se o desenvolvimento de programas de treinamento não for seu único trabalho. Assim, o jornal resolveu tomar um passo extra em prol do coletivo profissional e disponibilizou todo o curso de forma gratuita na rede, permitindo que qualquer um aprenda o básico do meio e se vire minimamente na hora de ajudar a construir um mundo melhor. Entre outros temas, as aulas ensinam o básico de Google Docs e Sheets, questões éticas do jornalismo de dados e atalhos para a construção e análise de tabelas e planilhas.

□ Referências Globais

 não apenas no The Guardian, mas nas redações de todo o mundo. The New York Times, Los Angeles Times, La Información (Espanha), La Nación na Argentina ... em todos os lugares, os jornalistas estão descobrindo uma nova maneira de trabalhar, contando histórias de dados de maneiras inovadoras.Isso não deve ser visto como um desenvolvimento isolado no campo do jornalismo. Esses foram apenas os efeitos de grandes desenvolvimentos na transparência internacional, além da criação de portais de dados abertos. No Brasil, o jornalismo de dados começou a ganhar destaque em 2012. Nesse ano, surgiram dois blogs dentro de grandes meios de comunicação, o FolhaSPDados e o Estadão Dados (que continua ativo). 

campanhas como as realizadas pela Open Knowledge Foundation para aumentar a pressão sobre o governo do Reino Unido para abrir conjuntos de dados de notícias para uso público e fornecer APIs para qualquer pessoa explorar. Eles também incluíram maior acesso a poderosas ferramentas gratuitas de visualização e limpeza de dados. Essas ferramentas gratuitas combinadas com o acesso a muitos dados públicos gratuitos facilitaram a produção de mais e mais visualizações e análises de dados voltadas para o público que eram populares. As redações, como o Texas Tribune e o ProPublica , começaram a criar operações em torno desses dados (confira uma série de outros bons exemplos aqui).

Hoje, os comunicadores que realizam o jornalismo de dados contam com um "lar virtual" especial, o DataJournalism.com, para ajudar aqueles que estão começando e todos, desde o único praticante até o membro de uma grande equipe, poderão encontrar algum apoio. O histórico das premiações do Data Journalism Award mostra uma variedade de como pode ser bem feito.

 o jornalismo de dados dedica tanta — às vezes, até mais — atenção aos dados propriamente ditos em vez de apenas empregá-los como forma de descobrir ou melhorar uma reportagem. Por isso, vemos o Datablog do The Guardian e o jornal Texas Tribune publicando conjunto de dados lado a lado com as notícias – ou até mesmo apenas os dados sozinhos — para as pessoas analisarem ou explorá-los.

| O exemplo do The Guardian

O Guardian, jornal nacional britânico, fundado há quase 200 anos, foi pioneiro ao criar um departamento de Desenvolvimento Digital com um punhado de pequenas equipes, implantando dezenas de vezes por dia e desenvolvendo abertamente, no GitHub - além disso, possui jornalistas de dados em todo o mundo. O termo jornalismo de dados se tornou popular desde a última década com a chegada do seu Datablog. Lançado em março de 2009, começando em um canto do site do Guardian dedicado à publicação e análise de dados. Inicialmente com 200 conjuntos de dados distintos: taxas de criminalidade, indicadores econômicos, detalhes da zona de guerra e até semana da moda e vilões do Doctor Who.

 

Desde então, aplicaram a abordagem com dados a tudo. Na última década, publicaram milhares de histórias e conjuntos de dados sobre todos os tópicos impactantes: o escândalo das despesas dos deputados do Parlamento e também o do Panamá Papers (para o qual tiveram que montar a própria base de dados), projetos em código aberto de fiscalização de despesas públicas, os tumultos na Inglaterra em 2011 (Reading the Motins - surto de violência que marcou o país), eleições, crimes com faca, preços de casas, os vazamentos de informações sobre a Guerra do Afeganistão e a Guerra do Iraque, mapear a alta administração pública, a até mesmo como o Reino Unido se saiu em todos os concursos de músicas do Eurovision. O protagonismo teria começado com uma ideia simples: publicar dados em um formato que seria mais fácil para outras pessoas usarem.

Em especial, ''o fator decisivo para o jornalismo de dados aconteceu na primavera de 2010, começando com uma planilha: 92.201 linhas de dados, cada uma contendo uma análise detalhada de um evento militar no Afeganistão. Este foi o registro de guerra do WikiLeaks. Parte um, isso é. Havia mais dois episódios a seguir: Iraque e os telegramas''. 

Usa dados abertos de uma maneira bastante interessante. Desde 2009, o jornal publica seus dados brutos para que os parceiros reutilizem por meio de uma API. Os parceiros têm acesso a todo o conteúdo que o The Guardian cria, o equivalente a mais de 1,5 milhão de artigos de notícias desde 1999. Isso permite até mesmo que os usuários criem aplicativos externos em troca da veiculação de publicidade do Guardian. 

Artigos do seu editor fundador pode esclarecer melhor as práticas e perspectivas adotadas nessa trajetória e também seus bastidores. A abertura para colaboração (crowdsourcing se tornou uma ferramenta de redação estabelecida) é uma delas e rendeu apurações importantíssimas - como detalhes de gastos de parlamentares e até mesmo um mapeamento de atentados terroristas em Gaza

Hoje, o Guardian tem cinco editores de dados e jornalistas trabalhando nos três escritórios do Guardian (nas cidades de Londres, Nova York e Sidney), com boa parcela da equipe composta por mulheres.

| O exemplo do The New York Times

thenewyorktimes_edited.jpg

Em 2018, a equipe de Transição Digital do Times decidiu analisar como poderíam ajudar a aumentar o conhecimento dos dados dos repórteres a fim de ajudar a cobrir esses problemas (leia mais sobre como o treinamento de dados foi desenvolvido e faça o download dos materiais de treinamento). O caminho adotado foi envolver toda a equipe de jornalistas e editores em um processo de treinamento de quase um mês, além de manter uma coordenação de apoio para produção de reportagens abordando as técnicas aprendidas, ao longo dos dois meses posteriores, assegurando o sucesso do processo de capacitação.

O jornal mantém uma página onde centraliza matérias com esta abordagem. Não deixe de conferir uma com depoimentos de 5 repórteres descrevendo as várias maneiras pelas quais se valeram de conjuntos de dados e planilhas para criar um trabalho inovador.

Em sua maioria, as reportagens guiadas por dados são focadas em política ou economia. Porém os cadernos de ciência também podem se beneficiar da abundância de dados coletados nas pesquisas científicas. Um bom exemplo vem do The New York Times, que criou um time de análise e visualização de dados dedicado a cobrir as mudanças climáticas. A equipe liderada por Hanna Fairfield, que possui formação em jornalismo e geoquímica, já criou matérias impressionantes, como a que simula as linhas de derretimento de gelo na Antártida ou ilustrando a expansão de dias muito quentes no globo.

▫ Repórter Milionário

O repórter Nate Silver ganhou visibilidade mundial ao fazer previsões sobre os resultados das eleições presidenciais norte-americanas de 2012 com uma precisão que surpreendeu até mesmo os especialistas em sondagens de opinião pública. Seu nome também ganhou notoriedade por ser a primeira grande contratação registrada na imprensa mundial envolvendo um profissional especializado em jornalismo de dados (Big Data Journalism): Nate trocou seu emprego no New York Times para aceitar uma remuneração milionária na rede de TV ESPN, no ano seguinte. O segredo é sua habilidade em trabalhar com grandes volumes de dados usando a matemática, estatística e os cálculos probabilísticos.

| O exemplo do La Nación

La Nación Data é a unidade de jornalismo de dados da LA NACION na Argentina. Desde 2011, quando foi lançado como uma iniciativa de jornalismo de dados abertos, sua estratégia era a mesma: fazer jornalismo de dados E abrir dados: promover o uso e o acesso a informações no país como evidência para manter os governos responsáveis, aumentar a transparência e permitir a colaboração dos cidadãos no processo de jornalismo (o que fez em diversas ocasiões).

Sua história começou em 2010, quando o repórter político Diego Cabot recebeu um vazamento com enorme potencial: um CD com 26.000 e-mails do ministro dos Transportes da então presidente,  Cristina Kirchner. Durante duas semanas, quatro jornalistas do jornal examinaram milhares de documentos à mão. Mas o então gerente de TI do jornal, Ricardo Brom, construiu um mecanismo de busca que permitiu vasculhar os documentos de maneira automatizada, e então eles conseguiram sua primeira informação em 40 minutos. A experiência foi o estopim para transformar o caminho deste que veio a se tornar a maior referência em jornalismo de dados da América Latina: a experiência mostrou à direção que aproximar a área de tecnologia da editorial poderia render bons frutos (confira mais detalhes aqui).

Enquanto veículos de mídia enxugam custos e demitem jornalistas, o La Nación viu no investimento em uma unidade de jornalismo de dados um caminho de sucesso para produzir conteúdo diferenciado e de qualidade para suas várias plataformas, que em 2020 completa 150 anos de atuação, anunciou ter superado a marca dos 200 mil assinantes digitais. Para se manter na vanguarda do jornalismo de dados, treinamentos, hackatons, conversas com especialistas e participações em eventos internacionais de dados abertos fazem parte da rotina da equipe, que coleciona prêmios nacionais e internacionais, incluindo o prestigioso Data Journalism Award, o Oscar da área - no qual, desde a primeira edição da premiação, em 2012, o jornal marcou presença como finalista todos os anos e saiu vitorioso quatro vezes consecutivas - de 2013 a 2016.

| Google News Lab

O News Lab é uma Iniciativa do Google Notícias, cuja missão é colaborar com jornalistas e empresários para impulsionar a inovação nas notícias. Oferecendo parcerias e treinamentos em mais de 50 países, oferece o melhor da tecnologia do Google para enfrentar importantes desafios no jornalismo atual  e fortalecer o jornalismo de qualidade.

□ O potencial do Jornalismo Investigativo

Documentos vazados e entrevistas com fontes de denúncia sempre farão parte do jornalismo investigativo. Mas, graças ao aumento da tecnologia digital e à fácil disponibilidade dos dados que os acompanham, os repórteres têm mais maneiras de obter histórias do que nunca. Com ênfase em fatos brutos, o jornalismo de código aberto tem um imediatismo que é efetivo no momento em que os leitores de todo o espectro ideológico se tornam céticos em relação à mídia.

"Qualquer profissional interessado em analisar e expor o funcionamento da máquina pública, e eventuais desvios e irregularidades, precisa hoje em dia dominar ao menos algumas técnicas do jornalismo de dados", destaca o ex-presidente da AbrajiDaniel Bramatti.

Desde a década de 60, jornalistas (principalmente os investigativos, nos Estados Unidos) têm analisado bases de dados públicas com métodos científicos para fiscalizar o poder de forma independente. Também chamado de “jornalismo de interesse público”, defensores dessas técnicas baseadas no auxílio do computador têm procurado revelar tendências, contrariar o senso comum e desnudar injustiças perpetradas por autoridades e corporações.

No início dos anos 70, o termo jornalismo de precisão foi cunhado para descrever esse tipo de apuração jornalística: “o emprego de métodos de pesquisa das ciências sociais e comportamentais na prática jornalística” (em The New Precision Journalism de Philip Meyer). O jornalismo de precisão foi proposto para ser praticado nas instituições jornalísticas convencionais por profissionais formados em jornalismo e em ciências sociais. Meyer defendia que eram necessários métodos científicos para coleta e análise de dados, em vez de técnicas literárias, para permitir que o jornalismo alcançasse sua busca pela objetividade e verdade.

O jornalismo de precisão pode ser entendido como reação a algumas das inadequações e fraquezas do jornalismo normalmente citadas: dependência dos releases de assessorias (mais tarde descrito como “churnalism” ou “jornalismo de batedeira”), predisposição em acatar as versões oficiais, e por aí vai. Estas são decorrentes, na visão de Meyer, da não aplicação de técnicas e métodos científicos como pesquisas de opinião e consulta a registros públicos. Foi uma forma de expandir o arsenal de ferramentas do repórter para tornar temas antes inacessíveis, ou parcialmente acessíveis, em objeto de exame minucioso e especialmente eficiente para dar voz à minoria e grupos dissidentes que estavam lutando para se verem representados.

▫ Na Era da Transparência

O blogueiro Eliot Higgins provocou ondas no início da década, cobrindo a guerra na Síria a partir de um laptop em seu apartamento em Leicester, Inglaterra, enquanto cuidava de sua filha. Em 2014, ele fundou a Bellingcat , uma agência de notícias de código aberto.

Os registros de guerra do Wikileaks no Afeganistão foram uma vitória fantástica para o jornalismo investigativo, não apenas no Guardian, mas também no New York Times e Der Spiegel - e são também jornalismo de dados em ação, conforme destaca o editor to Guardian em artigo especial. A fusão do jornalismo de código aberto com métodos mais tradicionais pode ser vislumbrada ainda nos trabalhos da BBC (um deles o projeto Africa Eye), Anistia Internacional, e agências de notícias como a Storyful.

Embora não deixe de ter as vulnerabilidades do jornalismo tradicional, para os defensores do jornalismo de código aberto, a transparência narrativa é crucial para a credibilidade da prática, além de ter se provado útil quando seus praticantes são atacados pelos governos que investigam.

| Redações Especializadas

Fundada em 1989, a Public Integrity é uma das mais antigas redações sem fins lucrativos e apartidária que investiga democracia, poder e privilégios. Seus premiados relatórios se concentram na influência do dinheiro e no impacto da desigualdade na sociedade dos EUA e contribuíram para mudar centenas de leis e políticas; forçar o governo federal e estadual a divulgar informações públicas críticas e responsabilizar as empresas por abusos de poder.

Fundada em 2011 por repórteres mulheres, a Pública é a primeira agência de jornalismo investigativo sem fins lucrativos do Brasil. Investigam a administração pública, incluindo todos os níveis de governo e as casas legislativas; os impactos sociais e ambientais de empresas, suas práticas de corrupção e de antitransparência; o Poder Judiciário, sua eficácia, transparência e equidade; e a violência contra populações vulneráveis na cidade e no campo. Possuem um programa de fomento ao jornalismo independente, através do qual realizam mentorias para jornalistas, concurso de microbolsas de reportagem, eventos de discussão sobre jornalismo e programas de apoio a projetos inovadores. Ao longo de trajetória conquistaram 48 prêmios.

Saiba Mais

Acompanhe nas Redes Sociais

Fontes Consultadas

Para esta seção, os seguintes textos foram consultados:

> Jornalismo de Dados:

DataJournalism.com "What Is Data Journalism?", por Paul Bradshaw;

Artigo "Data journalism at the Guardian: what is it and how do we do it?", 28.07.11 - The Guardian DataBlog;

Data Journalism Handbook "Why Journalists Should Use Data";

Entrevista "A decade of the Datablog: 'There's a human story behind every data point'", 23.03.19 - The Guardian DataBlog;

Artigo "Jornalismo de dados: o bom, o mau e o feio", 29.06.12, por Sandra Crucianelli - ICFJ International Center for Journalists;

Artigo "Jornalismo de Dados amplia oportunidades do Jornalismo Científico", 09.04.18 - ComCiência, Revista Eletrônica de Jornalismo Científico.

> Jornalismo Investigativo:

"These Reporters Rely on Public Data, Rather Than Secret Sources", 01.12.19 - NYT.

Créditos imagem Cláudio Weber Abramo: Aline Vergueiro/Abraji

 
 
 
 
 
 
 
 
 
 
 

Jornalismo de Dados

O uso de dados aumenta a credibilidade e qualidade das notícias

A revolução da incorporação de dados no cotidiano jornalístico permite a produção de informações mais valiosas, confiáveis, completas e adaptadas à modelos visuais que facilitam a compreensão de evidências pelos leitores.

Navegue Bem | Caso não saiba o que são dados abertos, aproveite primeiro as seções que explicam o assunto (as noções básicas e a História no País). Além disso, listamos aqui o tronco essencial das principais plataformas, mas dedicamos seções especiais para detalhar ainda outras, voltadas para Fiscalização Cidadã, Finanças Públicas, Eleições, e também iniciativas colaborativas da sociedade civil

O Brasil é o 9º país no ranking mundial de dados abertos, e movimentos como outros milhões são coletados por empresas, rastreados por think tanks e acadêmicos, e obtidos por repórteres por meio de solicitações da Lei de Liberdade de Informação (embora nem sempre sem batalha). . Você também pode monitorar respostas da lei de Acesso a Informação, iniciativas como o Volt Data Lab e relatórios emitidos por organizações privadas. A Controladoria Geral da União mantém em seu website um banco de respostas à pedidos, assim como a Transparência Brasil/Abraji.

 

Essa grande quantidade de informações pode ser uma fonte para alavancar a qualidade do trabalho jornalístico. Para obter informações consistentes e inteligíveis, é preciso aliar ferramentas tecnológicas ao faro jornalístico, que permite encontrar histórias escondidas por trás dos números. Por isso, os jornalistas precisam se capacitar para aprender a identificar dados importantes, relacionar diferentes fontes e extrair conclusões significativas da investigação.

Com a evolução do acesso aos dados públicos e da maior transparência do governo, os profissionais de imprensa vivem hoje uma mudança importante: saíram de um ambiente com certa escassez de dados públicos para, agora na internet, ter à disposição muito mais do que conseguiriam analisar sozinhos.

Embora a prática não seja nova, o volume de dados é algo sem precedentes na história - nos tempos atuais, chegam de várias frentes e em grandes quantidades. O volume enorme de informação disponível cria um problema: dar um sentido a todo esse material. Além do catálogo federal, o portal de dados de Recife, o primeiro de uma capital no país, contém mais de 240 bases e o do governo estadual, outras xx.

 No momento em que a crença nas notícias e em um conjunto compartilhado de fatos está em dúvida todos os dias, o jornalismo de dados pode iluminar o caminho para nós, trazendo fatos e evidências à luz de uma maneira acessível. ajuda a diminuir a polarização, porque sai do espectro da opinião, de um lado contra o outro, e mostra os dados e o contexto para que o debate seja feito 

O jornalismo de dados já tem uma trajetória longa nos meios de comunicação. A diferença é que, agora, ele tem se fortalecido como nunca e é uma forte tendência para o futuro. Em uma época de polarização e que a imprensa enfrenta desconfiança, esse método de produzir notícias ganha ainda mais importância. encontrar notícias exclusivas e manter viva a chama do jornalismo em seu papel de "guardião da sociedade"

□ História e Panorama

Revelar ao mundo algo que lhe interessa profundamente e que até então ignorava, mostrar-lhe que foi enganado em algum ponto vital a seus interesses temporais ou espirituais, é o maior serviço que um ser humano pode prestar a seus semelhantes." (John Stuart Mill)

Como podíamos esperar, a prática do uso de dados para incrementar a reportagem é tão antiga quanto a própria existência dos dados. Como Simon Rogers aponta, o primeiro exemplo de jornalismo de dados no The Guardian remonta a 1821. Foi uma lista, obtida de fonte não oficial, que relacionava as escolas da cidade de Manchester ao número de alunos e aos custos de cada uma. De acordo com Rogers, a lista ajudou a mostrar o verdadeiro número de alunos que recebiam educação gratuita, muito maior do que os números oficiais revelavam.

Outro exemplo seminal na Europa é Florence Nightingale e seu relato fundamental, “Mortalidade no Exército Britânico”, publicado em 1858. No seu relato ao Parlamento inglês, ela usou gráficos multicoloridos para defender o aperfeiçoamento do serviço de saúde do exército britânico. O mais famoso é o seu gráfico ''crista de galo'', uma espiral de seções em que cada uma representa as mortes a cada mês, que destacava que a imensa maioria das mortes foi consequência de doenças preveníveis em vez de tiros.

De fato, os repórteres usaram dados para manter o poder responsável por séculos, como atesta uma investigação conduzida por dados que descobriu gastos excessivos de políticos, incluindo o então congressista Abraham Lincoln. A sua prática combinada ao faro investigativo resultou em diversas reportagens premiadas pelo Pulitzer, e mudança da atuação do poder público através de medidas legislativas originadas em apurações sobre ações governamenais, como prova o histórico do Washington Post ao longo dos últimos anos (conheça outros casos interessantes aqui).

Jornalismo de dados (ou jornalismo guiado por dados) como o conhecemos atualmente é um termo que surgiu na metade da década de 2000 e que se refere às práticas jornalísticas que utilizam dados como base para gerarem notícias - foi utilizado pela primeira vez pelo desenvolvedor de software Adrian Holovaty, em 2006, no texto “A fundamental way newspaper sites need to change”, em que  expressa a importância de usar técnicas de gerenciamento de dados na redação dos jornais, advogando a necessidade de o jornalista se capacitar para explorar o Big Data. No cenário hiper-tecnológico de hoje, o caminho predito por Holovaty tornou-se indispensável.

 

Apesar de o termo ter sido cunhado recentemente, pode ser considerado um desenvolvimento de outros dois conceitos: jornalismo de precisão (JP) e reportagem assistida por computador (RAC) - propostos entre o final da década de 1960 e início de 1970, e surgiram no contexto dos avanços tecnológicos (o projeto de 2011, Reading the Motins do Guardian, chegou a aplicar as técnicas de relatórios assistidas por computador de Philip Meyer na década de 1960 a um surto de violência em toda a Inglaterra, um ano antes da publicação da primeira edição do Manual de Jornalismo de Dados, que sistematizou de maneira iniciadora essa nova maneira de trabalhar, contando histórias de maneiras inovadoras).

Apesar de todas as dificuldades, em 10 anos, o jornalismo de dados passou de um exercício de reportagem de nicho para se tornar uma parte essencial das redações em todo o mundo. Embora o jornalismo de dados tenha sido usado informalmente por profissionais de reportagem assistida por computador por décadas, o primeiro uso registrado por uma grande organização de notícias é o The Guardian, que lançou seu Datablog em março de 2009. No ano seguinte, a maneira como ele o e o também pioneiro New York Times lidaram com grandes quantidades de dados divulgados pelo Wikileaks acabou por difundir e popularizar o termo. Para descobrir como o jornalismo de dados avançou na última década, confira uma entrevista com Simon Rogers, fundador do Guardian Datablog que publicou seu primeiro conjunto de dados em 2009 - ano que marcou também o início da revolução dos dados abertos com o lançamento dos primeiros portais de dados abertos governamentais do mundo: o Data.gov do governo dos EUA foi lançado em maio daquele ano com 47 conjuntos de dados, e em setembro, o  Reino Unido lançou seu site de dados abertos, data.gov.uk.