Upload
jocenir-ribeiro
View
83
Download
6
Embed Size (px)
DESCRIPTION
O objetivo da obra é ser uma fonte útil para qualquer um que possa estar interessado em se tornar um jornalista de dados, ou em aventurar-se no jornalismo de dados.
Citation preview
Introduo
O que o jornalismo de dados?
Por que jornalistas devem usar dados?
Por que o Jornalismo de Dados importante?
Alguns exemplos selecionados
Jornalismo de dados em perspectiva
O jornalismo guiado por dados numa perspectiva brasileira
Existe jornalismo de dados e visualizao no Brasil?
Na Redao
O Jornalismo de dados da ABC (Australian Broadcasting Corporation)
Jornalismo de Dados na BBC
Como trabalha a equipe de aplicativos de notcias no Chicago Tribune
Bastidores do Guardian Datablog
Jornalismo de dados no Zeit Online
Como contratar um hacker
Aproveitando a expertise dos outros com Maratonas Hacker
Seguindo o Dinheiro: Jornalismo de dados e Colaborao alm das Fronteiras
Nossas Histrias Vm Como Cdigo
Kaas & Mulvad: Contedo pr-produzido para comunicao segmentada
Modelos de Negcio para o Jornalismo de Dados
Estudos de Caso
Basmetro: Passando o poder da narrativa para o usurio
InfoAmaznia: o dilogo entre jornalismo e dados geogrficos
The Opportunity Gap: projeto de oportunidades em escolas
Uma investigao de nove meses dos Fundos Estruturais Europeus
A crise da Zona do Euro
Cobrindo o gasto pblico com OpenSpending.org
Eleies parlamentares finlandesas e financiamento de campanha
Hack Eleitoral em tempo real (Hacks/Hackers Buenos Aires)
Dados no Noticirio: WikiLeaks
Hackatona Mapa76
A cobertura dos protestos violentos no Reino Unido pelo The Guardian
Boletins escolares de Illinois (EUA)
Faturas de hospitais
Care Home Crisis: A crise da empresas de sade em domiclio
O telefone conta tudo
Quais modelos se saem pior na inspeo veicular britnica?
Subsdios de nibus na Argentina
Jornalistas de dados cidados
O Grande Quadro com o Resultado das Eleies
Apurando o preo da gua via crowdsourcing
Coletando dados
Guia rpido para o trabalho de campo
Seu Direito aos Dados
Lei de Acesso Informao no Brasil: Um longo caminho a percorrer
Pedidos de informao funcionam. Vamos us-los!
Ultrapassando Obstculos para obter Informao
A Web como uma Fonte de dados
O Crowdsourcing no Guardian Datablog
Como o Datablog usou crowdsourcing para cobrir a compra de ingressos na
Olimpada
Usando e compartilhando dados: a letra da lei, a letra mida e a realidade
Entendendo os Dados
Familiarizando-se com os dados em trs passos
Dicas para Trabalhar com Nmeros
Primeiros passos para trabalhar com dados
O po de 32 libras
Comece com os dados e termine com uma reportagem
Contando histrias com dados
Jornalistas de dados comentam suas ferramentas preferidas
Usando a visualizao de dados para encontrar ideias
Comunicando os dados
Apresentando os dados ao pblico
Como construir um aplicativo jornalstico
Aplicativos jornalsticos no ProPublica
A visualizao como carro-chefe do jornalismo de dados
Usando visualizao para contar histrias
Grficos diferentes contam histrias diferentes
O faa-voc-mesmo da visualizao de dados: nossas ferramentas favoritas
Como mostramos os dados no Verdens Gang
Dados pblicos viram sociais
Engajando pessoas nos seus dados
O que este livro (e o que ele no )
A inteno deste livro ser uma fonte til para qualquer um que possa estar
interessado em se tornar um jornalista de dados, ou em aventurar-se no
jornalismo de dados.
Muitas pessoas contriburam na sua composio, e, atravs do nosso esforo
editorial, tentamos deixar essas diferentes vozes e vises brilharem. Ns
esperamos que ele seja lido como uma conversa rica e informativa sobre o que
jornalismo de dados, por que ele importante, e como faz-lo.
Infelizmente, ler este livro no vai te dar um repertrio completo de todo o
conhecimento e habilidade necessrios para se tornar um jornalista de dados.
Para isso, seria necessria uma vasta biblioteca de informaes composta por
centenas de experts capazes de responder questes sobre centenas de tpicos.
Felizmente, essa biblioteca existe: a internet. Ainda assim, ns esperamos que
este livro possa te dar a noo de como comear e de onde procurar se voc
quiser ir alm. Exemplos e tutoriais servem para serem ilustrativos e no
exaustivos.
Ns nos consideramos muito sortudos por termos tido tanto tempo, energia, e
pacincia de todos os nossos voluntrios, e fizemos o melhor para tentar usar
isso com sabedoria. Esperamos que, alm de ser uma fonte de referncia til, o
livro sirva tambm para documentar a paixo e o entusiasmo, a viso e a energia
de um movimento que est nascendo. O livro uma tentativa entender o que
acontece nos bastidores dessa cena de jornalismo de dados.
O Data Journalism Handbook um trabalho em curso. Se voc acha que h
qualquer coisa que precisa ser corrigida ou est ausente, por favor nos avise
para que ela seja includa na prxima verso. Ele tambm est disponvel de
maneira gratuita em uma licena Creative Commons de Atribuio +
Compartilhamento, e ns encorajamos fortemente a compartilh-lo com
qualquer um que possa estar interessado.
Liliana Bounegru (@bb_liliana)
Lucy Chambers (@lucyfedia)
Jonathan Gray (@jwyg)
Maro de 2012
- See more at:
http://datajournalismhandbook.org/pt/0_paginas_preliminares_3.html#sthash.CkL0
MKly.dpuf
Viso Geral do Livro
A designer de infogrficos Lulu Pinney criou este lindo pster, que d um
panorama geral do contedo do Data Journalism Handbook.
Introduo
O que o jornalismo de dados? Qual o seu potencial? Quais so seus limites?
De onde ele vem? Nesta seo iremos explicar o que o jornalismo de dados e o
que ele pode significar para as organizaes jornalsticas. Paul Bradshaw
(Birmingham City University) e Mirko Lorenz (Deutsche Welle) discorrem um
pouco sobre o que h de diferente nesse tipo de reportagem. Jornalistas de
dados de destaque nos contam por que o consideram importante e quais so
seus exemplos favoritos. Finalmente, Liliana Bounegru (Centro Europeu de
Jornalismo) coloca o jornalismo de dados em seu contexto histrico mais
amplo.
O que h neste captulo?
O que o jornalismo de dados?
Por que jornalistas devem usar dados?
Por que o Jornalismo de Dados importante?
Alguns exemplos selecionados
Jornalismo de dados em perspectiva
O jornalismo guiado por dados numa perspectiva brasileira
Existe jornalismo de dados e visualizao no Brasil?
O que o jornalismo de dados?
Eu poderia responder, simplesmente, que um jornalismo feito com dados. Mas
isso no ajuda muito.
Ambos, "dados" e "jornalismo", so termos problemticos. Algumas pessoas
pensam em "dados" como qualquer grupo de nmeros, normalmente reunidos
numa planilha. H 20 anos, este era praticamente o nico tipo de dado com o
qual os jornalistas lidavam. Mas ns vivemos num mundo digital agora, um
mundo em que quase tudo pode ser (e quase tudo ) descrito com nmeros.
A sua carreira, 300 mil documentos confidenciais, todos dentro do seu crculo
de amizades; tudo isso pode ser (e ) descrito com apenas dois nmeros: zeros e
uns. Fotos, vdeos e udio so todos descritos com os mesmos dois nmeros:
zeros e uns. Assassinatos, doenas, votos, corrupo e mentiras: zeros e uns.
O que faz o jornalismo de dados diferente do restante do jornalismo? Talvez
sejam as novas possibilidades que se abrem quando se combina o tradicional
"faro jornalstico" e a habilidade de contar uma histria envolvente com a escala
e o alcance absolutos da informao digital agora disponvel.
Estas possibilidades aperecem em qualquer estgio do processo, seja usando
programas para automatizar o trabalho de combinar informao do governo
local, polcia e outras fontes civis, como Adrian Holovaty fez no ChicagoCrime e
depois no EveryBlock; seja usando um softtware para achar conexes entre
centenas de milhares de documentos, como o The Telegraph fez com o MPs'
expenses.
Imagem 1. Chamado para ajudar a investigar os gastos dos Membros do Parlamento (MPs) - (the
Guardian)
Jornalismo de dados pode ajudar um jornalista a formular uma reportagem
complexa atravs de infogrficos envolventes. Por exemplo, as palestras
espetaculares de Hans Rosling para visualizar a pobreza no mundo com
o Gapminder atraram milhes de visualizaes em todo mundo. E o trabalho
popular de David McCandless em destrinchar grandes nmeroscomo colocar
gastos pblicos dentro de contexto, ou a poluio gerada e evitada pelo vulco
islandsmostra a importncia de um design claro, como o doInformation is
Beautiful.
Ou ainda o jornalismo de dados pode ajudar a explicar como uma reportagem se
relaciona com um indivduo, como a BBC e o Financial Times costumam fazem
com seus oramentos interativos (em que se pode descobrir como o oramento
pblico afeta especificamente voc, em vez de saber como afeta uma "pessoa
comum"). Ele pode tambm revelar o processo de construo das notcias, como
o Guardian fez de maneira to bem-sucedida compartilhando dados, contextos e
questes com o Datablog.
Os dados podem ser a fonte do jornalismo de dados, ou podem ser as
ferramentas com as quais uma notcia contadaou ambos. Como qualquer
fonte, devem ser tratados com ceticismo; e como qualquer ferramenta, temos de
ser conscientes sobre como eles podem moldar e restringir as reportagens que
ns criamos com eles.
Paul Bradshaw, Birmingham City University
Por que jornalistas devem usar dados?
O jornalismo est sitiado. No passado, ns, como uma indstria, contvamos
com o fato de sermos os nicos a operar a tecnologia para multiplicar e
distribuir o que havia acontecido de um dia para o outro. A imprensa servia
como um porto: se algum quisesse impactar as pessoas de uma cidade ou
regio na manh seguinte, deveria procurar os jornais. Isso acabou.
Hoje as notcias esto fluindo na medida em que acontecem, a partir de
mltiplas fontes, testemunhas oculares, blogs, e o que aconteceu filtrado por
uma vasta rede de conexes sociais, sendo classificado, comentado e, muito
frequentemente, ignorado.
Esta a razo pela qual o jornalismo de dados to importante. Juntar
informaes, filtrar e visualizar o que est acontecendo alm do que os olhos
podem ver tem um valor crescente. O suco de laranja que voc bebe de manh, o
caf que voc prepara: na economia global de hoje existem conexes invisveis
entre estes produtos, as pessoas e voc. A linguagem desta rede so os dados:
pequenos pontos de informao que muitas vezes no so relevantes em uma
primeira instncia, mas que so extraordinariamente importantes quando vistos
do ngulo certo.
Agora mesmo, alguns jornalistas pioneiros j demonstram como os dados
podem ser usados para criar uma percepo mais profunda sobre o que est
acontecendo ao nosso redor e como isto pode nos afetar.
A anlise dos dados pode revelar "o formato de uma histria" (Sarah Cohen), ou
nos fornecer uma "nova cmera" (David McCandless). Usando os dados, o
principal foco do trabalho de jornalistas deixa de ser a corrida pelo furo e passa
a ser dizer o que um certo fato pode realmente significar. O leque de temas
abrangente: a prxima crise financeira em formao, a economia por trs dos
produtos que usamos, o uso indevido de recursos ou os tropeos polticos. Tudo
isso pode ser apresentado em uma visualizao de dados convincente que deixe
pouco espao para discusso.
Exatamente por isso jornalistas deveriam ver nos dados uma oportunidade. Eles
podem, por exemplo, revelar como alguma ameaa abstrata, como o
desemprego, afeta as pessoas com base em sua idade, sexo ou educao. Usar
dados transforma algo abstrato em algo que todos podem entender e se
relacionar.
Eles podem criar calculadoras personalizadas para ajudar as pessoas a tomarem
decises, seja comprar um carro, uma casa, decidir um rumo educacional ou
profissional ou ainda verificar os custos de se manter sem dvidas.
Eles podem analisar a dinmica de uma situao complexa, como protestos ou
debates polticos, mostrar falcias e ajudar todos a verem as possveis solues
para problemas complexos.
Ter conhecimento sobre busca, limpeza e visualizao de dados transformador
tambm para o exerccio da reportagem. Jornalistas que dominam estas
habilidades vo perceber que construir artigos a partir de fatos e ideias um
alvio. Menos adivinhao, menos busca por citaes; em vez disso, um
jornalista pode construir uma posio forte apoiada por dados, o que pode
afetar consideravelmente o papel do jornalismo.
Alm disso, ingressar no jornalismo de dados oferece perspectivas de futuro.
Hoje, quando redaes cortam suas equipes, a maioria dos jornalistas espera se
transferir para um emprego em relaes pblicas ou assessoria de imprensa.
Jornalistas de dados e cientistas de dados, contudo, j so um grupo procurado
de funcionrios, no s nos meios de comunicao. As empresas e instituies
ao redor do mundo esto buscando "intrpretes" e profissionais que saibam
entrar fundo nos dados e transform-los em algo tangvel.
H uma promessa de futuro nos dados e isso o que o excita as redaes,
fazendo-as procurar por um novo tipo de reprter. Para freelancers, a
proficincia com dados fornece um caminho para novas ofertas e remunerao
estvel tambm. Veja deste modo: em vez de contratar jornalistas para
preencher rapidamente as pginas e os sites com contedo de baixo valor, a
utilizao dos dados poderia criar demanda para pacotes interativos, nos quais
passar uma semana resolvendo uma questo a nica maneira de faz-los. Esta
uma mudana bem-vinda em muitas partes da mdia.
H uma barreira impedindo os jornalistas de usarem este potencial:
treinamento para aprender como trabalhar com dados passo-a-passo, da
primeira questo at um furo obtido pelo trabalho com os dados.
Trabalhar com dados como pisar em um vasto e desconhecido territrio.
primeira vista, os dados brutos so intrigantes aos olhos e mente. Esses dados
so complicados. bastante difcil mold-los corretamente para a visualizao.
Isto requer jornalistas experientes, que tm energia para olhar aqueles dados
brutos, por vezes confusos, por vezes chatos, e enxergar as histrias escondidas
l dentro.
Mirko Lorenz, Deutsche Welle
A Pesquisa
O Centro Europeu de Jornalismo realizou uma pesquisa para saber mais sobre
as necessidades de formao dos jornalistas. Descobrimos que h uma grande
vontade de sair da zona de conforto do jornalismo tradicional e investir tempo
em dominar novas habilidades. Os resultados da pesquisa nos mostraram que
os jornalistas veem a oportunidade, mas precisam de um pouco de apoio para
acabar com os problemas iniciais que os impedem de trabalhar com dados.
Existe uma confiana de que se o jornalismo de dados for adotado mais
universalmente, os fluxos de trabalho, ferramentas e os resultados vo melhorar
muito rapidamente. Pioneiros como The Guardian, The New York Times, Texas
Tribune, e Die Zeit continuam a elevar o nvel com suas histrias baseadas em
dados.
Ser que o jornalismo de dados permanecer restrito a um pequeno grupo de
pioneiros, ou ser que cada organizao de notcias em breve vai ter sua prpria
equipe dedicada ao jornalismo de dados? Esperamos que este manual ajude
mais jornalistas e redaes a tirar proveito deste campo emergente.
Imagem 2. Pesquisa do Centro Europeu de Jornalismo sobre necessidades de treinamento.
Por que o Jornalismo de Dados importante?
Perguntamos a alguns dos principais profissionais da rea por que eles acham
que o o jornalismo de dados um avano importante. Aqui est o que disseram.
Filtrando o Fluxo de Dados
Quando a informao era escassa, a maior parte de nossos esforos estavam
voltados caar e reunir dados. Agora que a informao abundante, process-
la tornou-se mais importante. O processamento acontece em dois nveis: 1)
anlise para entender e estruturar um fluxo infinito de dados e 2) apresentao
para fazer com que os dados mais importantes e relevantes cheguem ao
consumidor. Como acontece na cincia, o jornalismo de dados revela seus
mtodos e apresenta seus resultados de uma forma que possam ser replicados.
Philip Meyer, Professor Emrito da Universidade da Carolina do Norte, em
Chapel Hill
Novas abordagens para a narrativa
O jornalismo de dados um termo que, ao meu ver, engloba um conjunto cada
vez maior de ferramentas, tcnicas e abordagens para contar histrias. Pode
incluir desde a Reportagem com o Auxlio do Computador (RAC, que usa dados
como uma "fonte") at as mais avanadas visualizaes de dados e aplicativos de
notcias. O objetivo em comum jornalstico: proporcionar informao e anlise
para ajudar a nos informar melhor sobre as questes importantes do dia.
Aron Pilhofer, New York Times
Como o fotojornalismo, s que com laptop
O jornalismo de dados s se diferencia do "jornalismo de palavras" porque
usamos ferramentas distintas. Ambos trabalham buscando a notcia, fazendo
reportagem e contando histrias. como o fotojornalismo; s que substitui a
cmera pelo laptop.
Brian Boyer, Chicago Tribune
O Jornalismo de Dados o Futuro
O jornalismo movido por dados o futuro. Os jornalistas precisam ser
conhecedores dos dados. Costumava-se conseguir novas reportagens
conversando com pessoas em bares; e pode ser que, s vezes, voc continue
fazendo isso. Mas agora isso tambm possvel se debruando sobre dados e se
equipando com as ferramentas corretas para analis-los e identificar o que h de
interessante ali. Tendo isso em perspectiva, possvel ajudar as pessoas a
descobrir como todas essas informaes se encaixam e o que est acontecendo
no pas.
Tim Berners-Lee, fundador da World Wide Web (WWW)
O processamento de dados encontra o a lapidao do texto
O jornalismo de dados est diminuindo a distncia entre os tcnicos estatsticos
e os mestres da palavra. Faz isso ao localizar informaes que fogem ao padro e
identificar tendncias que no so apenas relevantes de um ponto de vista
estatstico, mas tambm relevantes para decodificar a complexidade do mundo
de hoje.
David Anderton, jornalista freelancer
Atualizando o Seu Conjunto de Competncias
O jornalismo de dados um novo conjunto de competncias para buscar,
entender e visualizar fontes digitais em um momento em que os conhecimentos
bsicos do jornalismo tradicional j no so suficientes. No se trata da
substituio do jornalismo tradicional, mas de um acrscimo a ele.
Em um momento em que as fontes esto se tornando digitais, os jornalistas
podem e devem estar perto dessas fontes. A internet abriu um mundo de
possibilidades alm da nossa compreenso atual. O jornalismo de dados
apenas o comeo do processo de evoluo de prticas antigas para se adaptar ao
mundo online.
O jornalismo de dados cumpre dois objetivos importantes para as organizaes
de mdia: encontrar notcias nicas (que no sejam de agncias), e executar a
funo fiscalizao do poder. Especialmente em tempos de perigo financeiro,
essas metas so bastante importantes para os jornais.
Do ponto de vista de um jornal local, o jornalismo de dados crucial. Existe um
ditado que diz que "uma telha solta na frente da sua porta mais importante
que uma revolta em um pas distante". O fato que se coloca diante de voc e
provoca impacto direto na sua vida. Ao mesmo tempo, a digitalizao est em
todos os lugares. Porque jornais locais tm esse impacto direto na regio em que
so distribudos e as fontes tornam-se cada vez mais digitais, um jornalista
precisa saber como encontrar, analisar e visualizar histrias usando dados como
matria-prima.
Jerry Vermanen, NU.nl
Um remdio para a assimetria da informao
A assimetria da informaono a falta de informao, mas a incapacidade de
absorv-la e process-la na velocidade e no volume com que chega at ns --,
um dos problemas mais significativos enfrentados pelos cidados ao fazer
escolhas sobre como viver suas vidas. Informaes obtidas pela imprensa e a
mdia influenciam escolhas e aes dos cidados. O bom jornalismo de dados
ajuda a combater a assimetria da informao.
Tom Fries, Fundao Bertelsmann
Uma resposta para o uso de dados por assessorias de imprensa
A disponibilidade de ferramentas de medio e a diminuio de seus preos
em uma combinao autossustentvel com foco na performance e na eficincia
em todos os aspectos da sociedadelevaram tomadores de deciso a
quantificar os progressos de suas polticas, monitorar tendncias e identificar
oportunidades.
As empresas continuam adotando novas mtricas mostrando quo boa so as
suas performances no mercado. Os polticos adoram se gabar sobre redues
dos nveis de desemprego e aumentos do PIB. A falta de viso jornalstica em
temas como os escndalos da Enron, Worldcom, Madoff ou Solyndra a prova
da falta de habilidade dos jornalistas para ver atravs e alm dos nmeros.
mais fcil aceitar o valor de face dos nmeros do que o de outros fatos, j que
carregam uma aura de seriedade mesmo quando so complemente fabricados.
A fluncia no uso de dados ajuda os jornalistas a analisar os nmeros com senso
crtico, e certamente os ajudar a ganhar terreno em seus contatos com
assessorias de imprensa.
Nicolas Kayser-Bril, Journalism++
Oferecendo interpretaes independentes de informaes oficiais
Aps o terremoto devastador e o consequente desastre na usina nuclear de
Fukushima, em 2011, o jornalismo de dados foi ganhando corpo e importncia
entre membros da mdia no Japo, pas geralmente atrasado com relao ao
jornalismo digital.
Estvamos perdidos quando o governo e especialistas no tinham dados
confiveis sobre os danos provocados. Quando os oficiais esconderam do
pblico informaes do sistema SPEEDI (rede de sensores japoneses que deve
prever a propagao de radiao entre outras coisas), no estvamos preparados
para decodificar os dados, mesmo que tivessem vazado. Voluntrios comearam
a coletar dados sobre radiao usando seus prprios dispositivos, mas ns no
estvamos armados com o conhecimento de estatstica, interpolao e
visualizao desses dados, entre outras coisas. Jornalistas precisam ter acesso
aos dados brutos, e aprender a no confiar apenas nas interpretaes oficiais
deles.
Isao Matsunami, Tokyo Shimbun
Lidar com o dilvio informacional
Os desafios e oportunidades trazidos pela revoluo digital continuam
disruptivos para o jornalismo. Numa era de abundncia de informao,
jornalistas e cidados precisam de ferramentas melhores, seja quando
estivermos fazendo a curadoria de material proibido por governos do Oriente
Mdio, processando dados surgidos de ltima hora, ou buscando a melhor
maneira de visualizar a qualidade da gua para uma nao de consumidores.
medida que lutamos contra os desafios do consumo apresentados por esse
dilvio de informaes, novas plataformas de publicao tambm permitem a
qualquer pessoa ter o poder de reunir e compartilhar dados digitalmente,
transformando-os em informao. Embora reprteres e editores tm sido os
tradicionais vetores para coletar e disseminar informao, no ambiente
informacional de hoje as notcias mais quentes aparecem antes na internet, e
no nas editorias de jornais.
Ao redor do mundo o vnculo entre os dados e o jornalismo est em forte
ascenso. Na era do big data, a crescente importncia do jornalismo de dados
reside na capacidade de seus praticantes de fornecer contexto, clareza e, talvez o
mais importante, encontrar a verdade em meio expanso de contedo digital
no mundo. Isso no significa que as organizaes de mdia de hoje no tenham
um papel crucial. Longe disso. Na era da informao, jornalistas so mais
necessrios que nunca para fazer a curadoria, verificar, analisar e sintetizar a
imensido de dados. Neste contexto, o jornalismo de dados tem uma
importncia profunda para a sociedade.
Hoje, entender um grande volume de dados ("big data"), particularmente dados
no estruturados, um objetivo central para cientistas de dados ao redor do
mundo, estejam eles em redaes, em Wall Street ou no Vale do Silcio. Um
conjunto crescente de ferramentas comuns, quer empregadas por tcnicos
governamentais de Chicago, tcnicos de sade ou desenvolvedores de redaes,
fornece ajuda substancial para atingir esse objetivo.
Alex Howard, OReilly Media
Nossas vidas so dados
Fazer bom jornalismo de dados difcil porque o bom jornalismo difcil.
Significa descobrir como obter os dados, entend-los e encontrar a histria. s
vezes h becos sem sada e no h uma grande reportagem. Afinal, se fosse
apenas uma questo de pressionar um boto certo, no seria jornalismo. Mas
isso o que faz o jornalismo de dados valer pena e, em um mundo onde nossas
vidas esto cada vez mais compostas por dados, a rea torna-se essencial para
uma sociedade justa e livre.
Chris Taggart, OpenCorporates
Uma forma de economizar tempo
Jornalistas no tm tempo para gastar na transcrio de documentos ou
tentando obter dados de PDFs, de modo que aprender um pouco de
programao (ou saber onde buscar pessoas que podem ajudar) incrivelmente
valioso.
Um reprter da Folha de S.Paulo estava trabalhando com um oramento local e
me chamou para agradecer o fato de termos colocado online as contas da cidade
de So Paulo (dois dias de trabalho para um nico hacker!). Ele disse que vinha
transcrevendo essas informaes manualmente ao longo de trs meses,
tentando construir uma reportagem. Eu tambm lembro de ter solucionado uma
questo ligada a um PDF para o Contas Abertas, uma organizao de notcias de
monitoramento parlamentar: 15 minutos e 15 linhas de cdigo conseguiram o
mesmo resultado que um ms de trabalho.
Pedro Markun, Transparncia Hacker
Uma parte essencial do pacote de ferramentas dos jornalistas
importante ressaltar a parte jornalstica ou o lado da reportagem do
jornalismo de dados. O exerccio no deve ser o de analisar e visualizar por si s,
mas tambm de usar os dados como uma ferramenta para se aproximar da
verdade e do que est acontecendo no mundo. Vejo a capacidade de analisar e
interpret-los como parte essencial do kit atual de ferramentas jornalsticas,
mais do que uma disciplina parte. Por fim, trata-se de fazer boas reportagens e
contar histrias da forma mais apropriada.
Esse novo jornalismo outro meio de analisar o mundo e fazer com que os
governantes prestem contas. Com uma quantidade cada vez maior de dados,
mais importante que nunca que os jornalistas estejam conscientes dessas
tcnicas. Isso deveria estar no arsenal de tcnicas de reportagem de qualquer
jornalista, seja aprender diretamente a trabalhar com os dados ou colaborar
com algum que cumpra esse papel.
O real poder do jornalismo de dados ajudar a obter e provar informaes
quando, por outros meios, seria muito difcil. Um bom exemplo disso uma
reportagem de Steve Doig que analisava os danos provocados pelo furaco
Andrew. Ele juntou dois conjuntos diferentes de dados: um mapeava o nvel de
destruio causado pelo furao, e o outro mostrava a velocidade dos ventos.
Isso permitiu identificar reas onde construes enfraquecidas e prticas de
construo no confiveis contriburam para aumentar o impacto do desastre. O
trabalho ganhou um Prmio Pulitzer em 1993 e continua sendo um grande
exemplo do potencial do jornalismo de dados.
Idealmente, usa-se dados para identificar fatos que fogem ao padro, reas de
interesse ou coisas que so surpreendentes. Neste sentido, eles podem agir
como um norte ou como pistas. Os nmeros podem ser interessantes, mas
apenas escrever sobre eles no suficiente. Voc ainda vai precisar fazer
reportagem para explicar o que eles significam.
Cynthia OMurchu, Financial Times
Adaptao a Mudanas no nosso ambiente informacional
Novas tecnologias digitais trazem novas formas de produzir e disseminar
conhecimento na sociedade. O jornalismo de dados pode ser entendido como
uma tentativa da mdia de se adaptar s mudanas e responder a elas em um
ambiente repleto de informao, incluindo o relato de histrias mais interativas
e multidimensionais que permitem aos leitores explorar as fontes subjacentes s
notcias e incentiv-los a participar da criao e avaliao de reportagens.
Csar Viana, Universidade de Gois
Um jeito de ver coisas que voc no enxergaria de outra forma
Algumas histrias podem apenas ser entendidas e explicadas por meio da
anlisee s vezes da visualizaode dados. Conexes entre pessoas ou
entidades poderosas continuariam ocultas, mortes causadas por polticas contra
drogas seguiriam escondidas, polticas ambientais que destroem a natureza
seguiriam inabalveis. Mas cada ponto acima no permaneceu nessa situao
devido a dados que os jornalistas obtiveram, analisaram e ofereceram aos
leitores. Os dados podem ser to simples como uma planilha bsica ou um
registro de chamadas de celular, ou to complexos como notas de avaliaes de
escolas ou informaes sobre infeco hospitalar. No fundo, porm, todas essas
histrias so temas que merecem ser contados.
Cheryl Phillips, The Seattle Times
Uma forma de contar histrias mais ricas
Podemos pintar histrias de toda a nossa vida por meio de nossos rastros
digitais. Do que consumimos e pesquisamos a onde e quando viajamos, nossas
preferncias musicais, nossos primeiros amores, as realizaes de nossos filhos,
e at os nossos ltimos desejos, tudo isso pode ser monitorado, digitalizado,
armazenado na nuvem e disseminado. Esse universo de informaes pode vir
tona para contar histrias, responder a questes e oferecer uma compreenso da
vida de uma maneira que atualmente supera at mesmo a reconstruo mais
rigorosa e cuidadosa de anedotas.
Sarah Slobin, Wall Street Journal
Voc no precisa de dados novos para dar um furo
s vezes, os dados j so pblicos e esto disponveis, mas ningum olhou para
eles com cuidado. No caso do relatrio da Associated Press sobre 4.500 pginas
de documentos revelados que descrevem aes de empresas de segurana
privada contratadas durante a guerra do Iraque, o material foi obtido por um
jornalista independente ao longo de vrios anos. Ele fez diversos pedidos, por
meio da lei de acesso informao dos EUA (Freedom of Information Act) ao
Departamento de Estado dos Estados Unidos. Eles escanearam os documentos
em papel e os subiram no site DocumentCloud, o que tornou possvel fazer uma
anlise abrangente da situao.
Jonathan Stray, The Overview Project
Alguns exemplos selecionados
Ns pedimos a alguns de nossos voluntrios que dessem seus exemplos
favoritos de jornalismo de dados e dissessem o que gostavam neles. Aqui esto:
"Do no Harm", do Las Vegas Sun
Meu exemplo favorito o a srie Do No Harm de 2010 do Las Vegas Sun sobre
servio hospitalar. O The Sun analisou mais de 2,9 milhes de registros
financeiros de hospitais, que revelaram mais de 3.600 leses, infeces e erros
mdicos que poderiam ter sido prevenidos. Eles obtiveram as informaes por
meio de uma requisio de dados pblicos e identificaram mais de 300 casos
nos quais pacientes morreram por conta de erros que poderiam ter sido
evitados. A reportagem possui diferentes elementos, que incluem: um grfico
interativo que permite ao leitor ver, por hospital, onde leses decorrentes de
cirurgia aconteceram mais que o esperado; um mapa e uma linha do tempo que
mostra infeces se alastrando hospital por hospital e um grfico interativo que
permite aos usurios ordenar os dados por leses evitveis ou por hospital para
ver onde as pessoas esto se machucando. Gosto deste trabalho porque muito
fcil de entender e navegar. Os usurios podem explorar os dados de uma
maneira muito intuitiva.
Alm disso, a iniciativa causou um impacto real: o legislativo de Nevada reagiu
com seis projetos de lei. Os jornalistas envolvidos trabalharam arduamente para
obter e limpar os dados. Um dos jornalistas, Alex Richards, mandou as
informaes de volta aos hospitais e para o Estado no mnimo uma dzia de
vezes para que as falhas fossem corrigidas.
Anglica Peralta Ramos, La Nacin (Argentina)
Imagem 3. Do No Harm (The Las Vegas Sun)
Banco de dados da Folha de Pagamento do Governo
Eu adoro o trabalho que organizaes pequenas e independentes esto
desempenhando todo dia, tais como a ProPublica ou o Texas Tribune que tm
em Ryan Murphy um grande reprter de dados. Se eu tivesse que escolher,
elegeria o projeto de Banco de Dados dos salrios de empregados do governo
do Texas Tribune. Este projeto coleta 660 mil salrios de empregados pblicos
em um banco de dados para usurios procurarem e ajudarem a gerar matrias a
partir dele. Voc pode procurar por agncia, nome ou salrio. simples,
informativo e est tornando pblica uma informao antes inacessvel. fcil de
usar e automaticamente gera matrias. um grande exemplo de por que o
Texas Tribune consegue a maioria de seu trfego das pginas de dados.
Simon Rogers, the Guardian
Imagem 4. Salrios dos empregados do Governo (The Texas Tribune)
Visualizao integral dos Registros da Guerra do Iraque, Associated Press
O trabalho de Jonathan Stray e Julian Burgess em cima dos Registros de Guerra
do Iraque uma iniciativa inspiradora na anlise e visualizao de textos
utilizando tcnicas experimentais para ganhar profundidade em temas que
valem a pena serem explorados dentro de um grande conjunto de dados
textuais.
Por meio de tcnicas de anlise de texto e algoritmos, Jonathan e Julian criaram
um mtodo que mostrava blocos de palavras-chave contidas nos milhares de
relatrios do governo americano sobre Guerra do Iraque vazados pelo
Wikileaks, tudo de uma forma visual.
Embora haja restries aos mtodos apresentados e a abordagem seja
experimental, o trabalho mostra um enfoque inovador. Em vez de tentar ler
todos os arquivos e revirar os registros de guerra com uma noo preconcebida
do que poderia ser achado com determinadas palavras-chaves, esta tcnica
calcula e visualiza tpicos e termos-chave de particular relevncia.
Com a crescente quantidade de informao textual (emails, relatrios, etc) e
numrica vindo ao domnio pblico, achar maneiras de identificar reas vitais
de interesse ser mais e mais importante um subcampo excitante do
jornalismo de dados.
Cynthia OMurchu, Financial Times
Imagem 5. Analizando os Registros de Combate (Associated Press)
Murder Mysteries
Uma das minhas obras favoritas de jornalismo de dados o projeto Murder
Mysteries de Tom Hardgrove do Scripps Howard News Service. Ele construiu
um banco de dados detalhado de mais de 185 mil assassinatos no resolvidos a
partir de dados governamentais e da requisio de registros pblicos. A partir
disso, ele desenvolveu um algoritmo que procura por padres sugerindo a
possvel presena de serial killers. Este projeto completo: trabalho rduo
montando uma base de dados melhor que a do prprio governo, anlise
inteligente usando tcnicas de cincias sociais e apresentao interativa dos
dados online de modo que os leitores possam eles mesmos explorarem.
Steve Doig, Walter Cronkite School of Journalism, Arizona State University
Imagem 6. Murder Mysteries (Scripps Howard News Service)
Message Machine
Eu adoro a reportagem e a postagem nerd do blog Message Machine da
ProPublica. Tudo comeou quando alguns tuiteiros mostraram curiosidade
sobre terem recebido diferentes emails da campanha presidencial de Obama. Os
colegas da ProPublica notaram e pediram para seu pblico encaminhar
qualquer email que tivesse recebido da campanha. A forma como mostram os
dados elegante, uma apresentao visual da diferena entre muitos emails
distintos que foram enviados naquela noite. extraordinrio porque eles
coletaram os prprios dados (reconhecidamente uma pequena amostra, mas
grande o suficiente para montar uma reportagem). Mas ainda mais incrvel
porque eles esto contando a histria de um fenmeno emergente: big data
usado em campanhas polticas para disparar mensagens especificamente
preparadas para cada pessoa. Isso s um gostinho das coisas por vir.
Brian Boyer, Chicago Tribune
Imagem 7. Message Machine (ProPublica)
Chartball
Um dos meus projetos de jornalismo de dados favoritos o trabalho de Andrew
Garcia Phillips no Chartball. Andrew um grande f de esportes com um apetite
voraz por dados, um olho espetacular para design e capacidade de programar.
Com o Chartball ele visualiza no apenas a histria, mas detalha os sucessos e
fracassos de cada um dos jogadores e dos times de beisebol. Ele coloca em
contexto, cria um grfico atraente e seu trabalho profundo, divertido e
interessante. E olha que eu nem me importo tanto com esportes.
Sarah Slobin, Wall Street Journal
Imagem 8. Vitrias e derrotas em tabelas (Chartball)
Jornalismo de dados em perspectiva
Em agosto de 2010, eu e alguns colegas do Centro Europeu de Jornalismo
organizamos o que acreditamos ser uma das primeiras conferncias
internacionais sobre jornalismo de dados, realizada em Amsterd. Naquele
momento, no havia muitas discusses sobre o tema e poucas organizaes
eram amplamente reconhecidas por trabalhar na rea.
Um dos mais importantes passos para dar visibilidade ao termo foi a forma
como grupos de mdia como The Guardian e The New York Times lidaram com
a imensa quantidade de dados divulgados pelo WikiLeaks. Nesse perodo, o
termo passou a ser usado de maneira mais ampla (ao lado de Reportagem com
Auxlio do Computador, ou RAC) para descrever como jornalistas estavam
usando dados para melhorar suas reportagens e para aprofundar investigaes
sobre um tema.
Ao conversar com jornalistas de dados experientes e tericos do Jornalismo no
Twitter, me parece que uma das primeiras definies do que hoje reconhecemos
como jornalismo de dados foi feita em 2006, por Adrian Holovaty, fundador do
EveryBlock, um servio de informao que permite ao usurios descobrir o que
est acontecendo na sua regio, no seu quarteiro. No seu pequeno ensaio "Uma
maneira fundamental na qual sites de jornais tm que mudar", ele defende que
jornalistas devem publicar dados estruturados, compreensveis por mquinas,
ao lado do tradicional "grande borro de texto":
Por exemplo, digamos que um jornal publicou uma notcia sobre um incndio
prximo. Ler essa histria num celular bacana e elegante. Viva a tecnologia!
Mas o que realmente quero ser capaz de explorar os dados brutos dessa
histria, um a um, com diferentes camadas. Ter a infraestrutura para comparar
detalhes deste incndio com os detalhes dos anteriores: data, horrio, local,
vtimas, distncia para o quartel do Corpo de Bombeiros, nomes e anos de
experincia dos bombeiros que foram ao local, tempo que levaram para chegar,
e incndios subsequentes, quando vierem a ocorrer.
Mas o que torna essa forma peculiar diferente de outros modelos de jornalismo
que usam banco de dados ou computadores? Como e em que extenso o
jornalismo de dados diferente das vertentes de jornalismo do passado?
Reportagem com Auxlio do Computador (RAC) e o Jornalismo de Preciso
H uma longa histria de uso de dados para aprofundamento da reportagem e
distribuio de informao estruturada (mesmo que no legvel por mquinas).
Talvez o mais relevante para o que hoje chamamos de jornalismo de dados a
Reportagem com Auxlio do Computador (RAC) que foi a primeira tentativa
organizada e sistemtica de utilizar computadores para coletar e analisar dados
para aprimorar a notcia.
A RAC foi usada pela primeira vez em 1952 pela rede de TV americana CBS,
para prever o resultado da eleio presidencial daquele ano. Desde a dcada de
60, jornalistas (principalmente os investigativos, principalmente nos Estados
Unidos) tm analisado bases de dados pblicas com mtodos cientficos para
fiscalizar o poder de forma independente. Tambm chamado de "jornalismo de
interesse pblico", defensores dessa tcnicas baseadas no auxlio do
computador tm procurado revelar tendncias, contrariar o senso comum e
desnudar injustias perpetradas por autoridades e corporaes. Por exemplo,
Philip Meyer tentou desmontar a percepo de que apenas os sulistas menos
educados participaram do quebra-quebra nas manifestaes de 1967 em Detroit.
As reportagens da srie "A cor do dinheiro", publicadas nos anos 80 por Bill
Dedman, revelaram preconceito racial sistemtico nas polticas de emprstimo
dos principais bancos. No seu artigo "O que deu errado", Steve Doig procurou
analisar os padres de destruio do Furaco Andrew no incio dos anos 90,
para entender as consequncias das polticas e prticas falhas de
desenvolvimento urbano. Reportagens movidas por dados prestaram valiosos
servios pblicos e deram prmios cobiados aos autores.
No incio dos anos 70, o termo jornalismo de preciso foi cunhado para
descrever esse tipo de apurao jornalstica: "o emprego de mtodos de pesquisa
das cincias sociais e comportamentais na prtica jornalstica" (em The New
Precision Journalism de Philip Meyer). O jornalismo de preciso foi proposto
para ser praticado nas instituies jornalsticas convencionais por profissionais
formados em jornalismo e em cincias sociais. Nasceu como resposta ao "New
Journalism", que aplicava tcnicas de fico reportagem. Meyer defendia que
eram necessrios mtodos cientficos para coleta e anlise de dados, em vez de
tcnicas literrias, para permitir que o jornalismo alcanasse sua busca pela
objetividade e verdade.
O jornalismo de preciso pode ser entendido como reao a algumas das
inadequaes e fraquezas do jornalismo normalmente citadas: dependncia dos
releases de assessorias (mais tarde descrito como "churnalism" ou "jornalismo
de batedeira"), predisposio em acatar as verses oficiais, e por a vai. Estas so
decorrentes, na viso de Meyer, da no aplicao de tcnicas e mtodos
cientficos como pesquisas de opinio e consulta a registros pblicos. Como feito
nos anos 60, o jornalismo de preciso serviu para retratar grupos marginais e
suas histrias. De acordo com Meyer:
O jornalismo de preciso foi uma forma de expandir o arsenal de ferramentas
do reprter para tornar temas antes inacessveis, ou parcialmente acessveis, em
objeto de exame minucioso. Foi especialmente eficiente para dar voz minoria e
grupos dissidentes que estavam lutando para se verem representados.
Um artigo influente publicado nos anos 80 sobre a relao entre o jornalismo e
as cincias sociais ecoa o discurso atual em torno do jornalismo de dados. Os
autores, dois professores de jornalismo americanos, sugerem que nas dcadas
de 70 e 80, a compreenso do pblico sobre o que notcia se amplia de uma
concepo mais direta de "fatos noticiosos" para "reportagens de
comportamento" (ou reportagens sobre tendncias sociais). Por exemplo, ao
acessar os bancos de dados do Censo ou de outras pesquisas, os jornalistas
conseguem "extrapolar o relato de eventos isolados e oferecer contexto que d
sentido ao fatos especficos".
Como podamos esperar, a prtica do uso de dados para incrementar a
reportagem to antiga quanto a prpria existncia dos dados. Como Simon
Rogers aponta, o primeiro exemplo de jornalismo de dados no The Guardian
remonta a 1821. Foi uma lista, obtida de fonte no oficial, que relacionava as
escolas da cidade de Manchester ao nmero de alunos e aos custos de cada uma.
De acordo com Rogers, a lista ajudou a mostrar o verdadeiro nmero de alunos
que recebiam educao gratuita, muito maior do que os nmeros oficiais
revelavam.
Imagem 9. Jornalismo de dados no The Guardian em 1821 (the Guardian)
Outro exemplo seminal na Europa Florence Nightingale e seu relato
fundamental,"Mortalidade no Exrcito Britnico", publicado em 1858. No seu
relato ao Parlamento ingls, ela usou grficos para defender o aperfeioamento
do servio de sade do exrcito britnico. O mais famoso o seu grfico crista
de galo, uma espiral de sees em que cada uma representa as mortes a cada
ms, que destacava que a imensa maioria das mortes foi consequncia de
doenas prevenveis em vez de tiros.
Imagem 10. Mortalidade do exrcito britnico por Florence Nightingale (imagem da Wikipedia)
Jornalismo de dados e a Reportagem com Auxlio do Computador
Atualmente h um debate sobre "continuidade e mudana" em torno do rtulo
"jornalismo de dados" e sua relao com vertentes jornalsticas anteriores que
empregaram tcnicas computacionais para analisar conjuntos de dados.
Alguns defendem que h diferena entre RAC e jornalismo de dados. Defendem
que RAC uma tcnica para apurar e analisar dados de forma a aprimorar uma
reportagem (normalmente investigativa), enquanto o jornalismo de dados se
concentra na maneira como os dados permeiam todo o processo de produo
jornalstico. Nesse sentido, o jornalismo de dados dedica tantas vezes, at
maisateno aos dados propriamente ditos em vez de apenas empreg-los
como forma de descobrir ou melhorar uma reportagem. Por isso, vemos o
Datablog do The Guardian e o jornal Texas Tribune publicando conjunto de
dados lado a lado com as notcias - ou at mesmo apenas os dados sozinhos
para as pessoas analisarem ou explor-los.
Outra diferena que, no passado, jornalistas investigativos enfrentariam
escassez de informaes em relao a questo que estavam tentando responder
ou ponto que buscavam esclarecer. Embora, evidentemente, isso continua a
acontecer, h ao mesmo tempo uma abundncia de informaes que os
jornalistas no necessariamente sabem como manipular. No sabem como
extrair valor dos dados. Um exemplo recente o Combined Online Information
System, maior banco de dados de gastos pblicos do Reino Unido. Este banco
de dados foi por muito tempo cobrado pelos defensores da transparncia mas,
quando foi lanado, deixou jornalistas perplexos e confusos. Como Philip Meyer
escreveu recentemente para mim: "Quando a informao era escassa, a maior
parte dos nossos esforos eram dedicados caa e obteno de informao.
Agora que abundante, o processamento dessa informao mais importante."
Por outro lado, alguns ponderam que no h diferena significativa entre o
jornalismo de dados e a Reportagem com Auxlio do Computador. J senso
comum que mesmo as mais modernas tcnicas jornalsticas tem um histrico e,
ao mesmo tempo, algo de novo. Em vez de debater se o jornalismo de dados
uma novidade completa ou no, uma posio mais produtiva seria consider-lo
parte de longa tradio, mas que agora responde a novas circunstncias e
condies. Mesmo que no haja uma diferena entre objetivos e tcnicas, o
surgimento do termo "jornalismo de dados" no incio do sculo indica nova fase
em que o absoluto volume de dados que esto disponveis onlinecombinado
com sofisticadas ferramentas centradas no usurio, plataformas de
crowdsourcing e de publicao automtica --permitem que mais pessoas
trabalhem com mais dados mais facilmente do que em qualquer momento
anterior da histria.
Jornalismo de dados significa alfabetizao de dados do pblico
A internet e as tecnologias digitais esto alterando fundamentalmente a forma
como a informao publicada. O jornalismo de dados uma parte do
ecossistema de prticas e ferramentas que surgiram em torno dos servios e
sites de dados. Citar e compartilhar fontes e referncias faz parte da natureza da
estrutura de links da internet, a forma como estamos acostumados a navegar
pela informao hoje em dia. Voltando um pouco no tempo, o princpio na base
da fundao da estrutura de links da web o mesmo princpio de citao usado
nos trabalhos acadmicos. Citar e compartilhar as fontes e dados por trs da
notcia uma das maneiras mais bsicas em que o jornalismo de dados pode
aperfeioar o jornalismo, aquilo que o fundador da WikiLeaks, Julian Assange,
chama de "jornalismo cientfico".
Ao permitir que cada um mergulhe com ateno nas fontes de dados e descubra
informao relevante para si mesmo, ao mesmo tempo que checa afirmaes e
desafia suposies comumente aceitas, o jornalismo de dados efetivamente
representa a democratizao de recursos, ferramentas, tcnicas e mtodos antes
restritos aos especialistas; seja reprteres investigativos, cientistas sociais,
estatsticos, analistas ou outros especialistas. Ao mesmo tempo em que citar e
oferecer links para as fontes de dados caracterstica do jornalismo de dados,
estamos caminhando para um mundo em que os dados esto perfeitamente
integrados ao tecido da mdia. Jornalistas de dados tm papel importante ao
ajudar a diminuir as barreiras para compreenso e imerso nos dados, e
aumentar a alfabetizao de dados dos seus leitores em grande escala.
No momento, a comunidade de pessoas que se auto-denominam jornalistas de
dados bastante diferente da comunidade mais madura da RAC. Tomara que,
no futuro, vejamos laos mais fortes entre essas duas comunidades, da mesma
forma que vemos novas organizaes no governamentais e organizaes de
mdia cidad como a ProPublica e o Bureau de Jornalismo Investigativo
trabalharem de mos dadas com redaes tradicionais em investigaes. Ao
mesmo tempo em que a comunidade de jornalismo de dados possa ter formas
inovadoras para entregar dados e apresentar notcias, a abordagem
profundamente analtica e crtica da comunidade da RAC tem muito a ensinar
ao jornalismo de dados.
Liliana Bounegru, Centro Europeu de Jornalismo
O jornalismo guiado por dados numa perspectiva brasileira
A partir do final dos anos 2000, as prticas de Jornalismo Guiado por
Dados (JGD) no apenas estavam em vias de se estabelecer nas redaes da
Amrica do Norte e Europa, como tambm haviam se tornado a principal
estratgia de grande parte da imprensa para a recuperao da audincia, que
vem caindo h dcadas. Pode-se dizer que, hoje, o jornalismo guiado por dados
est na moda. Alm da popularizao das ferramentas e do apelo comercial de
visualizaes e outros produtos relacionados ao JGD, foi importante para isso a
adoo de polticas de acesso informao e transparncia por governos de todo
o mundo. Conhecidos como polticas de dados abertos (open data) ou
transparncia pblica (open government), estes mecanismos inundaram a
Internet com bases de dados antes muito difceis de se obter. Os jornalistas,
portanto, tm hoje o material e as ferramentas para o o JGD ao alcance das
mos.
Servios online, como Google Drive, Infogr.am, DocumentCloud e CartoDB,
apenas para citar alguns, permitem construir, organizar e analisar bancos de
dados, bastando um computador e habilidade com a lngua inglesa para us-los.
Em maio de 2012, a Presidncia da Repblica sancionou a Lei n 12.527,
conhecida como Lei de Acesso Informao, que obriga todos os rgos
pblicos brasileiros a divulgar dados administrativos e a atender a solicitaes
de informao qualquer cidado. Estes dois fatores reavivaram o interesse da
imprensa brasileira pela aplicao de tcnicas computacionais na produo de
notcias.
So os prprios reprteres, individualmente, os principais disseminadores dos
conceitos de JGD no cenrio mundial. Voc pode encontrar aqui uma lista de
quase cem referncias com links para esses trabalhos. No Brasil, existem cada
vez mais jornalistas se preparando para atuar nesta especialidade, alm dos
veteranos da Reportagem Assistida por Computador (RAC) dos anos 1990. Um
dos principais indcios deste interesse foi a criao de uma equipe dedicada
apenas ao jornalismo guiado por dados na redao de O Estado de So Paulo,
pioneira no Brasil, no ano de 2012. Em maio daquele ano, a equipe do Estado
Dadoslanou o Basmetro, um dos primeiros aplicativos jornalsticos
brasileiros. Em agosto do mesmo ano, a Folha de S. Paulo passou a hospedar o
blog FolhaSPDados, cujo objetivo criar visualizaes grficas e mapas
relacionados s reportagens publicadas no veculo impresso e no site da
empresa. A mesma Folha passou a hospedar o blog Afinal de Contas, dedicado a
analisar o noticirio a partir de anlises de dados. Outros veculos, como a
Gazeta do Povo, do Paran, tm usado a experincia da redao com jornalismo
investigativo na produo de grandes reportagens baseadas em dados. J o
gacho Zero Hora, por exemplo, vem se dedicando ao tema do jornalismo
guiado por dados e transparncia pblica atravs de reportagens e do blog Livre
Acesso, inaugurado em 2012 para acompanhar a aplicao da Lei de Acesso
Informao no pas.
No campo do jornalismo independente, o principal exemplo o InfoAmaznia,
criado em 2012 pelo Knight Fellow Gustavo Faleiros, em parceria com o
webjornal O Eco e a Internews. Em 2013, O Eco criou o Ecolab, um Laboratrio
de Inovao em Jornalismo Ambiental. A Agncia Pblica outra redao
independente a aplicar tcnicas de JGD, embora o faa esparsamente. Apesar
disso, foi responsvel por uma das principais contribuies ao JGD no Brasil,
por meio de uma parceria com o Wikileaks, para oferecer a biblioteca de
documentos diplomticos PlusD, entre outras bases de dados.
Estes exemplos sugerem estarmos vivenciando os primeiros passos de um
movimento de institucionalizao das prticas de jornalismo guiado por dados
nas redaes brasileiras. As bases do sucesso do JGD no pas, entretanto, foram
lanadas nos anos 1990.
Breve histrico do Jornalismo Guiado Por Dados no Brasil
Ainda durante o governo de Fernando Collor de Mello como presidente do
Brasil, o jornalista Mrio Rosa, ento empregado no Jornal do Brasil, usou o
Sistema Integrado de Administrao Financeira do Governo Federal (Siafi) para
verificar o superfaturamento na compra de leite em p pela Legio Brasileira de
Assistncia, ento presidida pela primeira-dama, Rosane Collor. Lcio Vaz
relata o caso no livro A tica da malandragem:
Assinada pelo jornalista Mrio Rosa, a matria estava completa, com dados
jamais vistos, como nmeros de ordens bancrias (Obs.) e de empenhos
(reservas feitas no Oramento da Unio). Mrio havia descoberto o Sistema
Integrado de Administrao Financeira (Siafi), uma expresso que se tornaria
muito conhecida de jornalistas e polticos nos anos seguintes. O acesso a esse
sistema, que registra os gastos do governo federal, possibilita fazer uma
completa radiografia de todos os pagamentos feitos a empreiteiras,
fornecedores, Estados e municpios. Uma mina de diamante para os reprteres.
O jornalismo ganhava uma nova e importante fonte de informao, mais
tcnica, quase cientfica. Estavam superados os mtodos mais arcaicos de
apurao, que envolviam, eventualmente, o enfrentamento com jagunos.
Na poca, o acesso a este tipo de base de dados governamental era vedado a
cidados e jornalistas. O prprio autor da reportagem, Mrio Rosa, s pde
realizar pesquisas no Siafi porque o ento senador Eduardo Suplicy (PT-SP) lhe
emprestou a senha a que tinha direito no desempenho de suas atividades
parlamentares. A partir desta e de outras reportagens, o Governo Federal
decidiu permitir oficialmente o acesso de jornalistas ao Siafi, tornando-o uma
das primeiras bases de dados pblicas a serem franqueadas a reprteres no
Brasil.
Ascnio Seleme, hoje diretor de redao de O Globo, foi outro reprter que,
ainda nos anos 1990, usou a senha de um parlamentar para realizar pesquisas
no Siafi, em colaborao com o analista econmico Gil Castelo Branco, diretor
da Organizao No-GovernamentalContas Abertas. Estes dois casos so,
provavelmente, os primeiros exemplos de JGD na histria do jornalismo
brasileiro.
Ao longo dos anos 1990, reprteres como Fernando Rodrigues e Jos Roberto
de Toledo, da Folha de S. Paulo, comeam a usar tcnicas de RAC. A partir de
cursos ministrados na redao por tutores do National Institute for Computer-
Assisted Reporting dos Estados Unidos, uma subdiviso da associao
Investigative Reporters and Editors (IRE/NICAR), estas tcnicas foram
disseminadas na redao e depois passaram a integrar o currculo do programa
de trainees da Folha. A partir de 1998, Fernando Rodrigues comeou a construir
o banco de dados Polticos do Brasil, lanado na Web e em livro. Em 2002, Jos
Roberto de Toledo se torna um dos scios-fundadores e vice-presidente
da Associao Brasileira de Jornalismo Investigativo (Abraji), entidade
fundamental na disseminao dos conceitos e tcnicas da RAC no Brasil, tendo
treinado mais de quatro mil jornalistas.
A estruturao da Abraji se deu a partir de um seminrio promovido pelo
Centro Knight para o Jornalismo nas Amricas em dezembro de 2002, cujos
principais palestrantes foram Brant Houston, autor de um manual de RAC e
ento diretor do IRE, e Pedro Armendares, da organizao mexicana Periodistas
de Investigacin, que era um dos tutores dos cursos de RAC organizados pela
Folha de S. Paulo.
Embora seja uma associao voltada ao jornalismo investigativo em geral, a
Abraji atuou na ltima dcada principalmente na divulgao da RAC e na defesa
do acesso informao, como uma das entidades integrantes do Frum de
Direito de Acesso a Informaes Pblicas, criado em 2003, e atravs de cursos e
palestras dois fatores fundamentais para a emergncia do jornalismo guiado
por dados ao longo da dcada de 2000. Duas outras entidades tiveram um papel
importante no estabelecimento destas prticas nas redaes brasileiras: as
organizaes no-governamentais Transparncia Brasil e Contas Abertas.
A primeira foi criada em 2000 com o objetivo de construir e manter bases de
dados sobre financiamento eleitoral, histrico de vida pblica e processos
sofridos por parlamentares em nvel municipal, estadual e federal, notcias
sobre corrupo publicadas nos principais jornais brasileiros e sobre o
desempenho dos juzes membros do Supremo Tribunal Federal. A segunda
entidade, criada em 2005, acompanha o processo de execuo oramentria e
financeira da Unio, atravs de monitoramento do Siafi, e promove o
treinamento de jornalistas para fiscalizar gastos pblicos. As bases de dados
mantidas pela Transparncia Brasil e Contas Abertas permitiram a reprteres
realizar reportagens investigativas ao longo da dcada, quando o acesso s
informaes do Estado dependia de gesto caso-a-caso junto a rgos do
governo e s redaes no investiam neste tipo de recurso.
Um indcio da crescente importncia das bases de dados para as redaes ao
longo da dcada de 2000 est na lista de vencedores do Prmio Esso de Melhor
Contribuio Imprensa, vencido em 2002 e 2006 por Fernando Rodrigues,
pelo arquivo de declaraes de bens de polticos brasileiros Controle Pblico e
pelo livro Polticos do Brasil, respectivamente; pela Transparncia Brasil, em
2006, e pela Contas Abertas, em 2007. Em 2010, a reportagem vencedora do
Prmio Esso, o mais importante do jornalismo brasileiro, foi a srie Drios
Secretos, publicada pela Gazeta do Povo, do Paran. Para elucidar os
movimentos de contratao de funcionrios na Assembleia Legislativa do
Paran, os reprteres construram um banco de dados com todas as nomeaes
realizadas pela casa entre 2006 e 2010, a partir de dirios oficiais impressos.
Cruzando os dados no software para criao de planilhas Microsoft Excel,
puderam descobrir casos de contratao de funcionrios-fantasmas e
nepotismo.
Dados so a tbua de salvao da imprensa?
Esse breve histrico sugere que o jornalismo guiado por dados no foi
assimilado pelas redaes brasileiras atravs da divulgao promovida por
associaes profissionais internacionais, imprensa e jornalistas, que tem se
intensificado desde 2010, mas vem sendo constitudo como prtica na cultura
jornalstica brasileira em paralelo com o processo de informatizao. Todavia,
pode-se inferir que o interesse crescente de empresas e profissionais do mundo
inteiro pelo jornalismo guiado por dados alimenta e incentiva o interesse pelo
tema nas redaes do Brasil. Nmeros da ferramenta de buscas Google mostram
que, a partir de 2010, h um volume crescente de procura por pginas
relacionadas ao jornalismo guiado por dados, como pode ser verificado na
figura abaixo.
Imagem 11. Volume de buscas por data journalism entre janeiro de 2010 e agosto de 2013
(Google Trends, 18 set. 2013)
O primeiro ponto de inflexo na curva de interesse pelo termo data journalism
(jornalismo de dados) no Google coincide com a criao de uma seo dedicada
ao tema, o DataBlog, pelo jornal britnico The Guardian, no final de 2010, e
atinge seus dois maiores picos em maio de 2012, quando o jornal americano
Seattle Times ganha o prmio de melhor reportagem em jornalismo guiado por
dados da associao Global Editors Network, e em abril de 2013, quando o The
Guardian publica no repositrio de vdeos YouTube um documentrio sobre a
histria do jornalismo guiado por dados na redao do veculo britnico.
O interesse da imprensa pelo jornalismo guiado por dados, porm, j era
evidente dois anos. No dia 11 de janeiro de 2009, a New York Magazine, editada
pelo grupo controlador do New York Times, trazia na capa a manchete O novo
jornalismo e uma foto de duas pginas de cinco membros dos setores de
Tecnologias para Redao Interativa, grficos e multimdia da empresa,
acompanhada do subttulo O que estes cybergeeks renegados esto fazendo no
New York Times? Talvez o salvando. A matria conta a histria da formao do
grupo de Tecnologias para Redao Interativa dentro da organizao, cujos
membros, liderados por Aron Pilhofer, so classificados na reportagem como
nerds, desenvolvedores/reprteres ou reprteres/desenvolvedores e
cybergeeks.
O New York Times uma das maiores e mais respeitadas empresas de
jornalismo do mundo e, para alm do sucesso mercadolgico, pode ser
considerada a prpria encarnao da cultura e da mitologia da profisso. O
interesse das redaes brasileiras e mundiais pelas prticas de jornalismo
guiado por dados no est ligado apenas a seus benefcios para as rotinas
produtivas e o atendimento do interesse pblico, mas tambm esperana de
salvar uma indstria em decadncia justamente por efeito das tecnologias
digitais.
Marcelo Trsel, Pontifcia Universidade Catlica do Rio Grande do Sul
Existe jornalismo de dados e visualizao no Brasil?
Existe jornalismo de dados e de visualizao no Brasil? Existe. Est crescendo?
Quero acreditar que est, mas no de jeito sistemtico e organizado, e no na
grande mdia. Sendo honesto, tenho pouca esperana de que estas tcnicas e
ferramentas vo criar razes profundas nela com algumas excees notveis
, pelo menos at que no aconteam algumas mudanas profundas. Aqui esto
alguns dos principais motivos:
1. A alergia ao pensamento lgico, racional, e quantitativo: Tenha em
conta s os seguintes fatos: Alguns dos principais jornais do pas continuam
a publicar horscopos sem pudor nenhum; as TVs nacionais cobrem
aparies de virgens e santos como se fossem fatos, e no iluses; a principal
revista semanal de informao geral uma fonte substancial de exemplos de
grosseira falta de critrio estatstico e visual. Estes so s sintomas de um
fenmeno subjacente que pode gerar um clima pouco propcio para o
desenvolvimento da profisso.
2. A falta de conhecimento dos rudimentos de mtodos de pesquisa:
O jornalista brasileiro, como muitos outros de tradio mediterrnea (no se
esqueam que sou espanhol) , em geral, um escritor-humanista, no um
pesquisador-cientista. Como ter os dois perfis fundamental em qualquer
redao, a mdia brasileira precisa hoje menos do primeiro e mais do
segundo. Em algumas palestras no pas, enquanto comentava exemplos de
grficos ou histrias que poderiam ser melhoradas, falei casualmente: Aqui
podem ver um caso claro de quando melhor usar a mediana e no a
mdia, s para ficar chocado pelos olhares de confuso de uma parte da
audincia. Se ns no sabemos algo to bsico como o que uma mediana, o
que dizer de desvio padro, anlises de regresso, valor-p, ou mtodos
bayesianos, to em moda hoje graas ao sucesso de Nate Silver no The New
York Times?
3. O ensino universitrio do jornalismo: A falta de sabedoria cientfica e
tecnolgica culpa, em grande parte, de um sistema de educao que no
tem se adaptado s necessidades dos jornalistas de hoje. Em um mundo em
que os dados so cada vez mais acessveis, em que empresas e governos
contratam especialistas para manipular dados antes de apresent-los ao
pblico, o corpo profissional, que na teoria teria que servir de filtro, carece
das habilidades necessrias para cumprir com seu trabalho adequadamente.
Pior, por culpa do prximo ponto que descrevo, tambm est se blindando
contra colegas que possam ajudar nessa tarefa.
4. A obrigatoriedade do diploma: A deciso nscia de fazer o diploma
universitrio de jornalismo obrigatrio para o exerccio da profisso pode
dificultar o emprego de gente com perfil diverso para as redaes a no ser
em posies de segunda categoria. Alem disso, a exigncia do diploma
servir tambm como desculpa para que os departamentos de Jornalismo
no sintam a necessidade de se renovarem para oferecer aos estudantes um
melhor treinamento em habilidades conceituais e tecnolgicas.
Por que isto um grande desafio? Hoje muito difcil achar jornalistas
diplomados que, ao mesmo tempo, tenham conhecimentos cientficos ou
tcnicos profundos. No s que o jornalista mdio no saiba mexer com
dados; que no sabe nem ler uma tabela de nmeros, colocar eles em contexto,
e extrair histrias, o que muito mais importante. Como consequncia, a
grande mdia precisa contar com especialistas (cientistas, economistas,
socilogos, etc.) como reprteres e editores, e tambm com profissionais de
cincias da computao para colaborar na anlise profunda e na gesto de
dados.
Me permitam fazer um parntese neste ponto, e ser muito claro. Um hacker que
desenvolve ferramentas para que os cidados acessem dados pblicos, e que
segue as regras ticas prprias da profisso, to jornalista quanto o reprter
que escreve sobre o ltimo escndalo do Governo, gostem os partidrios do
diploma obrigatrio ou no. Se for contratado por um meio de comunicao,
deve ser na posio de jornalista ou, pelo menos, com salrio e poder de deciso
equivalentes aos de um reprter ou editor no mesmo nvel.
Eu leciono infografia e visualizao numa escola de Comunicao e Jornalismo.
No conheo nenhum caso de ex-estudante que tenha mostrado o seu diploma
para um empregador durante uma entrevista. Os jovens jornalistas so
avaliados pelas suas habilidades e conhecimentos.
Por que ter esperana
Na situao atual, portanto, impensvel que mesmo os melhores jornais do
pas reproduzam o que grandes meios de comunicao dos Estados Unidos
The New York Times, The Washington Post, The Boston Globe, LA Times,
ProPublica, The Texas Tribune esto conseguindo: juntar equipes
multidisciplinares que sistematicamente criam complexos e profundos projetos
de jornalismo de dados, visualizaes e infogrficos interativos.
Essas publicaes no consideram o jornalismo de dados acessrio ou enfeite,
mas elemento central das suas coberturas que no s do prestgio, mas
tambm atraem leitores. Em recentes palestras, Jill Abramson, diretora
executiva do The New York Times, se referiu aos seus departamentos de news
applications (aplicativos interativos de notcia), multimdia e infografia como
pilares essenciais do jornal e do seu rumo futuro. Um dos exemplos mais citados
por ela Snow Fall, uma cobertura multimdia, que de forma muito orgnica
mistura texto com imagem, animaes e infografias.
Tendo em conta este panorama desolador, porque acho que o jornalismo de
dados e a visualizao podem crescer e, por sinal, esto crescendo no Brasil? No
que que baseio minha esperana?
Em primeiro lugar, em corajosas iniciativas dentro dos grandes veculos
jornalsticos. So produto geralmente do esforo no suficientemente
reconhecido e sustentado de pequenos grupos de profissionais com vontade e
energia. A equipe do Estado Dados e o blog Afinal de contas, de Marcelo Soares
na Folha de S. Paulo so bons exemplos. So ainda s sementes de um
fenmeno que teria que florescer nos prximos anos, mas pelo menos existem.
Tem tambm projetos isolados, espordicos, feitos por outros veculos da mdia,
como as revistas poca e Veja, e jornais como o Correio, na Bahia, o Estado, e a
Folha. Porm, falta dar continuidade a estes casos notveis.
Em segundo lugar, indivduos e organizaes alm da mdia tradicional esto
mostrando uma criatividade invejvel. No tenho inteno de ser exaustivo na
listagem de projetos que tem chamado a minha ateno nos ltimos tempos,
mas gostaria de destacar alguns que combinam os dados com um interessante
trabalho de design e visualizao:InfoAmazonia e sua impressionante
combinao de bancos de dados e representao cartogrfica; o Radar
Parlamentar, que analisa matematicamente os padres de voto dos
congressistas; as propostas resultantes do W3C, como o Retrato da Violncia
Contra a Mulher no RS e Para Onde vai Meu Dinheiro; e o projeto Escola que
queremos.
Quem sabe, talvez sejam estes hackers, desenvolvedores, designers, jornalistas
independentes, organizaes no governamentais, e fundaes os que ocupem
um espao hoje quase vazio, e os que cumpram uma parte importante da tarefa
de informao pblica que, em tempos anteriores, correspondeu mdia
tradicional. O futuro promete, em qualquer caso. Alberto Cairo,
Universidade de Miami
Na Redao
Como o jornalismo de dados encontra espao em redaes pelo mundo? Como
os pioneiros do jornalismo de dados convenceram seus colegas de que era uma
boa ideia publicar bases de dados ou lanar aplicativos baseados em dados? Os
jornalistas devem aprender a programar ou trabalhar em conjunto com
desenvolvedores talentosos? Nesta seo olharemos para o papel do jornalismo
de dados na Australian Broadcasting Corporation, BBC, Chicago Tribune,
Guardian, Texas Tribune e Zeit Online. Aprenderemos como identificar e
contratar bons desenvolvedores, como fazer com que as pessoas se
comprometam com um tema atravs de hackatonas (maratonas hackers) e
outros eventos, como colaborar alm das fronteiras e modelos de negcio para
jornalismo de dados.
O que h neste captulo?
O Jornalismo de dados da ABC (Australian Broadcasting Corporation)
Jornalismo de Dados na BBC
Como trabalha a equipe de aplicativos de notcias no Chicago Tribune
Bastidores do Guardian Datablog
Jornalismo de dados no Zeit Online
Como contratar um hacker
Aproveitando a expertise dos outros com Maratonas Hacker
Seguindo o Dinheiro: Jornalismo de dados e Colaborao alm das Fronteiras
Nossas Histrias Vm Como Cdigo
Kaas & Mulvad: Contedo pr-produzido para comunicao segmentada
Modelos de Negcio para o Jornalismo de Dados
O Jornalismo de dados da ABC (Australian Broadcasting
Corporation)
A Australian Broadcasting Corporation a empresa pblica de radiofuso na
Austrlia. O oramento anual gira em torno de um 1 bilho de dlares
australianos, que abastece sete redes de rdio, 60 estaes locais de rdio, 3
servios digitais de televiso, um novo servio internacional de televiso e uma
plataforma online para transmitir a oferta cada vez maior de contedo gerado
pelo usurio. Na ltima contagem, havia mais de 4.500 funcionrios em tempo
equivalente a integral e quase 70% deles produzem contedo.
Ns somos uma radiofusora nacional intensamente orgulhosa de nossa
independncia; embora sejamos financiados pelo governo, temos autonomia
garantida por lei. Nossa tradiao o servio pblico independente de
jornalismo. A ABC reconhecida como a empresa de mdia mais confivel no
pas.
Estes so tempos estimulantes; sob a gesto de um diretor administrativo (o ex-
executivo de jornal Mark Scott), os produtores de contedo da ABC foram
encorajados a ser "geis", como diz o mantra corporativo.
claro que mais fcil falar do que fazer.
Mas uma inciativa recente para incentivar essa produo foram competies nas
quais os funcionrios faziam rpidas apresentaes (pitchs) de projetos
multiplataforma que gostariam de desenvolver - as ideias vencedoras recebiam
o financiamento da empresa. Assim foi concebido o primeiro projeto de
jornalismo de dados da ABC.
No comeo de 2010, entrei em um desses pitchs para mostrar minha proposta
para trs dos avaliadores. Eu estava remoendo esta ideia h algum tempo,
ambicionando algo como o jornalismo de dados que o, agora legendrio,
Guardian Datablog estava oferecendo. E isso foi s o comeo.
Meu raciocnio era de que, sem dvida, dentro de 5 anos a ABC teria sua prpria
diviso de jornalismo de dados. Era inivitvel, opinei. Mas a questo era como
chegaramos l e quem comearia.
Para os leitores que desconhecem a ABC, pensem em uma grande burocracia
construda ao longo de 70 anos. Seus carros-chefes sempre foram rdio e
televiso. Com o advento do website, na ltima dcada a oferta de contedo
desenvolveu-se em texto, fotos e num grau de interatividade inimaginvel no
passado. O espao virtual estava forando a ABC a repensar os modos de obter
lucro e o seu contedo. claro que um trabalho contnuo.
Mas algo mais estava acontecendo com o jornalismo de dados. O governo 2.0
(que, como descobrimos, largamente ignorado na Austrlia) estava comeando
a oferecer novas maneiras de contar histrias at ento limitadas a zeros e uns.
Eu disse tudo isso para as pessoas durante minha rpida apresentao. Tambm
disse que precisvamos identificar novos conjuntos de habilidades e treinar
jornalistas em novas ferramentas. Precisvamos de um projeto para comear.
E eles me deram o dinheiro para isso.
Em 24 de Novembro de 2011, o projeto multiplataforma online de notcias da
ABC foi lanado com Coal Seam Gas by the Numbers (Gs Metano de Carvo em
Nmeros).
(Nota da traduo: O gs metano retirado do carvo um tipo de gs natural
usado como combustvel. Como foram descobertas grandes e valiosas reservas
desse gs na Austrlia, e sua explorao pode envolver problemas ambientais,
ele se tornou um dos principais assuntos em discusso no pas)
Imagem 1. Coal Seam Gas by the Numbers (ABC News Online)
Foi feito com cinco pginas de mapas interativos, visualizao de dados e texto.
No era exclusivamente jornalismo de dados, mas um hbrido de diferentes
formas de jornalismo nascido da mistura das pessoas na equipe e do tema, um
dos assuntos mais quentes na Australia.
A "jia da coroa" do projeto era um mapa interativo mostrando poos de
metano e concesses de explorao na Austrlia. Os usurios podem pesquis-
los por localizao e alternar entre o layout que mostra a concesso ou os poos.
Dando um zoom no mapa, podem acompanhar o responsvel pela explorao, a
condio do poo, e a sua data de perfurao. Outro mapa mostra onde h
explorao do gs prxima a aquferos australianos.
Imagem 2. Mapa interativo de poos de gs e concesses na Austrlia (ABC News Online)
Ns fizemos visualizaes de dados que trataram especificamente do problema
da gerao de um subproduto de gua com grande concentrao de sal. Outra
parte do projeto investigou o despejo de produtos qumicos numa bacia de rios.
Nosso Time
Um desenvolvedor web e webdesigner
Um jornalista que liderou o projeto
Um pesquisador, trabalhando meio-perodo, com expertise em extrao de
dados, planilhas de Excel, e "limpeza" dos dados
Um jornalista iniciante trabalhando meio perodo
Um consultor de produo executiva
Um consultor acadmico, com experincia em minerao de dados,
visualizao de grficos e habilidades avanadas de pesquisa
Os servios de um gerente de projetos e a assistncia administrativa da
unidade multiplataforma da ABC
Importante destacar que ns tambm tivemos um grupo de jornalistas de
referncia e outras pessoas que amos consultando conforme precisvamos
De Onde Conseguimos os Dados?
As informaes para os mapas interativos foram retiradas de shapefiles (um
tipo comum de dado geoespacial) baixados de sites do governo.
Outros dados sobre a gua e o sal vieram de diferentes relatrios
As informaes sobre os lanamentos de qumicos vieram de licenas
ambientais emitidas pelo governo.
O Que Aprendemos?
O projeto Coal Seam Gas by the Numbers foi ambicioso no contedo e na escala.
O mais importante para mim foio que aprendemos e como poderamos fazer
isso de uma maneira diferente da prxima vez"
O projeto juntou um monte de pessoas que normalmente no se encontravam
na ABC: em termos leigos, os hacks e os hackers. Muitos de ns no falvamos a
mesma lngua e nem mesmo acompanhvamos o trabalho do outro grupo.
Jornalismo de dados disruptivo!
Lies prticas:
Estar num mesmo local vital para a equipe. Nosso desenvolvedor e
designer trabalhou fora da ABC e veio para as reunies. Isso,
definitivamente, no o ideal! Coloque todos na mesma sala dos jornalistas.
Nosso consultor de produo executiva tambm estava em outro andar do
prdio. Precisvamos estar muito mais perto para que tivssemos a
possibilidade de "dar uma passada" rapidamente.
Escolha uma histria que exclusivamente orientada pelos dados
Olhando o Contexto
Grandes organizaes de mdia precisam se engajar na construo de
capacidades para enfrentar os desafios do jornalismo de dados. Meu palpite
que h um monte de geeks e hackers se escondendo nos departamentos mais
tcnicos das empresas desesperados para sair. Ento precisamos de workshops
"hack e hacker" onde os geeks escondidos, jornalistas jovens, desenvolvedores
web e webdesigners saiam para brincar com os jornalistas mais experientes e
compartilhem habilidades e que sejam orientados.
Ipso facto, o jornalismo de dados interdisciplinar. Equipes de jornalismo de
dados so feitas de pessoas que no tenham trabalhado juntas antes. O espao
digital borrou as fronteiras.
Vivemos em um meio poltico fraturado e de desconfiana. O modelo de negcio
que antes entregava jornalismo profissional independenteimperfeito como
ele est beira do colapso. Devemos nos perguntar, como muitos j esto
fazendo, como o mundo se parecer sem um "quarto poder" vivel. O intelectual
e jornalista norte-americano Walter Lippman observou em 1920 que "admite-se
que uma opinio pblica forte no pode existir sem o acesso a notcias.'' Essa
declarao no menos verdadeira agora. No sculo 21, todo mundo est na
blogosfera. difcil diferenciar mentirosos, dissimulados e grupos de interesse
de jornalistas profissionais. Praticamente qualquer site ou fonte pode ser feito
de forma a parecer ter credibilidade e ser honesto. As manchetes de confiana
esto morrendo na vala. E, neste novo espao de lixo jornalstico, links podem
levar o leitor, infinitamente, a outras fontes mais inteis, mas de aparncia
brilhante, que continuam linkando de volta ao salo de espelhos digitais. O
termo tcnico para isso : bullshit baffles brains (besteira que confunde
crebros: expresso em ingls para indicar fraudes).
No meio digital, todo mundo um contador de histrias, certo? Errado. Se o
jornalismo profissionale com isso quero dizer aquele que abraa uma
narrativa tica, equilibrada e corajosa na busca da verdadequiser sobreviver,
o ofcio dever reafirmar-se no espao digital. Jornalismo de dados apenas
mais uma ferramenta que nos permitir navegar nesse espao. onde vamos
mapear, remexer, classificar, filtrar, extrair e ver aparecer a histria no meio de
todos aqueles zeros e uns. No futuro trabalharemos lado a lado com os hackers,
os desenvolvedores, os designers e os programadores. uma transio que
requer sria capacitao. Precisamos de gestores de notcias que "saquem'' a
conexo jornalismo/ meio digital para comear a investir nessa construo.
Wendy Carlisle, Australian Broadcasting Corporation
Jornalismo de Dados na BBC
O termo "jornalismo de dados" pode abranger uma srie de disciplinas e usado
de diversas formas em organizaes jornalsticas. Por isso, pode ser til definir o
que entendemos por "jornalismo de dados" aqui na BBC. Em linhas gerais, o
termo abrange projetos que utilizam dados para realizar uma ou mais das
seguintes aes:
Permitir que um leitor descubra informao pessoalmente relevante
Revelar uma histria extraordinria e at ento desconhecida
Ajudar o leitor a entender melhor uma questo complexa
Essas categorias podem se sobrepor e, num ambiente on-line, muitas vezes
podem se beneficiar de algum nvel de visualizao.
Faa-o pessoal
No site da BBC News, utilizamos dados para fornecer servios e ferramentas aos
nossos usurios h mais de uma dcada.
O exemplo mais consistente, publicado primeiramente em 1999, so as
nossas Tabelas da rede escolar, que utilizam dados publicados anualmente pelo
governo. Os leitores podem encontrar escolas locais, inserindo um cdigo
postal, e compar-las de acordo com uma srie de indicadores. Jornalistas de
Educao tambm trabalham com a equipe de desenvolvimento para arrastar os
dados s suas matrias antes da publicao.
Quando comeamos a faz-las, no havia site oficial que providenciasse uma
maneira para o pblico explorar os dados. Mas agora que o Ministrio da
Educao tem o seu prprio servio de comparativo, passamos a nos concentrar
mais sobre as histrias que emergem a partir dos dados.
O desafio nesta rea deve ser o de proporcionar o acesso aos dados nos quais h
um claro interesse pblico. Um exemplo recente de um projeto que exps um
grande conjunto de dados, normalmente no disponveis para o pblico, foi a
reportagem especial Every Death on Every Road (Cada morte em Cada estrada).
Ns fornecemos uma busca por cdigo postal, permitindo que os usurios
encontrem a localizao de todas as fatalidades ocorridas nas estradas do Reino
Unido na ltima dcada.
Ns fizemos visualizaes de alguns dos principais fatos e nmeros que
emergem a partir dos dados da polcia e, para dar ao projeto uma sensao mais
dinmica e uma face humana, fizemos uma parceria com a London Ambulance
Association e a rdio e TV BBC de Londres para monitorar acidentes em toda a
capital medida que aconteciam. Isto foi relatado online e em tempo real, e
tambm atravs do Twitter utilizando a hashtag #crash24, e as colises
foram mapeadas medida que eram relatadas.
Ferramentas Simples
Alm de proporcionar maneiras de explorar grandes conjuntos de dados,
tambm tivemos sucesso ao criar ferramentas simples para usurios, que
fornecem informaes pessoalmente relevantes. Estas ferramentas interessam
queles sem tempo disponvel, que podem no querer uma longa anlise. A
capacidade de compartilhar facilmente um fato pessoal algo que tornarmos
padro.
Um exemplo a nossa ferramenta The world at 7 billion: Whats your
number (O mundo em 7 bilhes: Qual o seu nmero?), publicada para
coincidir com a data oficial em que a populao mundial ultrapassou 7 bilhes.
Ao inserir a data de nascimento, o usurio podia descobrir qual "nmero" ele
era, em termos de populao mundial, quando nasceu. Esse nmero podia ser
compartilhado depois atravs do Twitter ou Facebook. O aplicativo usava dados
fornecidos pelo fundo de desenvolvimento da populao das Naes Unidas. Era
muito popular, e tornou-se o link mais compartilhado em 2011 no Facebook do
Reino Unido.
Imagem 3. O mundo em 7 bilhes (BBC)
Outro exemplo recente o da calculadora do oramento da BBC, que permitia
aos usurios descobrirem quo melhor ou pior ser para as suas contas quando
a nova lei oramentria do Reino Unido entrar em vigore compartilhar esse
dado. Fize