quinta-feira, 16 de agosto de 2012

RAC (Reportagem com Auxílio do Computador) - parte 1


-  Iniciada por Philip Meyer – jornalista norte-americano  – 1968
Em Detroit , fez pesquisa sobre movimentos sociais utilizando um mainframe – tabulação
Escreveu um livro depois “Precision Journalism”, que virou referência na RAC – dá para ler na web  em inglês

- Na década de 1980 saiu o primeiro prêmio Pulitzer utilizando RAC. Utilizando a lei de acesso às informações públicas, jornalistas do  "Atlanta Constitution"  requisitaram ao “BNH” de lá os dados de financiamentos habitacionais. Eles  foram  tabulados
Foi descoberto  que  se havia dois candidatos na mesma situação,  mas um negro e um branco, o negro tinha menos chances de receber crédito. Com isso caiu toda a direção do “BNH” da Georgia

- Na mesma época foi fundada a associação de RAC dos EUA. Lá existem100 cursos de jornalismos apenas. No Brasil, são cerca de 480

- A RAC chegou em Brasil por volta de 1995 com a popularização da internet. Primeiras matérias foram sobre o censo de 1991. (O Brasil tem Censo em ano 1 porque o Collor desorgonizou o país tanto que o IBGE ficou sem verba, por isso foi adiado. É o único país do mundo com censo em ano 1)

- A Folha começou a RAC no Brasil. Trouxe treinadores disso do México. A Abraji foi criada em 2003 e  a popularização cresceu

- 2005 – primeiro prêmio Esso de RAC no Brasil – “Homens de bem” , reportagem do jornal O Globo  –  sobre o crescimento gigante de patrimônio dos deputados do Rio – levantaram informações em cartórios e digitaram as informações no Excel e foram a campo para checar se os bens declarados batiam mesmo.

-/-

-> Busca avançada na Internet
Pesquisa avançada do Google   – http://www.google.com.br/advanced_search
Usando essa página a pessoa não precisa saber a linguagem da busca booleana . O grande problema de uma busca da internet, por incrível que pareça, é a quantidade excessiva de resultados. A pesquisa avançada diminui muitos os resultados, só para aquilo que você realmente procura

 Campos de busca  principais :
- com todas as palavras;
- expressão (na ordem que digitou – procurar nomes);
- qualquer uma das palavras (casos de desespero, combinar buscas de expressão com outras palavras-referências a nomes);
- sem as palavras (eliminar palavras da busca)
-  Domínio: pode ser .gov.br,  . matao.br,  . edu.br...  -> isso é muito bom, por exemplo, você precisa encontrar no Ministério da Saúde tudo relacionado a gripe, é só colocar "gripe" e as palavras finais do site "saude.gov.br"
-  Formato: PDF, DOC, XLS... – dá para combinar com o domínio (acha só arquivos em sites de governo)
-  Data  - dá para achar só coisas deste mês, semana, ano

Governo dos EUA faz isso - começa a busca pelo maior número possível de palavras relacionadas – menor o número de resultados, maior a eficácia

Outro buscador: pipl (people - especializado em encontrar pessoas)
http://pipl.com/ - Esse buscador é extremamente útil. Se você tem um nome para investigar ele vai mostrar tudo que a internet tem sobre o cara. Se é uma pessoa pública, por exemplo, a busca pode indicar a lista de livros favoritos da pessoa em um site de compras, isso já ajuda a fazer um perfil do cara

Conteúdo escondido
Mecanismos de buscas só conseguem em média achar 30% do conteúdo online. Robozinhos ficam vasculhando a rede buscando conteúdos novos, esse conteúdo é copiado para servidores, todas as palavras dessas páginas são lidas e é criado um índice que vai guiar as buscas. As rotinas de computador ainda não são capazes de preencher formulários . 70% do conteúdo são páginas dinâmicas formadas a partir de banco de dados, que são acessados só preenchimento de formulários

Como achar os outros 70%? – Preenchendo formulários, baixando arquivos:

CPF – Receita verifica  - http://www.receita.fazenda.gov.br/Aplicacoes/ATCTA/CPF/ConsultaPublica.asp

IBGE – dados populacionais  - http://www.ibge.gov.br/cidadesat/topwindow.htm?1

Portal da Transparência – quanto o governo Dilma pagou para empreiteiras , por exemplo - http://www.portaltransparencia.gov.br/

Estatísticas TSE – resultados de eleições  - http://www.tse.gov.br/internet/eleicoes/estatistica2010/est_candidatura.html

Projeto Excelências – acompanhar desempenho de Assembleias, trabalho do Supremo  - http://www.excelencias.org.br/@resumo_verbas.php

Mashup – fusão de linguagens – rádio com imagem, mapas com informações online
Newspapermap.com – mapeamento de jornais pelo mundo  - http://newspapermap.com/


Exemplo de um uso interligado de tudo isso / Estimular sinapses (ligar lé com cré)

+ O “polígono da violência” no Estadão –  http://www.estadao.com.br/estadaodehoje/20110530/not_imp725612,0.php
http://blogs.estadao.com.br/vox-publica/tag/infograficos/
Estadão analisou os dados do  Datusus – congrega informações de saúde pública – Rede SIM – informações de mortes violentas no Brasil , mais confiáveis do que as da polícia, porque os médicos registram tudo
Os dados de homicídios encontrados no Pará eram assustadores. Aí veio a sinapse - tiveram a ideia de comparar o mapa de mortes no Pará com o do desmatamento - bateram igualzinhos

60 assassinatos por 100 mil habitantes – similar na época a mais alta do mundo em Honduras
Caso do Pará – mapas com municípios mais violentos sobreposto com o do desmatamento – há enorme superposição
Depois o jornalista foi em Marabá in loco. A região atraiu muita população recentemente para garimpo e usina de Tucuruí, madeireiras. Cortaram todas as árvores , sobrou quase nada, só reservas, mas a pressão social e econômica continuou muito grande. Muitos madeireiras paradas, as pessoas precisam sobreviver e aí os conflitos acontecem nas reservas e as várias mortes.

Exemplo de uso:

Óbitos por causas externas – assassinatos  / divide número de assassinatos por habitantes -> taxa por cem mil habitantes
Estatísticas Vitais (mortes):
http://www2.datasus.gov.br/DATASUS/index.php?area=0205
EXEMPLO
Dados preliminares de 2009
Óbitos por causas externas
Abrangência Geográfica:
Unidades da Federação
Linha Unidade da Federação
Coluna Sexo
Conteúdo Óbitos por Residência (onde o morto morava) / por ocorrência (onde foi) – residência mostra mortes representadas nas cidades
CID 10 – Agressões (classificação internacional de doenças)
Ordenar pelos valores


Abrangência Geográfica:  tabela de população - residente
Tabnet - o próprio Datasus fornece o software para fazer o georeferenciamento – para saber se cidades com muitos assassinatos são próximos

-/-

Exemplos de uso do Portal da Transparência e da Receita

- Portal da Transparência  - http://www.portaltransparencia.gov.br/
CEIS – Cadastro de empresas descadastradas
Gastos diretos de governo – 2008 – por cartão de pagamento por portador – dá para ordenar por valor e obter informações por servidores

Gastos Diretos do Governo
por Favorecido - Pessoas físicas, empresas e outros
Em 2011 a construtora Delta era a maior favorecida - dá para ver seu CNPJ no portal e checar na Receita

http://www.receita.fazenda.gov.br/ - Empresas – certidões – emitir certidão
Emissão de nova certidão – não sai a certidão negativa dessa construtora  - pode ser problema de cadastro ou enorme dívida na Procuradoria:

  Emissão de 2ª. via da certidão – é possível  - constam débitos relativos a tributos administrados pela Secretaria da Receita Federal do Brasil (RFB) com a exigibilidade suspensa, nos termos do art. 151 da Lei no 5.172, de 25 de outubro de 1966 - Código Tributário Nacional (CTN); e

 Constam nos sistemas da Procuradoria-Geral da Fazenda Nacional (PGFN) débitos inscritos em Dívida Ativa da União com exigibilidade suspensa, nos termos do art. 151 do CTN, ou garantidos por penhora em processos de execução fiscal.

Delta teve emissão de certidão antiga correta, então usa essa velha para continuar participando de licitações


 ->  Saber endereço e dados básicos do dono do CNPJ  - site da Receita

Empresa – cadastro CNPJ  Emissão de Comprovante de Inscrição e de Situação Cadastral  


-/-

Exemplos de bancos de dados

Elio Gaspari – tem seu próprio banco de dados, com tudo que ele acredita que possa ser relevante no futuro (conversas, matérias, entrevistas, trechos de livros...) com palavras-chave, datas das informações sendo fichadas.  Links e fontes das informações
Mangabeira Unger foi nomeado ministro. Elio procurou “Lula” “Mangabeira Unger” em seu banco de dados. Descobriu que novo ministrou detonou chefe no passado. O link dessa informação era um artigo dele em Havard, que foi tirado do ar
Elio tem outro banco de dados. Tudo que ele aprendeu sobre a ditadura militar, incluindo o arquivo do Golberi. Ele mesmo diz que quem escreveu a série de livros sobre a ditadura foi seu banco de dados


Gay Talese – está escrevendo um novo livro sobre seu próprio casamento.  No térreo de sua casa ele mantém um banco de dados do casamento (notas fiscais, discussões, traições...). A memória falha, fica menos sujeito ao viés de confirmação


Evernote – programa gratuito para fazer banco de dados – online
Pode guardar notas de texto, documentos em PDF, qualquer arquivo até 50 mega, foto, áudio, vídeo  - fotografa documentos, vai para servidor do Evernote – transforma tudo que é texto na imagem em texto para ser buscado depois
http://www.evernote.com/

File Maker - http://www.filemaker.com/ - Gaspari usa
Para Macs principalmente, mais fácil de usar, com fichas, organizadas em ordem cronológica, dá para juntar tabelas (banco de dados relacional)

Nenhum comentário:

Postar um comentário