Abraji lança maior ferramenta do Brasil para encontrar ações citando políticos


“Publique-se” reúne milhões de páginas de documentos anexados a 30 mil processos judiciais; mais de 9 mil políticos são citados nos arquivos

A Associação Brasileira de Jornalismo Investigativo (Abraji) lança nesta segunda-feira (10.set.2018) o projeto Publique-se, uma plataforma de busca que reúne documentos de mais de 30 mil processos judiciais cujos textos citam mais de 9 mil políticos brasileiros. Nenhuma outra ferramenta no Brasil até hoje identificou e reuniu tantos processos citando candidatos a cargos públicos.

A ideia é facilitar o acesso a provas, relatórios, comprovantes e documentos anexados a esses processos para ajudar repórteres em investigações jornalísticas sobre candidatos a cargos públicos. A ferramenta é gratuita e pode ser acessada no endereço publique-se.org.br.

Nesta primeira etapa, o projeto conta com dados de centenas de milhares de ações no Supremo Tribunal Federal (STF) e no Superior Tribunal de Justiça (STJ). Casos notórios de outros tribunais envolvendo grandes investigações sobre o poder público serão acrescentados numa segunda etapa.

“Houve um imenso esforço de captura e tratamento de dados para possibilitar a busca dentro desses documentos. O que você vai achar não são apenas processos que têm determinado político como réu ou investigado, mas todas as referências àquele político dentro de documentos em diferentes processos – mesmo que ele não seja parte naquele processo. Certamente há muita pauta escondida ali”, diz Tiago Mali, coordenador do projeto.

Ser citado em uma ação judicial não significa que o político tenha necessariamente participado de esquema de corrupção ou que tenha tido conduta reprovável. A transparência com relação a essas informações, no entanto, é passo importante para uma fiscalização mais ativa das instituições e dos agentes públicos por parte dos jornalistas.

Idealizado pela Abraji, o projeto contou com parceria da Associação Brasileira de Jurimetria (ABJ) na captura dos dados e conta com o patrocínio do Instituto Betty e Jacob Lafer.

Como funciona

A base de documentos da primeira etapa do projeto foi criada a partir de downloads automatizados dos bancos de dados de processos eletrônicos do STF e do STJ. Os arquivos baixados passaram por uma ferramenta de reconhecimento de caracteres (OCR) para que fosse possível pesquisar o texto dentro deles – muitos dos PDFs são imagens cujo texto não é pesquisável.

Após a extração de texto, o projeto identificou dentro das milhões de páginas de documentos aquelas que mencionam o CPF de cidadãos que se candidataram em qualquer eleição brasileira a partir de 2006 – são mais de 1 milhão de CPFs diferentes. Foram mantidos na ferramenta apenas os processos que citam dentro do seu texto o CPF de algum político.

A partir dessa base, que no momento do lançamento reúne documentos de mais de 30 mil processos, é possível buscar diretamente por nomes de políticos ou fazer uma “busca livre” por termos de interesse que estejam presentes nos documentos de processos que citam políticos.

A primeira rodada de download em massa dos documentos foi feita entre os meses de fevereiro e março deste ano, reunindo todos os processos eletrônicos de diferentes anos presentes nas páginas do Judiciário. Uma segunda rodada, que acrescentará os processos iniciados após esse download, está em andamento e deve ser incorporada à ferramenta antes do primeiro turno das eleições.