
Dados abertos do governo brasileiro: onde encontrar e como usar
Guia prático sobre dados abertos no Brasil: principais portais, formatos, APIs e como usar essas informações.
Dados abertos do governo brasileiro: onde encontrar é como usar
O governo brasileiro produz uma quantidade absurda de dados todos os dias. Gastos publicos, saúde, educação, eleições, economia -- tudo registrado, processado e, em muitos casos, disponibilizado para qualquer pessoa acessar. O problema não e falta de dados. E que pouca gente sabe onde encontra-los é o que fazer com eles.
O Brasil tem um dos programas de dados abertos mais avancados da America Latina. Portais oficiais, APIs bem documentadas e bases de dados que cobrem decadas de informação. Se você e cidadão curioso, jornalista, pesquisador ou desenvolvedor, esse guia mostra onde estao os dados é como comecar a usa-los.
O que sao dados abertos
Dados abertos sao informações publicadas em formato digital, estruturado e legivel por maquina, sob licença que permite o livre uso, reutilização e redistribuição. Para serem considerados abertos de verdade, os dados devem atender a criterios claros:
- Acessibilidade: disponiveis na internet sem barreiras de acesso ou cadastro
- Formato aberto: em formatos como CSV, JSON, XML (PDF não conta -- PDF e documento, não dado)
- Licença aberta: sem restrições de uso, compartilhamento ou modificação
- Atualidade: atualizados regularmente, não dados de 2015 apresentados como atuais
- Completude: o máximo possível de dados, sem omissoes arbitrarias
Principais portais de dados abertos
dados.gov.br
O portal central do governo federal. Mantido pela CGU, reúne datasets de dezenas de órgãos e entidades. Funciona como um catalogo: você pesquisa por tema, órgão ou formato e encontra links para download e documentação.
E o primeiro lugar para procurar qualquer dado federal. Nem sempre é o mais atualizado, mas é o mais abrangente.
Portal da Camara dos Deputados
Um dos melhores portais de dados abertos do pais (o time de tecnologia da Camara merece crédito):
- Deputados (perfil, partido, comissoes)
- Proposições legislativas
- Votações
- Despesas da CEAP (cota parlamentar)
- Presenca em sessoes
A API RESTful da Camara e bem documentada e permite consultas granulares. Para desenvolvedores, é um prato cheio.
Portal do Senado Federal
Similar ao da Camara, com dados sobre senadores, proposições e votações. A estrutura e menos amigavel, mas os dados estao la.
Portal da Transparencia (CGU)
Dados sobre execução orcamentaria, salários de servidores, licitações, convenios e programas sociais do governo federal. Se você quer saber quanto ganha um servidor público federal ou quanto custou uma obra, e aqui.
IBGE (Instituto Brasileiro de Geografia e Estatistica)
Provavelmente o acervo mais rico de dados do Brasil:
- Censos demograficos (população, habitação, renda)
- Pesquisas economicas (PIB, PNAD, PMC)
- Indicadores de preços (IPCA, INPC)
- Dados geograficos e cartograficos
A API SIDRA permite acesso programatico a series historicas completas. Para quem trabalha com análise de dados, o IBGE e ouro puro.
Banco Central do Brasil
Dados financeiros e economicos essenciais:
- Series temporais (SGS/BCB) -- Taxa Selic, cambio, inflação, crédito
- Dados do sistema financeiro
- Open Finance
- Expectativas de mercado (Focus)
O SGS do Banco Central tem mais de 30.000 series temporais. A API e simples e confiavel.
INEP (Instituto Nacional de Estudos e Pesquisas Educacionais)
- Microdados do ENEM, ENADE e Censo da Educação Superior
- Indicadores de qualidade (CPC, IGC)
- Dados por instituição e curso
Quer saber a nota do ENADE de um curso especifico em uma universidade especifica? Esta aqui.
TSE (Tribunal Superior Eleitoral)
- Resultados eleitorais desde 1945
- Candidaturas e prestação de contas
- Filiação partidaria
- Pesquisas eleitorais registradas
O repositorio de dados do TSE e fundamental para qualquer análise política ou eleitoral. Os dados sao disponibilizados em CSV e podem ser cruzados com outras bases.
DataSUS
Dados de saúde pública:
- Registros de nascimentos, obitos e internações
- Cobertura vacinal por município
- Estabelecimentos de saúde
Os dados do DataSUS sao volumosos e exigem algum conhecimento técnico para processar, mas sao uma mina de informação para pesquisadores da área de saúde.
Publicidade
Formatos mais comuns
CSV (Comma-Separated Values)
O formato universal para dados tabulares. Abre no Excel, no Google Sheets, em Python, em R -- em qualquer ferramenta. Se você está comecando, CSV e seu melhor amigo.
JSON (JavaScript Object Notation)
Formato leve e estruturado, ideal para APIs e aplicações web. Mais flexível que CSV para dados hierarquicos (dados dentro de dados).
XML (eXtensible Markup Language)
Formato estruturado com tags, comum em sistemas governamentais mais antigos. Funcional, mas mais verboso que JSON.
GeoJSON / Shapefile
Para dados geoespaciais. Se você quer plotar dados em mapas, vai trabalhar com esses formatos.
Parquet / ORC
Formatos colunares otimizados para grandes volumes de dados. Se você está trabalhando com milhoes de registros, Parquet e muito mais eficiente que CSV.
Como usar dados abertos: exemplos praticos
Para cidadãos
- Verificar se seu município recebe os repasses federais a que tem direito
- Acompanhar gastos do seu deputado (a CEAP é um prato cheio)
- Comparar indicadores de educação e saúde entre cidades antes de decidir onde morar
- Consultar resultados eleitorais historicos do seu município
Para jornalistas
- Investigações baseadas em dados (o chamado jornalismo de dados)
- Cruzamento de bases para identificar irregularidades (ex.: servidor público com empresa fornecedora do próprio órgão)
- Visualizações e infograficos com dados oficiais que dao credibilidade a materia
Para pesquisadores
- Analises estatisticas com microdados oficiais do IBGE, INEP e DataSUS
- Estudos longitudinais com series historicas do Banco Central
- Pesquisas sobre políticas publicas baseadas em evidencias
Para desenvolvedores
- Criação de aplicativos e dashboards de fiscalização
- Integração de dados em sistemas e serviços
- Desenvolvimento de ferramentas de controle social (como o Serenata de Amor)
Publicidade
Ferramentas para trabalhar com dados abertos
- Python (pandas): a ferramenta mais popular para análise de dados. Gratuita e com comunidade enorme
- R: poderoso para analises estatisticas e visualizações
- Excel / Google Sheets: para analises mais simples com datasets menores
- QGIS: para dados geoespaciais (gratuito e open source)
- Jupyter Notebook: para analises reprodutiveis e documentadas
- Power BI / Tableau: para visualizações interativas e dashboards
Se você nunca trabalhou com dados, comece pelo Google Sheets com um CSV pequeno. Baixe os gastos de cota parlamentar de um deputado e explore. E a melhor forma de aprender.
Desafios dos dados abertos no Brasil
O cenario avancou muito, mas problemas persistem:
- Qualidade variavel: nem todos os datasets tem documentação adequada. Alguns sao atualizados religiosamente; outros parecem abandonados
- Fragmentação: dados espalhados em dezenas de portais, sem padronização de formato ou metadados
- Formatos proprietarios: alguns órgãos ainda publicam "dados abertos" em PDF. PDF não e dado aberto -- é uma foto de dado
- Descontinuidade: mudanças de governo podem afetar a disponibilidade. Portais somem, URLs quebram, APIs saem do ar
- Municípios: a transparencia municipal e extremamente desigual. Capitais costumam ter bons portais; municípios menores, nem tanto
Publicidade
Marco legal dos dados abertos no Brasil
- Constituição Federal (art. 5, XXXIII): direito de acesso a informação
- Lei de Acesso a Informação (12.527/2011): regulamenta o acesso a informações publicas -- um marco histórico
- Lei Complementar 131/2009: transparencia fiscal em tempo real
- Decreto 8.777/2016: Política de Dados Abertos do governo federal
- Lei Geral de Proteção de Dados (13.709/2018): define limites sobre o que pode ser publicado quando envolve dados pessoais
O arcabouco legal e solido. O desafio é a execução.
Perguntas frequentes
Preciso saber programar para usar dados abertos?
Não para consultas basicas. Muitos portais oferecem interfaces visuais para pesquisa e download. Arquivos CSV podem ser abertos no Excel ou Google Sheets sem nenhum conhecimento técnico. Porém, para analises mais avancadas, cruzamento de bases ou trabalho com volumes grandes, saber Python ou R faz uma diferenca enorme. A boa notícia: existem cursos gratuitos excelentes para comecar.
Os dados abertos do governo sao confiaveis?
Dados publicados em portais oficiais sao fontes primarias -- a informação vem direto de quem a produziu. Isso lhes da alta confiabilidade. Erros existem, especialmente em bases muito grandes, mas geralmente sao corrigidos quando reportados. Uma boa prática e cruzar dados de fontes diferentes para validar. Se o dado do IBGE bate com o do Banco Central, você pode confiar.
Posso usar dados abertos do governo para fins comerciais?
Na maioria dos casos, sim. A política de dados abertos do governo federal permite uso, reutilização e redistribuição, inclusive para fins comerciais. A única restrição importante é a LGPD: dados que permitam identificar individuos (como CPF, endereço ou dados de saúde) tem regras próprias de uso. Verifique sempre a licença especifica de cada dataset antes de usar comercialmente.
Publicidade
Publicidade
O conteúdo continua após o anúncio