Eleições Municipais 2024 TSE – Dados Abertos

Planos de governo dos candidatos

Busca, análise temática, comparação entre candidatos e detecção de plágio nos planos de governo submetidos ao TSE para as eleições municipais de 2024. Dados extraídos dos PDFs oficiais disponibilizados pelo Tribunal Superior Eleitoral.

carregando…
candidatos a prefeito
com plano de governo
% apresentaram plano
PDFs sem texto (scan)
% com trechos copiados
Cobertura por estado
% de candidatos com plano de governo enviado ao TSE
Temas mais citados
Total de candidatos que mencionam cada tema
Partidos com mais planos enviados
Buscar por palavra-chave

Digite qualquer termo – a busca ignora maiúsculas e acentos. Selecione um estado para busca no texto completo; sem estado a busca usa o resumo.

Temas pré-selecionados

Clique em um tema para ver todos os candidatos que o mencionam nos planos.

carregando temas…
Análise por partido

Selecione até dois partidos e um tema para comparar as propostas.

Candidato vs candidato

Digite o nome ou município de cada candidato para comparar os planos lado a lado. Selecione o tema para ver o trecho específico.

Comparar todos os candidatos de uma cidade

Digite a cidade para ver os planos de todos os candidatos a prefeito lado a lado.

Análise de plágio

Identificação de trechos idênticos (sequências de palavras) compartilhados entre planos de diferentes candidatos. Trechos com 9 ou mais palavras iguais em ≥ 3 candidatos distintos são marcados como cópia.

Filtrar plágio
Trechos mais copiados
carregando análise de plágio…
Candidatos com mais trechos em comum com outros planos
Trechos idênticos podem indicar uso de modelos pré-prontos, assessorias compartilhadas ou cópia direta — a lista abaixo serve para investigação.
Sobre este projeto

Como os dados foram coletados, processados e analisados

Este painel reúne e analisa os planos de governo de candidatos a prefeito nas Eleições Municipais Brasileiras de 2024. Os dados foram extraídos dos PDFs oficiais disponibilizados pelo Tribunal Superior Eleitoral (TSE) no portal de Dados Abertos, processados com Python e publicados aqui para consulta pública. Todo o pipeline de coleta e processamento foi desenvolvido com o auxílio do Claude Code (Anthropic).

1. Coleta dos PDFs

Os arquivos foram baixados diretamente do CDN do TSE no formato ZIP, um por estado (proposta_governo_2024_{UF}.zip), cobrindo todos os 26 estados (o Distrito Federal não tem prefeito). Cada ZIP contém os PDFs dos planos de governo de todos os candidatos registrados naquele estado.

  • Fonte: TSE – Dados Abertos (dadosabertos.tse.jus.br)
  • Data de referência: setembro de 2024
  • Formato dos arquivos: 2024{UF}{SQ_CANDIDATO}_{sufixo}.pdf
2. Extração de texto

O texto foi extraído dos PDFs com a biblioteca pdfplumber (Python). PDFs escaneados (imagens) retornaram texto vazio e foram contabilizados como "PDFs sem texto (scan)". A extração foi feita página a página, concatenando o conteúdo de cada documento.

  • Biblioteca: pdfplumber
  • PDFs processados por estado salvos em CSV intermediário
  • Resultado final: um CSV consolidado com todos os estados
3. Cruzamento com cadastro de candidatos

O texto extraído foi cruzado com o arquivo oficial de candidatos do TSE (consulta_cand_2024_BRASIL.csv) usando o número sequencial do candidato (SQ_CANDIDATO) como chave. Isso permitiu enriquecer cada plano com nome, partido, município e estado do candidato. A análise focou exclusivamente em candidatos ao cargo de prefeito.

4. Análise temática

Os textos foram normalizados (remoção de acentos, conversão para minúsculas) e verificados contra um dicionário de 30 temas com palavras-chave pré-definidas. Para cada candidato, foram registrados os temas mencionados e os trechos correspondentes. A contagem representa o número de candidatos cujo plano contém ao menos uma das palavras-chave do tema.

5. Cobertura dos dados
6. Análise de plágio

Foram identificados trechos idênticos entre planos de candidatos diferentes. A metodologia usa sequências de palavras normalizadas: trechos com 9 ou mais palavras consecutivas iguais compartilhados por ao menos 3 candidatos distintos são marcados como cópia. Isso captura tanto planos gerados por partidos centralmente quanto cópias entre candidatos.

7. Limitações conhecidas
  • PDFs escaneados (imagens) não têm texto extraível
  • Alguns candidatos submeteram múltiplos arquivos; apenas o primeiro foi usado
  • A análise cobre apenas candidatos a prefeito (não vereadores)
  • Planos em idiomas diferentes do português podem ter cobertura temática reduzida
  • A detecção de plágio identifica cópias textuais, não similiaridade semântica
Ferramentas e tecnologias utilizadas
Python 3.9 pandas pdfplumber PyMuPDF unidecode Chart.js Claude Code (Anthropic) TSE – Dados Abertos GitHub Pages

O pipeline completo — desde o download dos ZIPs até a publicação dos JSONs — foi construído de forma iterativa com o auxílio do Claude Code, assistente de programação da Anthropic, rodando localmente via terminal.

Dados: TSE – Dados Abertos (candidatos 2024) · Extração e análise: luizftoledo.github.io