Busca, análise temática, comparação entre candidatos e detecção de plágio nos planos de governo submetidos ao TSE para as eleições municipais de 2024. Dados extraídos dos PDFs oficiais disponibilizados pelo Tribunal Superior Eleitoral.
Digite qualquer termo – a busca ignora maiúsculas e acentos. Selecione um estado para busca no texto completo; sem estado a busca usa o resumo.
Clique em um tema para ver todos os candidatos que o mencionam nos planos.
Selecione até dois partidos e um tema para comparar as propostas.
Digite o nome ou município de cada candidato para comparar os planos lado a lado. Selecione o tema para ver o trecho específico.
Digite a cidade para ver os planos de todos os candidatos a prefeito lado a lado.
Identificação de trechos idênticos (sequências de palavras) compartilhados entre planos de diferentes candidatos. Trechos com 9 ou mais palavras iguais em ≥ 3 candidatos distintos são marcados como cópia.
Como os dados foram coletados, processados e analisados
Este painel reúne e analisa os planos de governo de candidatos a prefeito nas Eleições Municipais Brasileiras de 2024. Os dados foram extraídos dos PDFs oficiais disponibilizados pelo Tribunal Superior Eleitoral (TSE) no portal de Dados Abertos, processados com Python e publicados aqui para consulta pública. Todo o pipeline de coleta e processamento foi desenvolvido com o auxílio do Claude Code (Anthropic).
Os arquivos foram baixados diretamente do CDN do TSE no formato ZIP, um por estado
(proposta_governo_2024_{UF}.zip), cobrindo todos os 26 estados
(o Distrito Federal não tem prefeito). Cada ZIP contém os PDFs dos planos de governo
de todos os candidatos registrados naquele estado.
2024{UF}{SQ_CANDIDATO}_{sufixo}.pdfO texto foi extraído dos PDFs com a biblioteca pdfplumber (Python). PDFs escaneados (imagens) retornaram texto vazio e foram contabilizados como "PDFs sem texto (scan)". A extração foi feita página a página, concatenando o conteúdo de cada documento.
O texto extraído foi cruzado com o arquivo oficial de candidatos do TSE
(consulta_cand_2024_BRASIL.csv) usando o número sequencial do
candidato (SQ_CANDIDATO) como chave. Isso permitiu enriquecer
cada plano com nome, partido, município e estado do candidato.
A análise focou exclusivamente em candidatos ao cargo de prefeito.
Os textos foram normalizados (remoção de acentos, conversão para minúsculas) e verificados contra um dicionário de 30 temas com palavras-chave pré-definidas. Para cada candidato, foram registrados os temas mencionados e os trechos correspondentes. A contagem representa o número de candidatos cujo plano contém ao menos uma das palavras-chave do tema.
Foram identificados trechos idênticos entre planos de candidatos diferentes. A metodologia usa sequências de palavras normalizadas: trechos com 9 ou mais palavras consecutivas iguais compartilhados por ao menos 3 candidatos distintos são marcados como cópia. Isso captura tanto planos gerados por partidos centralmente quanto cópias entre candidatos.
O pipeline completo — desde o download dos ZIPs até a publicação dos JSONs — foi construído de forma iterativa com o auxílio do Claude Code, assistente de programação da Anthropic, rodando localmente via terminal.