Caso Prático: Extração de Dados de Imagens

Objetivo

Aprender a extrair dados estruturados de imagens de documentos financeiros utilizando ferramentas de IA como ChatGPT e Gemini.

Contexto

Na análise de prestação de contas de partidos políticos, é comum receber documentos em formato de imagem ou PDF que contêm informações importantes. A extração manual desses dados é trabalhosa e sujeita a erros. Ferramentas de IA com capacidades de visão computacional podem automatizar esse processo.

Observação Importante

Existe uma diferença notável no desempenho da extração de texto (OCR) por ferramentas de IA como ChatGPT e Gemini, a depender do formato do arquivo. Frequentemente, o upload direto de um arquivo PDF pode não resultar em uma conversão de texto bem-sucedida, especialmente no ChatGPT. Em contrapartida, ao capturar uma imagem desse mesmo documento (um "print") e enviá-la, a IA consegue extrair o texto com sucesso. A razão para essa diferença é que o envio de imagens aciona modelos de visão computacional avançados, que são especificamente treinados para interpretar e extrair dados de conteúdo visual, superando as limitações dos módulos de processamento de PDFs.

Gemini e NotebookLM têm mais sucesso na extração de imagens de arquivos PDF.

Exercícios

Exercício 1: Extração de Dados de Documentos

Arquivo: Título de Eleitor

Instruções:

Faça o upload da imagem no Gemini.
Use o seguinte prompt:

Extraia os dados desse documento e coloque em uma tabela.

Exercício 2: Extração de Dados de Cheque

Arquivo: 01-copia-cheque-documentacao.pdf

Instruções:

Tire um print da imagem do cheque e cole no ChatGPT ou Gemini
Utilize o prompt a seguir para extrair os dados

Prompt:

PERSONA:
Você é um especialista em extrair dados de imagems de cheques.

DIRETIVA:
Extrai os dados da imagem deste cheque.

Exercício 3: Extração de Dados de Comprovante de Pagamento

Arquivo: 02-documento-pagamento-com-codigo-de-barras.pdf

Instruções:

Faça upload do arquivo para o ChatGPT, Gemini ou NotebookLM
Utilize o prompt a seguir

Prompt:

Extraia os dados desse comprovante de pagamentos

Resultados Esperados

Ao final deste exercício, você deverá ser capaz de:

Extrair dados estruturados de documentos financeiros em formato de imagem
Compreender as diferenças entre upload de PDF e imagem para extração de dados
Utilizar prompts eficazes para orientar a IA na extração de informações específicas