Caso Prático: Extração de Dados de Imagens
Objetivo
Aprender a extrair dados estruturados de imagens de documentos financeiros utilizando ferramentas de IA como ChatGPT e Gemini.
Contexto
Na análise de prestação de contas de partidos políticos, é comum receber documentos em formato de imagem ou PDF que contêm informações importantes. A extração manual desses dados é trabalhosa e sujeita a erros. Ferramentas de IA com capacidades de visão computacional podem automatizar esse processo.
Observação Importante
Existe uma diferença notável no desempenho da extração de texto (OCR) por ferramentas de IA como ChatGPT e Gemini, a depender do formato do arquivo. Frequentemente, o upload direto de um arquivo PDF pode não resultar em uma conversão de texto bem-sucedida, especialmente no ChatGPT. Em contrapartida, ao capturar uma imagem desse mesmo documento (um "print") e enviá-la, a IA consegue extrair o texto com sucesso. A razão para essa diferença é que o envio de imagens aciona modelos de visão computacional avançados, que são especificamente treinados para interpretar e extrair dados de conteúdo visual, superando as limitações dos módulos de processamento de PDFs.
Gemini e NotebookLM têm mais sucesso na extração de imagens de arquivos PDF.
Exercícios
Exercício 1: Extração de Dados de Documentos
Arquivo: Título de Eleitor
Instruções:
- Faça o upload da imagem no Gemini.
- Use o seguinte prompt:
Extraia os dados desse documento e coloque em uma tabela.
Exercício 2: Extração de Dados de Cheque
Arquivo: 01-copia-cheque-documentacao.pdf
Instruções:
- Tire um print da imagem do cheque e cole no ChatGPT ou Gemini
- Utilize o prompt a seguir para extrair os dados
Prompt:
PERSONA:
Você é um especialista em extrair dados de imagems de cheques.
DIRETIVA:
Extrai os dados da imagem deste cheque.
Exercício 3: Extração de Dados de Comprovante de Pagamento
Arquivo: 02-documento-pagamento-com-codigo-de-barras.pdf
Instruções:
- Faça upload do arquivo para o ChatGPT, Gemini ou NotebookLM
- Utilize o prompt a seguir
Prompt:
Extraia os dados desse comprovante de pagamentos
Resultados Esperados
Ao final deste exercício, você deverá ser capaz de:
- Extrair dados estruturados de documentos financeiros em formato de imagem
- Compreender as diferenças entre upload de PDF e imagem para extração de dados
- Utilizar prompts eficazes para orientar a IA na extração de informações específicas