Tecnologias utilizadas:
- HTML5 Audio API – para gravação de voz diretamente no navegador
- FastAPI (Python) – backend leve e rápido para receber e processar os áudios
- FFmpeg – usado para converter os arquivos de áudio para o formato compatível (.wav mono 16kHz)
- faster-whisper – versão otimizada do Whisper para transcrição offline de áudio
- Ollama + OpenHermes – modelo de IA local que interpreta e resume o conteúdo transcrito
- StreamingResponse (SSE) – envio em tempo real do status do processamento para o usuário
Funcionalidades principais:
- Gravação de áudio diretamente pelo navegador
- Processamento local 100% offline, sem envio para servidores externos
- Transcrição com alta precisão utilizando modelos de linguagem avançados
- Resumo automático com foco nos pontos principais do conteúdo falado
- Interface simples e direta com resposta exibida em tempo real
O projeto é ideal para gerar resumos rápidos de reuniões, entrevistas ou ideias gravadas por voz — com total privacidade e autonomia.