Pipeline
Como funciona
Cada audio passa por 4 etapas automaticas, do input ate a transcricao final formatada.
Etapa 1
Captura de Audio
O audio e capturado via upload de arquivo, download de YouTube (yt-dlp), ou microfone do navegador via WebSocket.
Etapa 2
Speech-to-Text (Deepgram)
O audio e enviado para a API Deepgram Nova-3, que converte fala em texto com alta precisao, suportando multiplos idiomas.
Etapa 3
Transcricao Bruta
O texto bruto retornado pelo Deepgram e salvo. Inclui timestamps, duracao e metadados da fonte original.
Etapa 4
Processamento com IA (Groq)
O Llama 3.3 70B via Groq formata, organiza e limpa a transcricao. Voce pode customizar o prompt de processamento.
Speech-to-Text
Deepgram Nova-3
LLM
Groq Llama 3.3 70B
Realtime
WebSocket + Deepgram
Frontend
Next.js 16, React 19
Styling
Tailwind CSS 4
