Transforme Audio em Texto com IA

Transcreva reunioes, aulas, entrevistas e qualquer conteudo de audio com precisao. Upload de arquivos, links do YouTube ou gravacao ao vivo.

Pipeline

Como funciona

Cada audio passa por 4 etapas automaticas, do input ate a transcricao final formatada.

Etapa 1

Captura de Audio

O audio e capturado via upload de arquivo, download de YouTube (yt-dlp), ou microfone do navegador via WebSocket.

Etapa 2

Speech-to-Text (Deepgram)

O audio e enviado para a API Deepgram Nova-3, que converte fala em texto com alta precisao, suportando multiplos idiomas.

Etapa 3

Transcricao Bruta

O texto bruto retornado pelo Deepgram e salvo. Inclui timestamps, duracao e metadados da fonte original.

Etapa 4

Processamento com IA (Groq)

O Llama 3.3 70B via Groq formata, organiza e limpa a transcricao. Voce pode customizar o prompt de processamento.

Speech-to-Text

Deepgram Nova-3

LLM

Groq Llama 3.3 70B

Realtime

WebSocket + Deepgram

Frontend

Next.js 16, React 19

Styling

Tailwind CSS 4