Visor de transcrições
O visor de transcrições é o espaço de trabalho do auditor. Combina reprodução de áudio, transcrição segmentada por falante, análise emocional, busca dentro do texto e avaliação qualitativa do perfil de cada interlocutor.

Abrir o visor
- Do Dashboard → cartão Ver seu histórico.
- Na lista de tarefas, filtre por Completada e clique na linha ou no ID.
- O visor abre na aba Transcrição.
URL direta
Se você conhece o task_uuid, acesse direto /transcription/{task_uuid}.
Anatomia
| Zona | Conteúdo |
|---|---|
| Cabeçalho | Breadcrumb Dashboard > Transcription, toggle Modo avançado, avatar |
| Coluna esquerda | Segmentos do operador (agente) |
| Coluna direita | Segmentos do cliente |
| Player | Play/pause, velocidade, scrubber, download |
| Painel lateral | Toggles para Buscar palavras e Avaliar perfil do falante |
Dupla coluna
A diarização divide a conversa em duas colunas para que a leitura seja como um chat. Cada mensagem inclui timestamp e ícone de emoção.
Segmentos e diarização
Cada segmento mostra:
| Elemento | Descrição |
|---|---|
| Falante | Falante 00 (operador) e Falante 01 (cliente) por convenção — renomeável |
| Timestamp | Início e fim do segmento (ex.: 0m 34.62s - 0m 39.28s) |
| Texto transcrito | Saída do Whisper/Deepgram/OpenAI |
| Indicador de emoção | Rótulo visual que reflete o sentimento dominante |
| Copiar | Icone para copiar o texto |
Renomear falantes
Clique em Falante 00 ou Falante 01 para atribuir nomes descritivos — "Agente María", "Cliente", "Supervisor". As mudanças persistem e se aplicam às exportações.
Timestamps clicáveis
Qualquer timestamp reproduz o áudio a partir daquele instante. O segmento em reprodução é destacado com borda luminosa para você acompanhar.
Player de áudio
Persistente na base do visor:
| Controle | Ação |
|---|---|
| Play / Pause | — |
| -10s / +10s | Saltos rápidos |
| Scrubber | Navegação visual |
| Volume | Slider 0–100 |
| Velocidade | 0,5× / 0,75× / 1× / 1,25× / 1,5× / 2× |
| Download | Baixa o arquivo original (requer permissão) |
O arquivo fonte é servido pelo MinIO via URL assinada de vida curta (≤5 min) para evitar exposição indevida.
Análise de emoções por segmento
Cada segmento mostra um indicador visual representando a emoção dominante:
| Emoção | Indicador na tela | Interpretação típica |
|---|---|---|
| Alegria | Estado positivo | Satisfação, entusiasmo |
| Neutra | Estado neutro | Tom informativo |
| Surpresa | Estado de surpresa | Novidade, estranheza |
| Tristeza | Estado de tristeza | Decepção, frustração leve |
| Raiva | Estado de raiva | Frustração forte |
| Medo | Estado de preocupação | Preocupação |
| Nojo | Estado de rejeição | Rejeição, desconforto |
Passe o mouse sobre qualquer indicador para ver o detalhe (probabilidades de cada classe). Veja Análise de sentimento.
Busca de palavras dentro do áudio
O painel lateral Buscar palavras permite detectar termos específicos e localizá-los na transcrição.

Fluxo
- Digite uma palavra e confirme com
Enterou ✓. - Edite qualquer termo com o ícone de edição ou apague com o ícone de exclusão.
- Clique em Buscar.
- O sistema destaca os matches diretamente nos segmentos.

Legenda dos resultados
| Ícone | Significado |
|---|---|
| Sim | Palavra encontrada |
| Obrigatoria nao encontrada | Palavra obrigatoria nao encontrada |
| Opcional nao mencionada | Palavra opcional nao mencionada |
Uso em compliance
Para auditorias regulatórias, carregue a lista de frases obrigatórias (saudação, encerramento, disclaimers legais) e o visor marca se algo faltou.
Avaliação do perfil do falante
Ao lado da busca, o painel inclui Avaliar perfil do falante. Gere um resumo qualitativo de cada interlocutor a partir de todos os seus segmentos.

Como funciona
- Abas: Falante 00 / Falante 01 (ou os nomes que você atribuiu).
- Clique na aba do interlocutor.
- O modelo GPT gera um resumo de comportamento — estilo, tom, profissionalismo, empatia, clareza.
- Use o botao de copiar para copiar a avaliacao.
Casos de uso
- Coaching: feedback objetivo para o agente.
- Compliance: evidência de que o script foi seguido.
- Contratações: perfilar candidatos em entrevistas gravadas.
- Reclamações: resumir a postura de cada parte em segundos.
Ações sobre a tarefa
Conforme suas permissões, você pode disparar:
| Ação | Descrição | Permissão |
|---|---|---|
| Aprovar | Marcar auditoria como ok | Supervisor, Qualidade |
| Rejeitar | Marcar auditoria como reprovada | Supervisor, Qualidade |
| Editar transcrição | Corrigir erros do modelo | Qualidade, Admin |
| Exportar | Baixar em TXT/JSON/CSV | Todos |
| Reprocessar | Rodar com outro engine | Admin |
| Arquivar | Mover para arquivo histórico | Supervisor |
| Compartilhar | Gerar URL assinada (TTL configurável) | Supervisor, Admin |
Auditoria
Toda edição fica registrada no histórico da tarefa (quem, o quê, quando). A edição não modifica o áudio original.
Exportar
| Formato | Conteúdo |
|---|---|
| TXT | Apenas transcrição plana |
| JSON | Transcrição + metadata completa (timestamps, emoções, tags, pontuação) |
| CSV | Uma linha por segmento, ideal para Excel |
| Relatório formatado com capa, transcrição e análise | |
| SRT/VTT | Legendas com timestamps |
Troubleshooting
| Problema | Diagnóstico | Solução |
|---|---|---|
| Segmentos fora de sincronia com o áudio | VBR ou header corrompido | Re-encode com ffmpeg -i in.mp3 -b:a 192k out.mp3 |
| Diarização mistura falantes | Mono com muita sobreposição | Tente transcrição estéreo |
| Nomes próprios errados | Vocabulário fora do treinamento | Adicione termos ao dicionário do tenant |
| Não vejo o botão Aprovar | Falta de permissão | Solicite papel Qualidade ou Supervisor ao admin |