Visor de transcrições

O visor de transcrições é o espaço de trabalho do auditor. Combina reprodução de áudio, transcrição segmentada por falante, análise emocional, busca dentro do texto e avaliação qualitativa do perfil de cada interlocutor.

Visor de transcrições com segmentos de falantes, emoções e player de áudio

Abrir o visor

Do Dashboard → cartão Ver seu histórico.
Na lista de tarefas, filtre por Completada e clique na linha ou no ID.
O visor abre na aba Transcrição.

informação

URL direta

Se você conhece o task_uuid, acesse direto /transcription/{task_uuid}.

Anatomia

Zona	Conteúdo
Cabeçalho	Breadcrumb `Dashboard > Transcription`, toggle Modo avançado, avatar
Coluna esquerda	Segmentos do operador (agente)
Coluna direita	Segmentos do cliente
Player	Play/pause, velocidade, scrubber, download
Painel lateral	Toggles para Buscar palavras e Avaliar perfil do falante

dica

Dupla coluna

A diarização divide a conversa em duas colunas para que a leitura seja como um chat. Cada mensagem inclui timestamp e ícone de emoção.

Segmentos e diarização

Cada segmento mostra:

Elemento	Descrição
Falante	Falante 00 (operador) e Falante 01 (cliente) por convenção — renomeável
Timestamp	Início e fim do segmento (ex.: `0m 34.62s - 0m 39.28s`)
Texto transcrito	Saída do Whisper/Deepgram/OpenAI
Indicador de emoção	Rótulo visual que reflete o sentimento dominante
Copiar	Icone para copiar o texto

Renomear falantes

Clique em Falante 00 ou Falante 01 para atribuir nomes descritivos — "Agente María", "Cliente", "Supervisor". As mudanças persistem e se aplicam às exportações.

Timestamps clicáveis

Qualquer timestamp reproduz o áudio a partir daquele instante. O segmento em reprodução é destacado com borda luminosa para você acompanhar.

Player de áudio

Persistente na base do visor:

Controle	Ação
Play / Pause	—
-10s / +10s	Saltos rápidos
Scrubber	Navegação visual
Volume	Slider 0–100
Velocidade	0,5× / 0,75× / 1× / 1,25× / 1,5× / 2×
Download	Baixa o arquivo original (requer permissão)

informação

O arquivo fonte é servido pelo MinIO via URL assinada de vida curta (≤5 min) para evitar exposição indevida.

Análise de emoções por segmento

Cada segmento mostra um indicador visual representando a emoção dominante:

Emoção	Indicador na tela	Interpretação típica
Alegria	Estado positivo	Satisfação, entusiasmo
Neutra	Estado neutro	Tom informativo
Surpresa	Estado de surpresa	Novidade, estranheza
Tristeza	Estado de tristeza	Decepção, frustração leve
Raiva	Estado de raiva	Frustração forte
Medo	Estado de preocupação	Preocupação
Nojo	Estado de rejeição	Rejeição, desconforto

dica

Passe o mouse sobre qualquer indicador para ver o detalhe (probabilidades de cada classe). Veja Análise de sentimento.

Busca de palavras dentro do áudio

O painel lateral Buscar palavras permite detectar termos específicos e localizá-los na transcrição.

Fluxo

Digite uma palavra e confirme com Enter ou ✓.
Edite qualquer termo com o ícone de edição ou apague com o ícone de exclusão.
Clique em Buscar.
O sistema destaca os matches diretamente nos segmentos.

Legenda dos resultados

Ícone	Significado
Sim	Palavra encontrada
Obrigatoria nao encontrada	Palavra obrigatoria nao encontrada
Opcional nao mencionada	Palavra opcional nao mencionada

dica

Uso em compliance

Para auditorias regulatórias, carregue a lista de frases obrigatórias (saudação, encerramento, disclaimers legais) e o visor marca se algo faltou.

Avaliação do perfil do falante

Ao lado da busca, o painel inclui Avaliar perfil do falante. Gere um resumo qualitativo de cada interlocutor a partir de todos os seus segmentos.

Painel de avaliação do perfil do falante

Como funciona

Abas: Falante 00 / Falante 01 (ou os nomes que você atribuiu).
Clique na aba do interlocutor.
O modelo GPT gera um resumo de comportamento — estilo, tom, profissionalismo, empatia, clareza.
Use o botao de copiar para copiar a avaliacao.

Casos de uso

Coaching: feedback objetivo para o agente.
Compliance: evidência de que o script foi seguido.
Contratações: perfilar candidatos em entrevistas gravadas.
Reclamações: resumir a postura de cada parte em segundos.

Ações sobre a tarefa

Conforme suas permissões, você pode disparar:

Ação	Descrição	Permissão
Aprovar	Marcar auditoria como ok	Supervisor, Qualidade
Rejeitar	Marcar auditoria como reprovada	Supervisor, Qualidade
Editar transcrição	Corrigir erros do modelo	Qualidade, Admin
Exportar	Baixar em TXT/JSON/CSV	Todos
Reprocessar	Rodar com outro engine	Admin
Arquivar	Mover para arquivo histórico	Supervisor
Compartilhar	Gerar URL assinada (TTL configurável)	Supervisor, Admin

aviso

Auditoria

Toda edição fica registrada no histórico da tarefa (quem, o quê, quando). A edição não modifica o áudio original.

Exportar

Formato	Conteúdo
TXT	Apenas transcrição plana
JSON	Transcrição + metadata completa (timestamps, emoções, tags, pontuação)
CSV	Uma linha por segmento, ideal para Excel
PDF	Relatório formatado com capa, transcrição e análise
SRT/VTT	Legendas com timestamps

Troubleshooting

Problema	Diagnóstico	Solução
Segmentos fora de sincronia com o áudio	VBR ou header corrompido	Re-encode com `ffmpeg -i in.mp3 -b:a 192k out.mp3`
Diarização mistura falantes	Mono com muita sobreposição	Tente transcrição estéreo
Nomes próprios errados	Vocabulário fora do treinamento	Adicione termos ao dicionário do tenant
Não vejo o botão Aprovar	Falta de permissão	Solicite papel Qualidade ou Supervisor ao admin

Abrir o visor​

Anatomia​

Segmentos e diarização​

Renomear falantes​

Timestamps clicáveis​

Player de áudio​

Análise de emoções por segmento​

Busca de palavras dentro do áudio​

Fluxo​

Legenda dos resultados​

Avaliação do perfil do falante​

Como funciona​

Casos de uso​

Ações sobre a tarefa​

Exportar​

Troubleshooting​

Próximos passos​

Abrir o visor

Anatomia

Segmentos e diarização

Renomear falantes

Timestamps clicáveis

Player de áudio

Análise de emoções por segmento

Busca de palavras dentro do áudio

Fluxo

Legenda dos resultados

Avaliação do perfil do falante

Como funciona

Casos de uso

Ações sobre a tarefa

Exportar

Troubleshooting

Próximos passos