Pular para o conteúdo principal

Visor de transcrições

O visor de transcrições é o espaço de trabalho do auditor. Combina reprodução de áudio, transcrição segmentada por falante, análise emocional, busca dentro do texto e avaliação qualitativa do perfil de cada interlocutor.

Visor de transcrições com segmentos de falantes, emoções e player de áudio

Abrir o visor

  1. Do Dashboard → cartão Ver seu histórico.
  2. Na lista de tarefas, filtre por Completada e clique na linha ou no ID.
  3. O visor abre na aba Transcrição.
informação

URL direta

Se você conhece o task_uuid, acesse direto /transcription/{task_uuid}.

Anatomia

ZonaConteúdo
CabeçalhoBreadcrumb Dashboard > Transcription, toggle Modo avançado, avatar
Coluna esquerdaSegmentos do operador (agente)
Coluna direitaSegmentos do cliente
PlayerPlay/pause, velocidade, scrubber, download
Painel lateralToggles para Buscar palavras e Avaliar perfil do falante
dica

Dupla coluna

A diarização divide a conversa em duas colunas para que a leitura seja como um chat. Cada mensagem inclui timestamp e ícone de emoção.

Segmentos e diarização

Cada segmento mostra:

ElementoDescrição
FalanteFalante 00 (operador) e Falante 01 (cliente) por convenção — renomeável
TimestampInício e fim do segmento (ex.: 0m 34.62s - 0m 39.28s)
Texto transcritoSaída do Whisper/Deepgram/OpenAI
Indicador de emoçãoRótulo visual que reflete o sentimento dominante
CopiarIcone para copiar o texto

Renomear falantes

Clique em Falante 00 ou Falante 01 para atribuir nomes descritivos — "Agente María", "Cliente", "Supervisor". As mudanças persistem e se aplicam às exportações.

Timestamps clicáveis

Qualquer timestamp reproduz o áudio a partir daquele instante. O segmento em reprodução é destacado com borda luminosa para você acompanhar.

Player de áudio

Persistente na base do visor:

ControleAção
Play / Pause
-10s / +10sSaltos rápidos
ScrubberNavegação visual
VolumeSlider 0–100
Velocidade0,5× / 0,75× / 1× / 1,25× / 1,5× / 2×
DownloadBaixa o arquivo original (requer permissão)
informação

O arquivo fonte é servido pelo MinIO via URL assinada de vida curta (≤5 min) para evitar exposição indevida.

Análise de emoções por segmento

Cada segmento mostra um indicador visual representando a emoção dominante:

EmoçãoIndicador na telaInterpretação típica
AlegriaEstado positivoSatisfação, entusiasmo
NeutraEstado neutroTom informativo
SurpresaEstado de surpresaNovidade, estranheza
TristezaEstado de tristezaDecepção, frustração leve
RaivaEstado de raivaFrustração forte
MedoEstado de preocupaçãoPreocupação
NojoEstado de rejeiçãoRejeição, desconforto
dica

Passe o mouse sobre qualquer indicador para ver o detalhe (probabilidades de cada classe). Veja Análise de sentimento.

Busca de palavras dentro do áudio

O painel lateral Buscar palavras permite detectar termos específicos e localizá-los na transcrição.

Painel de busca de palavras com lista editável

Fluxo

  1. Digite uma palavra e confirme com Enter ou ✓.
  2. Edite qualquer termo com o ícone de edição ou apague com o ícone de exclusão.
  3. Clique em Buscar.
  4. O sistema destaca os matches diretamente nos segmentos.

Resultado de busca de palavras com matches e não-matches

Legenda dos resultados

ÍconeSignificado
SimPalavra encontrada
Obrigatoria nao encontradaPalavra obrigatoria nao encontrada
Opcional nao mencionadaPalavra opcional nao mencionada
dica

Uso em compliance

Para auditorias regulatórias, carregue a lista de frases obrigatórias (saudação, encerramento, disclaimers legais) e o visor marca se algo faltou.

Avaliação do perfil do falante

Ao lado da busca, o painel inclui Avaliar perfil do falante. Gere um resumo qualitativo de cada interlocutor a partir de todos os seus segmentos.

Painel de avaliação do perfil do falante

Como funciona

  1. Abas: Falante 00 / Falante 01 (ou os nomes que você atribuiu).
  2. Clique na aba do interlocutor.
  3. O modelo GPT gera um resumo de comportamento — estilo, tom, profissionalismo, empatia, clareza.
  4. Use o botao de copiar para copiar a avaliacao.

Casos de uso

  • Coaching: feedback objetivo para o agente.
  • Compliance: evidência de que o script foi seguido.
  • Contratações: perfilar candidatos em entrevistas gravadas.
  • Reclamações: resumir a postura de cada parte em segundos.

Ações sobre a tarefa

Conforme suas permissões, você pode disparar:

AçãoDescriçãoPermissão
AprovarMarcar auditoria como okSupervisor, Qualidade
RejeitarMarcar auditoria como reprovadaSupervisor, Qualidade
Editar transcriçãoCorrigir erros do modeloQualidade, Admin
ExportarBaixar em TXT/JSON/CSVTodos
ReprocessarRodar com outro engineAdmin
ArquivarMover para arquivo históricoSupervisor
CompartilharGerar URL assinada (TTL configurável)Supervisor, Admin
aviso

Auditoria

Toda edição fica registrada no histórico da tarefa (quem, o quê, quando). A edição não modifica o áudio original.

Exportar

FormatoConteúdo
TXTApenas transcrição plana
JSONTranscrição + metadata completa (timestamps, emoções, tags, pontuação)
CSVUma linha por segmento, ideal para Excel
PDFRelatório formatado com capa, transcrição e análise
SRT/VTTLegendas com timestamps

Troubleshooting

ProblemaDiagnósticoSolução
Segmentos fora de sincronia com o áudioVBR ou header corrompidoRe-encode com ffmpeg -i in.mp3 -b:a 192k out.mp3
Diarização mistura falantesMono com muita sobreposiçãoTente transcrição estéreo
Nomes próprios erradosVocabulário fora do treinamentoAdicione termos ao dicionário do tenant
Não vejo o botão AprovarFalta de permissãoSolicite papel Qualidade ou Supervisor ao admin

Próximos passos