domingo, 29 de julho de 2018

A evolução de um transcritor de áudio



A evolução de um transcritor


A evolução de um transcritor vem com o tempo de experiência que ele vai acumulando em seu trabalho. Com a repetição da tarefa de digitar, o corpo começa a trabalhar sozinho, o corpo aprende a digitar. Também aprende a ouvir, começa a surgir uma misteriosa mas eficaz intuição ao ouvir as pessoas e parece que ganhamos o poder de adivinhar as próximas frases ditas pelos falantes. Neste artigo pretendo abordar os diferentes estágios de evolução pelo qual eu próprio passei. Então falarei de mim na primeira pessoa.
Este artigo contém 1.320 palavras aproximadamente e deve levar 7-8 minutos para ser lido.
Hora cheia e hora útil
Aqui acho importante chamar a sua atenção para o termo hora cheia e hora útil. Hora cheia é o período de 60 minutos efetivamente trabalhados, em que não largo o teclado. Hora útil é o período de 45 minutos em que não largo o trabalho, reservando 15 minutos para descanso. Portanto, a hora cheia tem 60 minutos e a hora útil tem 45 minutos de trabalho para 15 de descanso.
Transcritor iniciante
Quando comecei a acumular as primeiras horas de transcrição as horas parece que passavam rápido para o que eu conseguia digitar. Era um usuário do Pacote Office já há um bom tempo – usei muito Word e Excel na vida – era bom datilógrafo e sabia manejar o Windows Media Player.
Através das teclas Alt+Tab trocava as janelas do Word e do Windows Media Player para a cada vez digitar algumas palavras. O mouse acionava os botões stop, play e rexind, respectivamente parar, tocar e voltar, e o Alt+Tab me colocava de volta na tela do Word. Não sabia regular velocidade do Windows Media Player então o trabalho se arrastava lentamente.
Com a adoção de tão pouca tecnologia era natural que eu sofresse na hora de transcrever e produzisse algo em torno de 2 a 3 minutos por hora de trabalho nas primeiras transcrições.
Trabalhava 12 horas para receber por dia de trabalho para produzir decepcionantes 60 minutos transcritos e revisados. Minha produtividade era baixa e o nível de acertos girava em torno de 60-70%, o que me obrigava a revisar mais de uma vez o meu trabalho.
Converso com algumas pessoas eventualmente pelo Facebook e as pessoas me dizem anos depois que ainda gostariam de transcrever. Quando pergunto quais as ferramentas que eles usam, ainda estão parados no Windows Media Player pois conseguiram um emprego na época e pararam de transcrever. Agora, desempregados, voltam à atividade. Provavelmente na primeira oportunidade voltarão para o mercado de trabalho, pois não se ganha muito sendo freelancer em transcrição de áudio. Resultados parciais são alcançados para esforços parciais; teremos chance de ter uma recompensa quando cavamos a fundo. Existem minas de diamante com quilômetros de profundidade.
Resumindo a tecnologia utilizada, Word (editor de textos da Microsoft), Windows Media Player (Microsoft) e internet. Produtividade: 2-3 minutos por hora cheia de trabalho. Taxa de acertos 60-70% na transcrição.
Caso: a transcritora que copiava
Certa vez passou por mim uma pessoa muito boazinha mas que não era tão boa transcritora. Passei a dar feedbacks das minhas revisões colorindo os erros que ela estava cometendo de amarelo e de verde os acertos que estava promovendo. Ela errava bastante mas como era boa pessoa não conseguia suspender o serviço dela. Para a minha surpresa após esse feedback detalhado a transcrição dela passou por uma revolução, a qualidade subiu bastante. Intrigado fui perguntar e para a minha surpresa, a solução que ela achara foi a seguinte. Primeiro ela transcrevia a caneta (na mão) para depois digitar. Era um processo extremamente desgastante e pouco rentável mas a qualidade melhorou. Tempos depois ela sumiu e voltou anos mais tarde. Curioso perguntei que softwares estava usando para transcrever e a resposta foi "Windows Media Player, e Word. Com tanta inocência pedi que ela fizesse nosso curso de transcrição de áudio que oferecia na época antes de fazer o exame de reingresso. Ela nunca topou fazer o exame, mas ainda mantém boa relação comigo.
Transcritor pleno
O transcritor pleno já descobriu os benefícios do Express Scribe, um tocador de áudio da www.nch.com.au (NCH Software). Percebendo que é possível trabalhar sem precisar usar a tecla Alt+Tab para ficar intercalando janelas entre Word e Express Scribe, pois o whorkshop permite através das teclas F1-F12 tomar o comando das teclas play, pouse, stop, rewind, foward e outras tarefas como a marcação de minutos automática, minha produtividade passou de 2-3 minutos por hora cheia para 8-10 minutos por hora cheia. Foi uma revolução na minha vida de transcritor.
Ao mesmo tempo tomei contato com o conceito de expansor de texto – em inglês é text expander – em que ao digitar "vc, pex, aparecia "você. É o que fazemos ao mandar mensagens pelo celular, abreviamos tudo. O expansor de textos permitia atribuir palavras ou frases inteiras (assinaturas com negrito e tudo mais) acionando a sequência desejada de teclas.
Por exemplo, "oqqvq, eu uso para "o que é que você quer, economizando um bom número de toques. Com isso passei a digitar 40% menos e ganhei 20% de velocidade de digitação. Foi necessário gastar horas para cadastrar todos os atalhos para cada palavra recorrente que aparece em minhas transcrições, hoje estou na casa de 28. Mil atalhos cadastrados.
O resultado de toda essa tecnologia adicionada fez a velocidade de produção chegar a 15 minutos por hora cheia trabalhada. Durante um tempo o índice de erros piorou devido aos erros de cadastro de atalhos, mas subiu de modo geral para 70-80% de acertos.
Caso: tive que desinstalar o Windows e perdi os atalhos
Isso aconteceu comigo algumas vezes. O Windows andou muito instável nos primeiros meses das versões 7-8-10 e as reinstalações eram de certa forma frequentes. Existem pastas de arquivos DLL que podem ser copiadas para um pendrive para resguardar seus atalhos. Vale a pena pesquisar sobre isso, para se necessário reinstalar o Word novamente, ter essas DLLs salvas para copiar por cima da DLL reinstalada de modo a restaurar os atalhos.
Resumindo, o transcritor pleno, já munido com maior tecnologia embarcada em seu notebook – Express Scribe, Word e recursos de atalho manualmente adicionados – tem como recompensa uma digitação mais rápida e menor quantidade de erros por hora transcrita. Minha produtividade passou de 10-12 para 12-15 minutos por hora útil.
Transcrição sênior
Ao transcritor sênior já aconteceu de quase tudo, viu quase tudo o que pode aparecer de desafios na transcrição de áudio, desde áudios muito bons até áudios péssimos. Sua intuição de escuta aperfeiçoada durante anos de trabalho, a digitação mais leve, a descoberta de equipamentos novos que diminuem a fadiga (teclados mecânicos e pedais de transcritor) assim como a descoberta de funcionalidades interessantes tanto no Express Scribe como Word me elevaram a produção a 15-20 minutos por hora útil, ou seja a cada 45 minutos consigo realizar até 20 minutos de transcrição.
Os índices de acerto tem variado entre 85-92% na fase de transcrição, e o que uso hoje para transcrever inclusive o recurso de Digitação Por Voz do Google Docs – que muita gente chama de transcrição automática – e coleciono macros, recursos do Visual Basic para fazer AutoCorreções padrão necessárias para ajustar vários erros que o Google comete na hora de transcrever.
A tecnologia e o know how acumulados permitem hoje não ganhar mais dinheiro, mas sobrar mais tempo para continuar a pesquisar um assunto fascinante que parece que não tem fim: a transcrição automática vem ganhando poderosas ferramentas tanto no IOS quanto no Android e fico animado para o que vem pela frente.
Transcritor do futuro
cada vez mais a digitação estará relegado ao segundo plano. O avanço da transcrição automática e o aperfeiçoamento dos algoritmos de reconhecimento de fala reduziram significativamente o tempo de produção de uma transcrição de áudio, mas existe a contrapartida, aumentará o trabalho de revisão. Boa notícia para nós, que sempre nos esforçamos em revisar bem o material entregue ao cliente.

Nenhum comentário:

Postar um comentário

Exemplo de transcrição de áudio supereditada

A transcrição de áudio supereditada traz cortes e intervenções mais vigorosas do transcritor-revisor sobre o conteúdo do áudio a ser trans...