Todo mundo viu o vídeo acima: Rick Rashid, Chief Research Officer da Microsoft, apresentando a tecnologia de reconhecimento de voz e tradução da empresa.
Por si só já é um avanço e tanto, em alguns casos a precisão passa de 90%, em outros menos, e o que torna a tecnologia real é justamente podermos ver os erros, acontecendo ao vivo. Só que mesmo a capacidade de reconhecer texto ditado em tempo real não é o “impressionante”.
O melhor não é nem quando Rick aciona a tradução para chinês, e o sistema passa a além de mostrar o texto em inglês, exibir a tradução.
O pulo do gato é que a tecnologia deles exige treinamento, que nem os Via Voices de antigamente. Parece um retrocesso, mas com isso o sistema decompõe o áudio em fonemas básicos, tipo aquelas letras esquisitas em dicionários: (n-fthfl)