Campinas, 30 de janeiro de 2025 - Transformar textos em voz natural, fluida, e com variações de entonação de acordo com a situação - como acontece com a voz humana. Esse é o principal diferencial da nova solução de síntese de voz neural do CPQD - o Texto Fala Neural -, que está disponível para call centers e empresas que desejam oferecer aos seus clientes uma interação digital com voz humanizada.
“A síntese de voz neural vem sendo amplamente utilizada em bots e aplicativos que exigem alta qualidade e naturalidade”, afirma Fátima Olmos, gerente de produto do CPQD. “Já a síntese de voz padrão continua sendo uma opção em contextos em que a simplicidade e eficiência são prioritárias.”
Com o Texto Fala, o CPQD foi pioneiro no lançamento de uma solução de síntese de voz totalmente desenvolvida no país, em português falado no Brasil. Essa versão padrão da síntese de voz utiliza unidades de áudio pré-gravadas que são concatenadas para formar palavras e frases - técnica que apresenta limitações em relação à naturalidade da fala, especialmente no que diz respeito à fluidez, entonação e ritmo.
Na síntese de voz neural, utilizando redes neurais avançadas, é possível gerar falas mais naturais, fluidas e de alta qualidade. “As redes neurais podem aprender nuances de entonação, pausas e variações de tom, a partir de grandes volumes de dados de áudio, o que permite a adaptação dinâmica da voz a condições diversas”, explica Fátima. “Outra vantagem dessa tecnologia é a flexibilidade e escalabilidade, uma vez que modelos neurais podem ser treinados para múltiplas vozes, estilos de fala, sotaques regionais, vozes personalizadas que representam a marca do cliente e até idiomas, com menor esforço de gravação em comparação à síntese de voz padrão”.
Em função dessas características, Fátima ressalta que a síntese de voz neural é indicada para uso em assistentes virtuais avançados, audiolivros e outras aplicações em que a voz mais humana é um fator importante para a experiência do usuário - como em tecnologias assistivas e interações personalizadas. Esse é o foco das duas empresas que já adotaram o Texto Fala Neural do CPQD: Digital Tech, especializada no desenvolvimento de software para atendimento digital humanizado, e SinergyTech, que também vem investindo em agentes digitais que oferecem conexões reais e mais humanizadas.
Já o Texto Fala baseado em síntese de voz padrão é uma opção indicada para aplicações que não exigem naturalidade na interação, como respostas automáticas em sistemas de atendimento telefônico ou GPS. Mais informações e detalhes da comparação entre as duas tecnologias estão disponíveis no link Notícia distribuída pela saladanoticia.com.br. A Plataforma e Veículo não são responsáveis pelo conteúdo publicado, estes são assumidos pelo Autor(a):
PEDRO HENRIQUE DE CARVALHO CASSIANO
[email protected]