TTS Amazon Polly

Esse recurso está disponível à partir da versão 6.19.

Esse recurso não vem habilitado após a atualização para uma versão igual ou superior a 6.19 . É preciso solicitar a habilitação desse recurso ao time Evolux, através do e-mail suporte@evolux.net.br.

Para a utilização desse recurso é necessário possuir uma conta na Amazon AWS, para saber mais clique aqui: https://docs.aws.amazon.com/pt_br/polly/latest/dg/setting-up.html

A Amazon Polly torna a sintetização do áudio mais fiel à voz humana, sendo possível ajustar o estilo de fala, a taxa de fala, o tom e a sua intensidade. Além disso, é possível definir como serão lidos os números do texto, se em forma de data, hora, fração, número inteiro, entre outros. Esse recurso visa otimizar ainda mais a sua operação, além de tornar a criação de áudios mais fácil, ele vai possibilitar também uma melhor compreensão da mensagem pelo seu cliente.

Na página inicial do Evolux, selecione o menu de Monitoramento > Áudio. Selecione o botão Sintetizar Áudio e escolha o nome do áudio, e no campo de texto você deverá escrever o texto que será sintetizado e os comandos que desejar para melhor reprodução do áudio.

A partir da versão 6.34 é possível escolher entre os três tipos de vozes disponíveis para reprodução do áudio, assim como escolher a pronúncia (padrão e neural), estas não estão disponíveis para todas as três vozes.

 

Logo abaixo é possível ver alguns exemplos de códigos que podem ser utilizados na sua sintetização de áudio. Para ter acesso aos demais recursos acesse a documentação da Amazon Polly.

  • Recurso 1 - Velocidade de Reprodução de Áudio

É possível reproduzir cinco velocidades de áudio (x-slow, slow, medium, fast e x-fast), sendo o medium a velocidade normal da voz. Para isso, é necessário utilizar o seguinte código na caixa de texto do TTS:

<speak> <prosody rate = "slow"> Digite o seu texto aqui. </prosody> </speak>

Caso, deseje modificar a velocidade, é só trocar a palavra "slow" que está no código acima, pela velocidade desejada (x-slow, slow, medium, fast e x-fast).

Exemplos:

Reprodução lenta (slow)

<speak> <prosody rate = "slow"> Olá, seja bem vindo ao Evolux. Como posso ajudá-lo? </prosody> </speak>

Ouça aqui: Slow.wav

Reprodução rápida (fast)

<speak> <prosody rate = "fast"> Olá, seja bem vindo ao Evolux. Como posso ajudá-lo? </prosody> </speak>

Ouça aqui: Fast.wav

  • Recurso 2 - Leitura de datas

O Amazon Polly permite fazer a leitura dos números de diversas formas, uma delas é a de data. Para isso é necessário a utilização do código abaixo na caixa de TTS em configurações de Áudio.

<speak> Hoje é <say-as interpret-as="date" format="dm" >dia/mês</say-as></speak>

Os números precisam estar separados por "/", sendo o primeiro número a ser lido o dia e o segundo o mês.

Exemplo:

<speak> Hoje é <say-as interpret-as="date" format="dm" > 30/08 </say-as></speak>

Ouça aqui: Data.wav

 

  • Recurso 3 - Ênfase em palavra

É possível enfatizar alguma palavra em uma frase, para isso, cole o código na caixa do texto TTS em configurações de áudios e faça as modificações necessárias de acordo com o que deseja:

<speak> Texto Inicial <emphasis level="strong"> Palavra com ênfase. </emphasis> </speak>

Exemplo:

<speak> Olá,<emphasis level="strong"> seja bem-vindo ao Evolux!</emphasis> Como podemos te ajudar? </speak>

Ouça aqui: Ênfase.wav

  • Recurso 4 - Tempo máximo para reprodução do texto

Esse recurso permite que você defina um tempo máximo para a reprodução do texto. Se o texto, na velocidade normal, for muito grande para ser lido dentro do  tempo estipulado. O sistema irá acelerar a velocidade de reprodução, para que fique no tempo definido. Caso ocorra o contrário, ou seja, o texto ser lido em menor tempo do que o estipulado, a velocidade continuará a mesma, o texto não será lido de forma mais lenta.

Para isso, modifique no código o segundos que deseja que seja reproduzido o texto:

<speak><prosody amazon:max-duration="10s"> Digite o seu texto aqui. </prosody></speak>

Exemplo:

Reprodução em até 10 segundos

<speak><prosody amazon:max-duration="10s"> Prezado cliente, o nosso horário de atendimento é de segunda à sexta das 8 às 18h. A Evolux agradece a sua ligação</prosody></speak>

Ouça aqui: Tempo normal de reprodução.wav

 

Reprodução em até 5 segundos

<speak><prosody amazon:max-duration="5s"> Prezado cliente, o nosso horário de atendimento é de segunda à sexta das 8 às 18h. A Evolux agradece a sua ligação</prosody></speak>

Ouça aqui: Reprodução em 5s.wav

  • Recurso 5 - Pausas entre frases

Esse recurso permite adicionar uma pausa entre uma frase e outra durante a reprodução do áudio. Ainda é possível escolher o tempo (segundo ou milissegundo) do tamanho dessa pausa. Para isso, utilize o código abaixo:

<speak> Frase 01 <break time=“2s”/> Frase 02 </speak>

Exemplo:

<speak> Olá, seja bem-vindo ao Evolux.<break time="2s"/> Como posso ajudá-lo?</speak>

Ouça aqui: Pausa entre frases.wav