回答:
AlexaはSSMLをサポートしています。SSMLは、XMLのような音声用のマークアップ言語です。サービスからプレーンテキストを返す代わりに、SSML応答を使用できます。<phoneme>
タグは、あなたが特に必要なものです:
音素
含まれているテキストの音素/音声発音を提供します。たとえば、人々は「ピーカン」のような単語を別の方法で発音する場合があります。
英語の単語(特に米国英語)の場合、Alexaは正しい発音の発音を与えれば、どの単語も発音できるはずです。
次の表に、音素タグで使用できるサポートされている記号を示します。これらの記号は、米国英語の音を完全にカバーしています。英語以外の多くの言語では、このリストに含まれていない記号を使用する必要がありますが、これらはサポートされていません。このリストに含まれていない記号を使用すると、音声合成が最適化されない可能性があるため、お勧めしません。
SSMLに関するAmazonドキュメントからの引用。
Alexaに特定の発音を与える例を次に示します。
<speak>
<phoneme alphabet="ipa" ph="hɛˈləʊ̯">Hello</phoneme>.
<phoneme alphabet="ipa" ph="bɔ̃.ˈʒuʁ">Bonjour</phoneme>.
</speak>
この<phoneme>
タグは、IPAおよびX-SAMPAの音声アルファベットをサポートしています。通常は、ウィクショナリーまたはGoogleを介して任意の単語のIPAスペルを検索できます。
メッセージが長い場合は、<audio>
タグを使用してカスタム音声を録音するのが最善の方法です。
オーディオタグを使用すると、Alexaサービスが応答のレンダリング中に再生できるMP3ファイルのURLを提供できます。これを使用して、事前に録音された短い音声をサービスの応答に埋め込むことができます。たとえば、音声合成の応答の横に効果音を含めたり、ブランドに関連付けられた音声を使用して応答を提供したりできます。
のAmazonドキュメントから引用<audio>
。