Amazon Pollyで遊んでみた

※2018年7月23日の状況です

AWS(アマゾンウェブサービス)でアカウントを作成し、
(クレジットカード情報の入力と、電話での認証が必要です)
ログインすると、まあいろんなことが出来るのねーって画面が表示されます。
「メニュー」の「サービス」から、「機械学習」項目の「Amazon Polly」を選択します。

テキストをどのくらい流暢に読上げてくれるのかしら

「テキスト読上げ機能」を試します。

「プレーンテキスト」のエディタに文字を入力し、
音声を2種類「Mizuki,女性」「Takumi,男性」から選び「音声を聴く」
「MP3のダウンロード」というボタンを押してダウンロードした音声がこちら

Takumi,男性

Mizuki,女性

ここまでは、あっそ といった程度です。

次に
「SSML」を試してみました。
音声合成マークアップ言語、SSMLタグを使用すると、発音、音量、ピッチ、話す速度など、音声のさまざまな要素をカスタマイズして制御できます。

SSMLタグの一覧

一時停止の追加 <break>
単語を強調する <emphasis>
特定の単語に別の言語を指定する <lang>
テキストにカスタムタグを配置する <mark>
段落間に一時停止を追加する <p>
発音記号を使用する <phoneme>
音量、話す速度、ピッチを制御する <prosody>
文章間に一時停止を追加する <s>
特殊なタイプの単語の発声方法を制御する <say-as>
SSML 拡張テキストの特定 <speak>
頭字語や略語の発音 <sub>
品詞を指定して発音を向上させる <w>
呼吸音 <amazon:auto-breaths>
ダイナミックレンジ圧縮を追加する <amazon:effect name="drc">
柔らかく発声する <amazon:effect phonation="soft">
声質の制御 <amazon:effect vocal-tract-length>
ウィスパー <amazon:effect name="whispered">
<speak>
……やッ……<break time="3s"/>院長さんですか。<emphasis level="strong">どうもお邪魔します。</emphasis>
 <prosody volume="loud">ええ。早速ですが</prosody> 私の精神状態も、<prosody rate="x-slow">御蔭様でヤット</prosody>回復致しましたから、<amazon:breath duration="medium" volume="x-loud"/>今日限り退院さして頂こうと思いまして、実は御相談に参りました次第ですが……<amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/>どうも永々御厄介に相成りまして、何とも御礼の申上げようがありません。<amazon:effect name="whispered">……ええ。それから入院料の方は、自宅へ帰りましてから早速、お届けする事に致したいと</amazon:effect> 思いますが……。
</speak>

おもしろいじゃん

テキストは、青空文庫よりお借りしました。
https://www.aozora.gr.jp/cards/000096/files/2231_22251.html