Amazon Pollyで遊んでみた - 野木村さなえ

※2018年7月23日の状況です

AWS（アマゾンウェブサービス）でアカウントを作成し、
（クレジットカード情報の入力と、電話での認証が必要です）
ログインすると、まあいろんなことが出来るのねーって画面が表示されます。
「メニュー」の「サービス」から、「機械学習」項目の「Amazon Polly」を選択します。

テキストをどのくらい流暢に読上げてくれるのかしら

「テキスト読上げ機能」を試します。

「プレーンテキスト」のエディタに文字を入力し、
音声を2種類「Mizuki,女性」「Takumi,男性」から選び「音声を聴く」
「MP3のダウンロード」というボタンを押してダウンロードした音声がこちら

Takumi,男性

Mizuki,女性

ここまでは、あっそ　といった程度です。

次に
「SSML」を試してみました。
音声合成マークアップ言語、SSMLタグを使用すると、発音、音量、ピッチ、話す速度など、音声のさまざまな要素をカスタマイズして制御できます。

SSMLタグの一覧

一時停止の追加　<break>
単語を強調する　<emphasis>
特定の単語に別の言語を指定する　<lang>
テキストにカスタムタグを配置する　<mark>
段落間に一時停止を追加する　<p>
発音記号を使用する　<phoneme>
音量、話す速度、ピッチを制御する　<prosody>
文章間に一時停止を追加する　<s>
特殊なタイプの単語の発声方法を制御する　<say-as>
SSML 拡張テキストの特定　<speak>
頭字語や略語の発音　<sub>
品詞を指定して発音を向上させる　<w>
呼吸音　<amazon:auto-breaths>
ダイナミックレンジ圧縮を追加する　<amazon:effect name="drc">
柔らかく発声する　<amazon:effect phonation="soft">
声質の制御　<amazon:effect vocal-tract-length>
ウィスパー　<amazon:effect name="whispered">

<speak>
……やッ……<break time="3s"/>院長さんですか。<emphasis level="strong">どうもお邪魔します。</emphasis>
　<prosody volume="loud">ええ。早速ですが</prosody> 私の精神状態も、<prosody rate="x-slow">御蔭様でヤット</prosody>回復致しましたから、<amazon:breath duration="medium" volume="x-loud"/>今日限り退院さして頂こうと思いまして、実は御相談に参りました次第ですが……<amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/>どうも永々御厄介に相成りまして、何とも御礼の申上げようがありません。<amazon:effect name="whispered">……ええ。それから入院料の方は、自宅へ帰りましてから早速、お届けする事に致したいと</amazon:effect> 思いますが……。
</speak>

おもしろいじゃん

テキストは、青空文庫よりお借りしました。
https://www.aozora.gr.jp/cards/000096/files/2231_22251.html