※2018年7月23日の状況です
AWS(アマゾンウェブサービス)でアカウントを作成し、
(クレジットカード情報の入力と、電話での認証が必要です)
ログインすると、まあいろんなことが出来るのねーって画面が表示されます。
「メニュー」の「サービス」から、「機械学習」項目の「Amazon Polly」を選択します。
テキストをどのくらい流暢に読上げてくれるのかしら
「テキスト読上げ機能」を試します。
「プレーンテキスト」のエディタに文字を入力し、
音声を2種類「Mizuki,女性」「Takumi,男性」から選び「音声を聴く」
「MP3のダウンロード」というボタンを押してダウンロードした音声がこちら
Takumi,男性
Mizuki,女性
ここまでは、あっそ といった程度です。
次に
「SSML」を試してみました。
音声合成マークアップ言語、SSMLタグを使用すると、発音、音量、ピッチ、話す速度など、音声のさまざまな要素をカスタマイズして制御できます。
SSMLタグの一覧
一時停止の追加 <break> 単語を強調する <emphasis> 特定の単語に別の言語を指定する <lang> テキストにカスタムタグを配置する <mark> 段落間に一時停止を追加する <p> 発音記号を使用する <phoneme> 音量、話す速度、ピッチを制御する <prosody> 文章間に一時停止を追加する <s> 特殊なタイプの単語の発声方法を制御する <say-as> SSML 拡張テキストの特定 <speak> 頭字語や略語の発音 <sub> 品詞を指定して発音を向上させる <w> 呼吸音 <amazon:auto-breaths> ダイナミックレンジ圧縮を追加する <amazon:effect name="drc"> 柔らかく発声する <amazon:effect phonation="soft"> 声質の制御 <amazon:effect vocal-tract-length> ウィスパー <amazon:effect name="whispered">
<speak> ……やッ……<break time="3s"/>院長さんですか。<emphasis level="strong">どうもお邪魔します。</emphasis> <prosody volume="loud">ええ。早速ですが</prosody> 私の精神状態も、<prosody rate="x-slow">御蔭様でヤット</prosody>回復致しましたから、<amazon:breath duration="medium" volume="x-loud"/>今日限り退院さして頂こうと思いまして、実は御相談に参りました次第ですが……<amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/><amazon:breath duration="medium" volume="x-loud"/>どうも永々御厄介に相成りまして、何とも御礼の申上げようがありません。<amazon:effect name="whispered">……ええ。それから入院料の方は、自宅へ帰りましてから早速、お届けする事に致したいと</amazon:effect> 思いますが……。 </speak>
おもしろいじゃん
テキストは、青空文庫よりお借りしました。
https://www.aozora.gr.jp/cards/000096/files/2231_22251.html