FC2ブログ


VS2017-はじめの1/10歩(2):多言語音声データを作る

   プログラミング [2019/02/20]
音声とは言うものの、「声」の方です。
主題のVS2017からいきなり離れます。

最近は音声合成/音声認識とかやたら聞く。
お金を払って使えるものもあるらしいけど、GoogleとかSiriとか普通にしゃべるし、
こっちが話した文言なんかかなりの正確さで文字にしてくれる。
Windows10にしたら、音声の案内も機能としてある。(ほぼ使ったことないけどね。)

以前、ナレーションをプロに頼んで録音/データ化してもらったことがあったが、
さもない内容なのに費用は結構掛かった。
で結局、「気に入らない声」だというお客の意見でその「声」はボツになった。

今は、さらに外人向けに数ヶ国語の「声」が必要な時代。
日本語→翻訳→ナレーターに読み上げさせて録音→組込み となるわけだが、
却下されるかもしれない「声」にお金を掛けてらんない。
かといって、訛りまくりの自分の声の録音では、さすがにデモにもならない。
英語他も絶対だめだしね。

簡単に多言語のナレーションを作る術(スベ)はないか調べてみた。

パソコンに喋らせて、それを録音することを考えた。
他国の言語は、カタコト、もしくはちょとくらい変でも、ネイティブでもなければ気付くまい。
それに、「機械がしゃべるんだからこんなもんですよ。あくまでもデモですから。」という言い訳が利きそうだ。

つまり、なんちゃって多言語音声合成
これだけでも、数回になりそうです。

MS社PowerPointの機能に、書いた内容(文章)を「読み上げ」る機能があるらしい。
それを使っちゃえば、ナレーター雇って、録音スタジオ借りて・・・なんてやらなくていい。
PCの音声ならきっと元はプロの方のお声/発音がベースだろうし、PC上で再生することに何の縛りもないはず。
(「声」って、その声の主のなんか権利的なものがあって、
当初目的以外の用途で使っちゃならん!とかいうのがあると聞いたことがある。
なので面倒に巻き込まれないことが保障されるPCの音声合成は、お手軽です。)

さあ、やっと本題です。
おおまかな手順としては以下になります。

1)PowerPointにナレーションの元の文章を日本語で書き込みます。
2)その文章をコピペして、Web上の翻訳サービス(例えば、Infoseekマルチ翻訳)で
  よくある 英/中/韓に翻訳します。
3)その内容をコピペして、別のPowerPointファイルか、別ページにコピペします。
4)PowerPointに読み上げさせて、それを録音し.WAVデータを作成します。

そうすれば、日本語も合わせて、4ヶ国語の同じようなことを説明しているナレーションデータが出来上がる・・・はず。

1)と4)についての詳細を以降(続きを読む)で説明します。


●パワポの読み上げ機能を有効にする
以下、PowerPoint2016で実施。

パワポを起動し、左上のアイコン列の一番右でプルダウンを表示して、下から2番目くらいの「その他のコマンド」を選択する。

「コマンドの選択」欄で「すべてのコマンド」、あるいは「リボンにないコマンド」を選択して、その下のリストから「読み上げ」を選択して、[追加]ボタンをクリック、さらに [OK]ボタンをクリックする。
 ⇒メインウィンドウの左上のアイコン列に「読み上げ」アイコンが追加される。

通常、上記のアイコンは非活性。スライド上のテキスト(使用できる言語:デフォルトで英語)を指定(範囲選択)すると、活性状態になり、「読み上げ」アイコンをクリック音声合成(発話)が行われる。

対応言語のテキストを選択しても活性化されない場合、
-「ファイル」-「オプション」を選択し、表示される「PowerPointのオプション」ダイアログの左側メニューで「アドイン」を選択する。
 右側「アドイン」欄の「アクティブなアプリケーションアドイン」に「PowerPointプレゼンテーションに関するOneNoteノート」があれば、OK。
たぶんないので以下。
-右下「管理」欄に「COMアドイン」を選択して[設定]ボタンをクリックする。
-「COMアドイン」ダイアログで「PowerPointプレゼンテーションに関するOneNoteノート」をチェックし、[OK]ボタンをクリックする。

前記の③を再実行。


●他の言語の音声合成を行う
以下、Windows7で実施。
※音声合成エンジンをTTSエンジンと呼んでいる。

Microsoft Speech Platform をダウンロード&インストール
 https://www.microsoft.com/en-us/download/confirmation.aspx?id=24974
注意)ダウンロード時に「Runtime\x64\SpeechPlatformRuntime.msi」と「Runtime\x86\SpeechPlatformRuntime.msi」が選択できるが、これはOSに合せるのではなく、Office(32bit(x86)版か64bit版か)に合せること。

読み上げたい言語のTTSエンジンをダウンロード&インストール
 上記のURLのページからダウンロードできる。
 
※インストールした後にコントロールパネル/音声認識/音声合成の設定を変更しようとしたが、相変わらず英語の音声しか選択できないようになっていた。追加した音声を選択できるようにするには、レジストリの修正が必要。

▼システム側のTTSの選択を可能にする
コマンドプロンプト(管理者権限)を起動し、以下のコマンドを実行する。
 >reg COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech Server\v10.0\Voices\Tokens" HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens /s /f

つまり、「Speech Server」には設定されたが、「Speech」クライアント?としては設定されていないということか(?)。
上記を行わなくとも、パワポの音声読み上げでは使えた・・・

※ただし、中国語の音声が男の声に変わった。 どうも、SAPI5.1とLanguage Packをインストールした際に、確か2ヶ国語入っていてそのうち1つが中国語の男性物で、そちらが優先されてしまうようだ。システム側には影響なかった模様。この後の手順で女性の声に戻せます。

OSは64bitだが、Officeが32bit版だったので、TTS環境も32bit環境の設定をちょっと変更しないといけない。
それぞれあって、レジストリ設定も別々のようです。

▼Office側(32bit)のTTS環境の修正
regedit.exeを起動。
 「HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Speech\Voices\Tokens\」を参照

「MSSimplifiedChineseVoice」がある場合は、ツリービュー上でキーを右クリックして[エクスポート]し、念のためバックアップ。もう一回右クリックして[削除]を実行。

念のため、以下のコマンドをコマンドプロンプト(管理者権限)上で実行した。
 >reg COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Speech Server\v10.0\Voices\Tokens" HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Speech\Voices\Tokens /s /f

※最初に使えていた、女性の声で中国語を読み上げするように戻った。

今日は、この辺で。
続きは次回。m(__)m
スポンサーサイト





コメントの投稿

非公開コメント

カレンダー
11 | 2019/12 | 01
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
プロフィール

さるもすなる

Author:さるもすなる
さるです。別HPサイト「さるもすなる」から侵食してきました。 山菜/きのこ、それとタイトルにしたPPバンド籠のことをメインに徒然に・・・・暇を持て余したさるの手仕事:男手芸のブログってことで。

最新記事
最新コメント
月別アーカイブ
カテゴリ
天気予報

-天気予報コム- -FC2-








本家のHPのトップ
山菜や茸の話です
PPバンドの籠作品と作り方です
投稿をお待ちしております



ブログランキング・にほんブログ村へ にほんブログ村 ハンドメイドブログへ



マニュアルのお申し込み



検索フォーム
リンク
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QR