ブログやニュース記事を音声読み上げで聞ける DTalker (ドキュメントトーカ)

パソコンや電子デバイスで映像・音声コンテンツを利用することは、めずらしくない。
パソコンで作業をしながら…といった場面では、
「ながら聞き」できるので、映像よりも音声をメインにしたコンテンツが助かる。そこでストリーミングやオンデマンドのニュースや番組、ポッドキャストといったものを聞くことが増えた。オーディオブックももちろんよいが、日本はまだ選択肢が少ないこと、聞いてもよいと思えるものでも書籍より割高なのがネックだ。

こうやって「ながら聞き」を進めていくと、普段は読んでいるコンテンツもながら聞きしたほうがよいのではないか、という気がしてくる。たとえば、RSSリーダーに未読がたまったブログや、読みたいのは山々だがちょっと難しそう…(じっくり読むには時間がかかりそう)な記事、さらには、どうでもいいけど時間があれば…といったまとめサイトまで。基本的にほとんどの情報はまだ、テキストばかりだ。

そこで、こういった記事を「音声読み上げ」機能を使って聞いてはどうかと試してみた。これがなかなかイケる。

使用したのはすでに多くのサイトでも推薦されている「ドキュメントトーカ(DTalker)」で、イントネーションや単語の読みは確かな品質。ニコ動でよく使われているWindows専用のSofTalkよりも人間味がある抑揚。意味がわかるという程度ではなく、むしろ斜め読みするよりもずっとよく理解できるとい感じる場合も多い(たとえば、アルファブロガーなどの平易に書かれた、長めのブログエントリなど)。以下感想など。

  • 一方で、知り合いの文章などは音声イメージが違いすぎてちょっと…という場合もあるかもしれない。
  • 「ながら聞き」の場合早すぎると聞き逃しが増える。通常よりも「ゆっくり」再生にしていると、かなり頭に入ってくる感じだ。
  • アプリのユーティリティを使うという手もあるが、ブラウザに読み上げのショートカットキーを設定したり、右クリックメニューを使って読ませたいものをすぐに再生できるコマンドを用意すると億劫でなくなる。
  • スペースや「。」を使うと一定の空白が入る、●はまる、■はしかく、などと発声するなど、表記があいまいな場合は聞きづらくなる
  • 人名などよく更新されているのだと思うけれど「そんまさよし」は読めても「そんしゃちょう」は読めずに「まごしゃちょう」などとなるのはご愛敬
  • まとめスレも読み上げてみたけれど、日付、ハンドル、URLベタ貼りが繰り返されてしまうため、聞き取り困難。なんとかする方法があるのかしら?
  • TwitterクライアントでEchofonなどGrowlに対応しているものでは、Growlのアプリ設定で「speech」を選ぶとハイライトや@メンションなど読み上げできる。これもURLが読み上げされるとウザいところがちょっとネック。
  • Web読み上げで要素ごとに読み上げるかどうかを選べるのだが、これが結局メニューなど再生されてしまうため、あまり使い勝手がよいと思えない(あくまで目が見えている状態で使う場合)

   BlogPaint

なお、Mac OSは、日本語の音声発音辞書が搭載されておらず、デフォルトのままでは漢字の読み上げができない。「Alex」のようなデフォルトの音声エンジンを選択していると、英語の文字しか読み上げて日本語部分はすべて飛ばしてしまう。Dtalkerをインストールすることでアクセシビリティ機能も含め、すべて日本語化することができる。

ただし、Lionからは「Kyoko」という日本語音声エンジンがオプションダウンロード可能で、つたないながらも日本語の音声合成が無料で可能になった。

参考サイト:Lionの日本語テキスト読み上げ「Kyoko」を試す

DTalkerは以下から購入できる。

参考ページ:ドキュメントトーカ(DTalker)for Mac Ver.3

Windowsの環境も似たような状況で、本格的な日本語音声合成にはドキュメントトーカが採用されているようだが、未検証。

参考ページ:Microsoft Windows 7 対応日本語音声合成エンジンの配布について
参考ページ:製品情報 ドキュメントトーカ 日本語音声合成エンジン for Windows

ところで、日本のケータイでは、富士通の「らくらくホン」や、auの「カンタン携帯」などのガラケーには読み上げ機能がデフォルト搭載されているそうで、スマートフォンがどうなっているかも気になった。

iPhoneの場合は、「VoiceOver」というアクセシビリティソフトが入っている。iPhone4でみてみると、一般設定の中にある、アクセシビリティから設定が行えるようになっている。
参考サイト:iPhone 3GS のVoiceOver解説
使ってみると、iPhoneの場合は最初から日本語に対応しており、女性の声で日本語の読み上げを行ってくれる。また、基本的に1~3本指のジェスチャを使って操作が行えるようになっている。Mac OS XのVoiceOverの操作にも多くのマルチタッチジェスチャが用意されているから、iPhoneからさかのぼって、パソコン側に採用された機能なのかもしれない。ということは、
iPhoneの合成エンジンが、「Kyoko」なのだろうか?

Androidの場合は、「音声入出力」の「音声合成設定」(発音辞書エンジン)にインストールされている「Pico TTS」の対応言語は英仏独西伊に限られる。日本語は、クリエートシステムが開発した製品版エンジンがAndroidマーケットから990円で購入できる。
参考サイト:アンドロイドマーケット :ドキュメントトーカ for Android

ほかにもAquesTalk、N2 TTSなどといったものがあるようだ。無料のものもある。さすが幅広い開発業界。様子をみてインストールしてみたい。日本語対応のものは見当たらないが、Textメッセージ読み上げをするSMS用のアプリなども出ている。