次世代のUI「音声認識」を考える--iOSでの成果はフィードバックされるのか

海上忍
2011-05-19 12:26:00
  • このエントリーをはてなブックマークに追加

 時期は不明だが、OS Xでいわゆる「音声認識」が強化される方向にあることは確かだろう。もちろん未発表の製品や技術についてAppleがコメントするわけはなく、これまで集めた諸々の情報と日々の観測を踏まえたうえでの推測に過ぎないが、まったくの見当違いではないと思う。

 Snow Leopardの現在、OS Xの音声認識機能は、システム環境設定の「スピーチ」パネルで「Speakable Items」を入にすると有効化される。すると、「Get my mail」や「Hide this application」などのコマンドが表示された音声コマンド画面と、丸い音声フィードバック画面が現れるので、ESCキーを押しながらマイクに向かって話しかけると、音声が分析される。日本語は理解してもらえないが、それでも英語の認識精度は十分実用の域に達している。

 その音声認識の精度はLeopardの頃とほぼ変りなく、対応する言語種も増えていないことから、事実上の凍結状態にあったものと考えられる。しかし、iPhone 3GSでは(アプリの)iPodの操作や電話をかけることが可能になるなど、語彙(ごい)は少ないながらも日本語ベースの音声認識をサポートした。

 iPhone 4およびiOS 4では大きく変わらなかったが、AppleがUIとして音声認識を重視していることは確かだろう。そしてAppleは、OS XにiOSの成果を取り入れるなど、この2つのOSに対するスタンスを変化させている。遅かれ早かれ、OS XにもiOSと同程度の音声認識機能が搭載されるのではなかろうか。

 ところで、音声認識を専門に扱う他社は、波形データなど認識に必要なリソースをクラウド上に集めることで、ローカルに置くデータ量の軽減と認識に要する時間の短縮を図っている。iOSアプリでいえば、Nuance Communicationsの「Dragon Dictation」、独立行政法人情報通信研究機構(NICT)の「VoiceTra」が好例といえるだろう。

 iOSとは異なりローカルストレージは余裕のOS Xだが、多くのユーザーに日々使用されることで認識精度を高めるクラウド型のほうが、音声認識機能のモデルとして有利なように思えてならない。OS Xに採用されるにしても当分先だろうが、LionのようにiOSの成果をフィードバックする話はありえること。この分野を注意深く見守っていきたい。

OS Xに標準装備の音声認識機能 いまとなっては他社技術に見劣りする、OS Xに標準装備の音声認識機能。先にiOSで改良を進め、後日OS Xにフィードバックする形で強化されるのか……
  • 新着記事
  • 特集
  • ブログ