IMEの複文節での変換精度比較

2009-12-04 18:03:45

Google日本語入力がリリースされて、大きな話題になりました。

特に推測・サジェストの機能に注目が集まっていますね。

ですがどちらかと言えばこれは文節単位の変換の際に重要な機能であって、そこそこのタイプ速度を持つ方にとっては複数分節単位での変換や、センテンス単位での一括変換のほうが重要ではないかと思われます。

アホだアホだと蔑まれてきたMS-IMEも最近のバージョンでは、複数文節の一括変換の精度が上がり、ATOKなどにも引けを取らないような変換結果を出すことも多くなっています。ただ、文節変換をメインとしているライトユーザーや癖で文節変換がメインになってしまっている方にとっては、変換確定後の前文節の内容まで使って変換精度を上げてくるATOKのほうが賢いと思われる可能性が高いのではと思います。

そこで、今回は複数文節の例文を中心に、リリースされたばかりのGoogle日本語入力と、最近βテストが開始されているMS-IME2010(Office2010のβに含まれています)、製品版のATOK2010を使って検証を行ってみました。

Google日本語入力(beta)及びMS-IME2010(beta)はインストール直後、ATOK2009は10ヶ月程度(1日3~5時間)業務で使用している状態です。IMEは使用状況によって変換結果が変わりますので、この結果はあくまで参考程度ということでお願いいたします。

例文は、過去のバージョンなどとも比べられるといいと考え、以下のブログを参考にさせていただきました。

ATOK,MS-IME,Social IME,三ソフト寄れば文殊の…。(古文自動翻訳研究センター)

幸せって余分だな。(蜂須賀電設)

 

例文 ATOK2009 Google日本語入力 MS-IME2010
「こんきよくまったかいがあった 根気よく待った甲斐があった 根気よく待った会があった 根気よく待ったかいがあった
「しゃないのおかねのかしかりはげんきんです」 社内のお金の貸し借りは厳禁です 社内のお金の貸し借りは現金です 社内のお金の貸し借りは厳禁です
「ないようをりかいしたいおうじにはじゅうぶんにちゅうい」 内容を理解し対応時には十分に注意 内容を理解し対応時には十分に注意 内容を理解したい王子には十分に注意
「しあわせってよぶんだな」 幸せって余分だな 幸せって余分だな 幸せって呼ぶんだな
「いつもいいあいばかりさ。」 いつも言い合いばかりさ いつもいい愛ばかりさ。 いつも言い合いばかりさ
「きたいはっせいそうち」 気体発生装置 期待発生装置 期待発生装置
「しょうがないよ!げんきだしな。」 しょうがないよ!元気だ品。 しょうがないよ!元気だしな。 しょうがないよ!元気だしな。
「すがたがふとめにはいったので、」 姿がふと目に入ったので、 姿が太めに入ったので、 姿がふと目に入ったので
「せつぞくするたびにむらがある」 接続する度に村がある 接続する度にムラがある 接続するたびにむらがある
「はしをわたる」 橋を渡る 橋を渡る 橋を渡る
「ごはんをたべるときははしをつかう」 ご飯を食べるときは箸を使う ごはんを食べるときは橋を使う ご飯を食べるときは箸を使う
「おひるやすみはうきうきうぉっちんぐ」 お昼休みはうきうきウォッチング お昼休みはウキウキウォッチング お昼休みはウキウキウォッチング
「くるまではこをはこぶ」 車では個を運ぶ 車で箱を運ぶ 車で箱を運ぶ
「にせんきゅうねんどのよさんがくがかこさいだいに」 二千九年度の予算額が過去最大に 二千九年度の予算額が過去最大に 二千九年度の予算額が過去最大に
「きしゃのきしゃはきしゃできしゃした」 貴社の記者は汽車で帰社した 貴社の記者は汽車で帰社した 記者の記者は汽車で帰社した
「すてきなろまんすしたい」 素敵なロマンスしたい 素敵なロマンスしたい 素敵なロマンスしたい
「まじょがりすいしんしそう」 魔女が利水新思想 魔女狩り推進しそう 魔女狩り推進思想
「くにはこくみんからおさめられたぜいきんでおさめられる」 国は国民から納められた税金で治められる 国は国民から収められた税金で収められる 国は国民からおさめられた税金で納められる
「いなばうあー」 イナバウアー イナバウアー イナバウアー
「なかいまさひろ」 中居正広 中居正広 中井正弘
「のびのびた」 のびのび多 野比のび太 野火のび太
「びるしゃなぶつ」 毘盧遮那仏 毘盧遮那仏 毘盧遮那仏

 

この程度の例文数ではかなり主観的になりますが、以下のような感想を持ちました。

  • Google日本語入力は固有名詞に強いが、複数文節での変換精度ではMS-IME2010やATOK2009に劣る
  • MS-IME2010は素の変換精度としてはATOK並みのレベルまで到達しているように思える
  • ATOK2009は変換精度こそMS-IME2010に並びかけられているが、誤入力の補正や誤変換の指摘機能などで一歩抜きんでている

また、Googleの推測変換(サジェスト機能)は便利ですが、短い語句でばんばんサジェストされると考えてもいなかった単語が目に飛び込んできて、思考を妨げるため、うっとおしく感じました。ATOKも推測変換を行ってくれますが、そのサジェスト具合がわりと控えめで好感が持てます。

といったところで、日本語IMEも切磋琢磨してどんどん進化してくれるとうれしいですね。

 

 

※このエントリは ブロガーにより投稿されたものです。朝日インタラクティブ および ZDNet Japan編集部の見解・意向を示すものではありません。
  • 新着記事
  • 特集
  • ブログ
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]