Google 日本語入力

提供: miniwiki
2018/9/22/ (土) 21:32時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索


Google 日本語入力(グーグル にほんごにゅうりょく)とは、Googleが開発した日本語入力システム(IME)である。2009年12月3日にベータ版として公開され、2010年12月16日に正式版が公開された。また、Mozc(モズク)という名称で公開されたオープンソース版についても本記事にて説明する。

特徴

Google 日本語入力の一番の特徴は、変換辞書の豊富な語彙とそのファイルの小ささである。

Google 日本語入力ではインターネット上から自動的に辞書を生成することにより、予測変換機能・タイプミスに対して「もしかして機能」を実装している。専門用語学術用語・話題の人名(〈存命の〉芸能人政治家や、漫画アニメゲームに登場する架空のキャラクター名など)から、流行り廃りの激しいインターネットスラングにまで対応する高い変換精度を誇る。特に、固有名詞の語彙力が他の日本語入力システムと比べて極めて高い[1]Google検索の語句入力から生成されたビッグデータが辞書にもたらす変換精度の高さは、インターネット上で大きな話題となった[2]

一方、文字のつながりを認識して適切な単語に変換する機能が弱かったり、連濁が正しく変換されないこともある。

他のIME(日本語入力システム)との設計上の違いとして、他のソフトウェアに依存する部分を小さくしてプロセスを分けることで、Google 日本語入力がクラッシュした場合にも、他のソフトウェアを巻き込んで落ちることがないようにした特徴がある。この設計のおかげで、辞書のアップデート時に、再起動が不要になる利点ももたらした[3]

開発の概略

Googleで「もしかして機能」を担当、形態素解析エンジン・MeCabの開発者でもある技術者の工藤拓が、その経験から日本語入力ソフトウェアとしての可能性を感じ、またオープンソースの日本語入力ソフトウェア・PRIMEの開発経験を持つ技術者の小松弘幸もアイディアを温めていた[4]

その後、この2人が中心となって「20%ルール」(勤務時間の20%を自由に使って良いというGoogleの社内ルール)のプロジェクトとして開発を開始し、この分野に詳しい貢献者を徐々に増やしながら公開に至った。

2010年2月17日から、新機能のテストとバグの早期発見を目的に開発版(アルファ版)がリリースされ、同年12月16日には正式版がリリースされた。開発版は今もダウンロードして使用することが可能だが、Google 日本語入力チームは安全性の観点から通常の使用には正式版を勧めている[5]

2010年5月11日、オープンソース版のGoogle 日本語入力であるMozcがリリースされた。そして2011年12月15日にはAndroid向けのベータ版がリリースされ、2013年4月に正式版となった[6]

更新履歴

主としてPC用のGoogle 日本語入力の更新履歴である。

  • 2009年12月3日 - ベータ版を公開[7] (0.8.186.x)。
  • 2009年12月15日 - 64bit版を公開[8]
  • 2010年
    • 1月29日 - 郵便番号から住所への変換、ひらがなからカタカナ英語への変換、テンキー入力のサポートなど[9] (0.9.248.x)。
    • 3月19日 - 学習アルゴリズム改善、入力履歴サジェストの改善など[10] (0.10.288.x)。
    • 6月25日 - 学習アルゴリズム改善、入力補助機能の改善、パフォーマンスの向上など[11] (0.11.382.x)。
    • 8月13日 - 記号辞書の拡充、ユーザビリティの向上、バグ修正など[12] (0.12.434.x)。
    • 11月17日 - スペルチェック機能、辞書の拡充、バグ修正など[13] (0.13.521.x)。
    • 12月3日 - 計算機能を追加、顔文字変換が拡張、IMEの切り替えを無効化など[14] (0.14.541.x)。
    • 12月16日 - 正式版を公開[15] (1.0.556.x)。
  • 2011年
    • 2月28日 - リアルタイム変換機能など[16] (1.1.626.10x)。
    • 7月21日 - 再変換機能、確定取り消し機能など[17] (1.1.770.x)。
    • 9月30日 - ローマ字入力のスペルチェック機能、同音異義語の意味・用例の表示、郵便番号の変換結果の追加など[18] (1.2.825.x)。
  • 2012年
    • 4月16日 - 「コマンド」機能など[19] (1.4.1031.x)。
    • 6月22日 - 誤読の訂正候補を提示する機能、Unicode表記への再変換機能など[20] (1.5.1109.x)。
    • 11月5日 - 辞書内容の更新、検索エンジンの高速化など[21] (1.6.1221.x)。
    • 12月4日 - Windows 8に対応[22] (1.7.1227.x)。
  • 2013年
    • 8月16日 - カーソル前の文字列を考慮した変換など[23][24](1.11.1515.x)。
    • 11月15日 - ローマ字入力モードでローマ字変換前の文字列をサジェストする機能など[25][26](1.12.1590.x)。

Android 版

Android向けのGoogle 日本語入力は2011年12月15日にベータ版がリリースされ、2013年4月に正式版に昇格した[6]

Android版では、Google 日本語入力としての変換エンジンのほかにフロントエンドとなるソフトウェアキーボードも1つのパッケージとして配布されている。Androidの中でも特にタッチパネル端末ではソフトウェアキーボードで文字を入力することが主となるため、QWERTY配列のほかiOSでも採用されているテンキーをフリックして入力する方式(フリック入力)のほかに、Android版Google 日本語入力独自のキー配列であるGodanキーボードというローマ字入力をテンキーで行うことに主眼をおいた配列も実装されている[27]

バージョン1.9では、Androidの日本語IMEで主流の拡張機能であるマッシュルームにも対応した[28]

Gboard 版

GoogleがAndroid/iOS向けに開発している仮想キーボードGboardEnglish版にはGoogle 日本語入力が組み込まれている。

Mozc

Mozcとは、Google 日本語入力のオープンソース版である。これは2010年5月11日にGoogle日本語入力をGoogle Chrome OSに移植するために必要な部分をオープンソースしたものである[32]

オープンソース版のMozcとGoogle 日本語入力との大きな違いは、Mozcは日本語変換エンジンでありこれを用いて日本語入力を行うにはibusuimFcitxのようなインプットメソッドを別途インストールする必要がある点である。またGoogle 日本語入力の売りであるインターネット上の語句を収集して生成される変換辞書を使わず、代わりにMozcプロジェクトが作成した変換辞書を使う点も異なる。変換辞書などを含めた完全にオープンソース化に対応しないのは、インターネットから収集してきたデータが変換辞書として使われている関係上、SEO対策に悪用されないようにするためであるという[32]

Webデータから自動抽出された大規模語彙データは含まれていません。 語彙集合は基本的に IPAdic と同一です。 そのため、固有名詞以外の変換精度は Google日本語入力 とほぼ同一です。以下、Google 日本語入力で使用している辞書および IPAdic との主な違いです。
IPAdic に収録されていない、表外動詞や形容詞が一部含まれています。
IPAdic に収録されていない、Web 上に多く出現するカタカナ語が含まれています。
IPAdic の中にある単語のみで構成され、Web上によく出現する複合語 が追加 されています。(例: 再起動, 社員証)。
Google 日本語入力で使用されている辞書に含まれている カタカナ→ 英語 は含まれていません (例:アンドロイド→Android)。
Google 日本語入力で使用されている辞書に含まれている 郵便番号 → 住所 は含まれていません。


— Google Japan Blog、Google 日本語入力がオープンソースになりました[32]

2014年現在のMozcプロジェクトの成果物(ソフトウェア)では、言葉と言葉のつながり(コロケーション)をもって変換精度を高める処理[注釈 1]や、言い間違い[注釈 2]を訂正する処理については実装されているものの、それを実現するための対応するデータが実質的に含まれていない点もGoogle 日本語入力と異なる点である[33]

仕様

波ダッシュ「」は、音声記号等として用いられるチルダ「~、~」とは異なる文字記号であるが、Google 日本語入力の Windows 版のみ互換性問題の回避・解決のため、波ダッシュ「」にチルダ「~、~」がマッピングされている。

Google日本語入力のWindows版では、この非互換性の問題の解決のため、Windows独自のマッピングに即した変換処理を行なっております。 — 波ダッシュと全角チルダの扱いについて - Google プロダクト フォーラム[34]

この背景には、かつてUnicode 仕様書が間違っていたことに端を発し、その仕様書通りに実装・マッピングしたマイクロソフト社の Windows では波ダッシュとして全角チルダが不適切に長年使用されてきた歴史がある。その結果、Windows 版のみ「なみ」や「から」と入力・変換を試みると候補に『~ [半] 波ダッシュ』と『~ [全] 波ダッシュ』が列挙・表示される。これらはチルダである。

言葉狩り

差別用語や猥語など社会通念上好ましくない、ないしマスメディア表現の自主規制している言葉は、Google日本語のサジェスト機能では表示されない。ただし、スペースキーを押した変換からは、当該の単語が変換される様にはなっている。同様の「言葉狩り」はATOK及びMicrosoft IMEでも行われている。

脚注

注釈

  1. 例えば「あつい」という言葉を変換する際に、「本が」「厚い」、「夏が」「暑い」というような組み合わせで候補の順を変える処理のこと。
  2. 例えば、「ふいんき」を「雰囲気(ふんいき)」に訂正するなど。

出典

  1. Googleが日本語入力システム参入 β版無料公開
  2. 「Google日本語入力」開発者が語る、その狙い
  3. Google 日本語入力 TechTalk 2010
  4. 松本淳. “IMEとして「変態」 開発陣が語るGoogle日本語入力”. ASCII.jp. . 2014-8-12閲覧.
  5. Google 日本語入力に開発版が追加されました。2010年2月17日
  6. 6.0 6.1 Google 日本語入力チーム (2013年4月4日). “Android 版 Google 日本語入力がベータ版から正式版になりました”. Google Japan Blog. . 2014-8-12閲覧.
  7. Google Japan Blog: 思いどおりの日本語入力 - Google 日本語入力”. Google (2009年12月3日). . 2012閲覧.
  8. Google Japan Blog: 64 ビット対応版 Google 日本語入力リリース”. Google (2009年12月15日). . 2012閲覧.
  9. Google Japan Blog: Google 日本語入力がアップデートされました。”. Google (2010年1月29日). . 2012閲覧.
  10. 日本グーグルブログ 2010年3月19日
  11. 日本グーグルブログ 2010年6月25日
  12. 日本グーグルブログ 2010年8月13日
  13. 日本グーグルブログ 2010年11月17日
  14. 日本グーグル開発者ブログ 2010年12月3日
  15. 日本グーグル開発者ブログ 2010年12月16日
  16. 山崎富美 (2011年2月28日). “Google 日本語入力の開発版をアップデートしました。(1.1.626.10x)”. Google Japan. . 2011閲覧.
  17. 隅田洋 (2011年7月21日). “Google 日本語入力をアップデートしました。(1.1.770.x)”. Google Japan. . 2011閲覧.
  18. 梁成基、渡辺雄也、楠本充 (2011年9月30日). “Google 日本語入力の安定版をアップデートしました。(1.2.825.x)”. Google Japan. . 2011閲覧.
  19. Google Japan Blog: Google 日本語入力の安定版をアップデートしました(1.4.1031.x)”. Google (2012年4月16日). . 2012閲覧.
  20. Google Japan Blog: Google 日本語入力の安定版をアップデートしました(1.5.1109.x)”. Google (2012年6月22日). . 2012閲覧.
  21. Google Japan Blog: Google 日本語入力の安定版をアップデートしました(1.6.1221.x)”. Google (2012年11月5日). . 2012-12-4閲覧.
  22. Google Japan Blog: Google 日本語入力 安定版アップデート : Windows 8 に対応(1.7.1277.x)”. Google (2012年12月4日). . 2012-12-4閲覧.
  23. 柳英俊 (2013年8月20日). “Google、文脈に応じた変換に磨きをかけた「Google 日本語入力」安定版v1.11を公開”. 窓の杜. . 2016閲覧.
  24. Google 日本語入力の安定版をアップデートしました。(1.11.1515.x)”. Google (2013年8月16日). . 2016閲覧.
  25. 長谷川正太郎 (2013年11月19日). “Google、「Google 日本語入力」v1.12の安定版を公開”. 窓の杜. . 2016閲覧.
  26. Google 日本語入力の開発版をアップデートしました。(1.12.1599.10x)”. Google (2013年11月11日). . 2016閲覧.
  27. Developer Relations Team (2012年10月4日). “Android 版 Google 日本語入力をアップデートしました。(1.6.1209.3)”. Google Developer Relations Japan Blog. . 2014-8-12閲覧.
  28. Developer Relations Team (2013年3月7日). “Android 版 Google 日本語入力をアップデートしました。(1.9.1362.3)”. Developer Relations Japanese Blog. . 2014-8-12閲覧.
  29. Gboard チーム (2017年9月20日). “iOS版 Gboard が日本語に対応しました。”. Google Japan Blog. . 2018閲覧.
  30. Gboard 6.7 beta adds Chinese, Japanese support in possible keyboard app consolidation”. 9to5Google (2017年10月26日). . 2018閲覧.
  31. Googleのキーボードアプリ「Gboard」、Android版もようやく日本語対応に”. ITmedia (2017年11月17日). . 2018閲覧.
  32. 32.0 32.1 32.2 Google 日本語入力チーム (2010年5月11日). “Google Japan Blog:Google 日本語入力がオープンソースになりました”. Google. . 2010閲覧.
  33. mozc/about_branding.md at master · google/mozc · GitHub”. Google (2016年8月19日). . 2018閲覧.
  34. 波ダッシュと全角チルダの扱いについて - Google プロダクト フォーラム”. . 2015閲覧.

関連項目

外部リンク

テンプレート:Input Method