【Just Right!・ATOK活用ガイド >Just Right!活用コラム > 一括で辞書登録できない「複合語」もまとめて管理する】
Just Right! 辞書管理の効率を最大化する運用術
Just Right! の辞書作成において、最も効率的なのは「表計算ソフトで作ったリストを一括登録すること」です。しかし、実際に運用を始めると、すぐに一つの壁に突き当たります。それは、「一括登録できる言葉」と「できない言葉」が混在し、管理がバラバラになってしまうという問題です。
今回は、この管理上のストレスを解消し、すべての校正ルールを一元管理するテクニックを紹介します。
辞書管理を困難にする「管理の分断」
なぜ、辞書作成は「一筋縄ではいかない」のでしょうか。それは、検出したい表記の性質によって、登録方法が全く異なるからです。
- 「単一の品詞」として登録できるもの
- 例:「改めて(副詞)」「あわせ(一段動詞)」
- 登録方法: Excelなどでリスト化し、一括インポートが可能。非常に楽。
- 「複数の品詞」が組み合わさっているもの
- 例:「一度に(副詞+助詞)」
- 登録方法: Just Right! では「ルール辞書」として、専用の書式で個別に定義する必要がある。
ここで発生する「管理の分断」
一括登録できない言葉が出てくると、 「一括登録用のExcel」 とは別に、「ルール辞書用のメモや別ファイル」 を作る必要がでてきます。
すると、「あの表記の校正ルール、どこに書いたっけ?」「Excel側にはあるのに、ルール辞書への反映を忘れていた」といったミスが発生します。本来、一つの思想で管理したい校正基準が、登録形式の都合であちこちに散らばってしてしまう。 これが、辞書管理が大変になる最大の理由です。
解決策:Excelの品詞欄を「管理用の目印」として活用する
一元管理をするために、「一括登録できないもの」もあえて同じExcelリストの中に並べて記述してしまいます。

この方法の仕組み
このリストで一括登録を実行すると、Just Right! は次のように動作します。
- 実在する品詞(副詞など):正常にユーザー辞書へ登録されます。
- 「ルール辞書で対応」と書いた行:システム上に存在しない品詞名のため、登録時に「未登録語」として自動的に弾かれます。
これにより、ユーザー辞書を汚すことなく、一つのリストで全ての校正ルールを俯瞰できるようになります。
<参考>
付録1: 検出したい表記の品詞の確認
付録2:検出したい表記が単一の品詞の場合
付録3:弾かれた未登録語の確認
この運用方法のメリット
今までは「一括登録用」と「手動登録のメモ用」でファイルを分けたり、フィルタリングしたりしていたかもしれません。しかし、この「品詞欄を活用する方法」なら以下のメリットがあります。
- マスターデータの一元化:校正対象の言葉がすべて1つのシートに集約されます。
- 作業漏れの防止:一括登録時に弾かれたリスト(未登録語)がテキスト出力されるため、それをそのまま「ルール辞書へ手動登録するリスト」として活用できます。
- 誤検出の防止:無理やり単一の品詞として登録してしまい、意図しない箇所で指摘が出るリスクを回避できます。
おわりに
「辞書登録を効率化したいけれど、管理が煩雑になるのは避けたい」という方は、ぜひこの「品詞欄を管理用の目印にする」運用を試してみてください。
付録
付録1: 検出したい表記の品詞の確認
検出したい表記の前後に語句を含んだ文を形態素アナライザーで解析すると、その表記が「単一の品詞」か「複数の品詞が組み合わさった表記」かを確認できます。
例えば、「彼はその作業を一度に終わらせようとしました。」の「一度に」は、一見すると副詞のように思われますが、Just Right!は複数の品詞の組合せ(副詞「いちど」+助詞「に」)として認識します。
<関連記事>
「形態素アナライザー」による単語登録
付録2:検出したい表記が単一の品詞の場合
Excelの表で、適切な品詞を指定すれば一括登録できます。辞書登録したのに指摘されないときには、以下の記事を参考にしてください。
<関連記事>
「辞書登録したのに指摘されない、校正結果がおかしいときには」
付録3:弾かれた未登録語の確認
品詞欄に実際の品詞名以外の文字を記載したルール行は登録されず、登録時に未登録後数として弾かれます。

登録時に未登録語の出力を指定していた場合には、登録されなかったルール行がテキストに出力されます。

