一括で辞書登録できない「複合語」もまとめて管理する

【Just Right!・ATOK活用ガイド >Just Right!活用コラム > 一括で辞書登録できない「複合語」もまとめて管理する】

Just Right! 辞書管理の効率を最大化する運用術
 Just Right! の辞書作成において、最も効率的なのは「表計算ソフトで作ったリストを一括登録すること」です。しかし、実際に運用を始めると、すぐに一つの壁に突き当たります。それは、「一括登録できる言葉」と「できない言葉」が混在し、管理がバラバラになってしまうという問題です。
 今回は、この管理上のストレスを解消し、すべての校正ルールを一元管理するテクニックを紹介します。

目次

辞書管理を困難にする「管理の分断」

 なぜ、辞書作成は「一筋縄ではいかない」のでしょうか。それは、検出したい表記の性質によって、登録方法が全く異なるからです。

  • 「単一の品詞」として登録できるもの
    • 例:「改めて(副詞)」「あわせ(一段動詞)」
    • 登録方法: Excelなどでリスト化し、一括インポートが可能。非常に楽。
  • 「複数の品詞」が組み合わさっているもの
    • 例:「一度に(副詞+助詞)」
    • 登録方法: Just Right! では「ルール辞書」として、専用の書式で個別に定義する必要がある。

ここで発生する「管理の分断」

 一括登録できない言葉が出てくると、 「一括登録用のExcel」 とは別に、「ルール辞書用のメモや別ファイル」 を作る必要がでてきます。
 すると、「あの表記の校正ルール、どこに書いたっけ?」「Excel側にはあるのに、ルール辞書への反映を忘れていた」といったミスが発生します。本来、一つの思想で管理したい校正基準が、登録形式の都合であちこちに散らばってしてしまう。 これが、辞書管理が大変になる最大の理由です。

解決策:Excelの品詞欄を「管理用の目印」として活用する

一元管理をするために、「一括登録できないもの」もあえて同じExcelリストの中に並べて記述してしまいます。

(画像をクリックで拡大)

この方法の仕組み

このリストで一括登録を実行すると、Just Right! は次のように動作します。

  1. 実在する品詞(副詞など):正常にユーザー辞書へ登録されます。
  2. 「ルール辞書で対応」と書いた行:システム上に存在しない品詞名のため、登録時に「未登録語」として自動的に弾かれます。

これにより、ユーザー辞書を汚すことなく、一つのリストで全ての校正ルールを俯瞰できるようになります。

<参考>
付録1: 検出したい表記の品詞の確認
付録2:検出したい表記が単一の品詞の場合
付録3:弾かれた未登録語の確認

この運用方法のメリット

今までは「一括登録用」と「手動登録のメモ用」でファイルを分けたり、フィルタリングしたりしていたかもしれません。しかし、この「品詞欄を活用する方法」なら以下のメリットがあります。

  • マスターデータの一元化:校正対象の言葉がすべて1つのシートに集約されます。
  • 作業漏れの防止:一括登録時に弾かれたリスト(未登録語)がテキスト出力されるため、それをそのまま「ルール辞書へ手動登録するリスト」として活用できます。
  • 誤検出の防止:無理やり単一の品詞として登録してしまい、意図しない箇所で指摘が出るリスクを回避できます。

おわりに

「辞書登録を効率化したいけれど、管理が煩雑になるのは避けたい」という方は、ぜひこの「品詞欄を管理用の目印にする」運用を試してみてください。

付録

付録1: 検出したい表記の品詞の確認

検出したい表記の前後に語句を含んだ文を形態素アナライザーで解析すると、その表記が「単一の品詞」か「複数の品詞が組み合わさった表記」かを確認できます。

例えば、「彼はその作業を一度に終わらせようとしました。」の「一度に」は、一見すると副詞のように思われますが、Just Right!は複数の品詞の組合せ(副詞「いちど」+助詞「に」)として認識します。

<関連記事>
「形態素アナライザー」による単語登録

付録2:検出したい表記が単一の品詞の場合

Excelの表で、適切な品詞を指定すれば一括登録できます。辞書登録したのに指摘されないときには、以下の記事を参考にしてください。

<関連記事>
辞書登録したのに指摘されない、校正結果がおかしいときには

付録3:弾かれた未登録語の確認

品詞欄に実際の品詞名以外の文字を記載したルール行は登録されず、登録時に未登録後数として弾かれます。

(画像をクリックで拡大)

登録時に未登録語の出力を指定していた場合には、登録されなかったルール行がテキストに出力されます。

(画像をクリックで拡大)

Just Right! 活用コラムのトップへ

目次