「なる」型表現を検出する – 翻訳しやすい日本文を

【Just Right!・ATOK活用ガイド / Just Right!活用コラム / Just Right!で翻訳しやすい日本文を】

主なトピック
・「なる」型表現とは
・校正用ユーザー辞書で検出する
・ルール辞書で検出する
・ルール辞書で過指摘を回避する

「なる」型表現とは

日本語スタイルガイド第３版 208ページ「なる」型の表現　を参照します。

「なる」型表現とは、他動詞の目的語を主語にした自動詞的表現である。本来であれば、「する」を使って能動的に表現すべきだが、行為者を前面に押し出さない受動的な表現を好む控えめ文化の日本語では、この「なる」型で表現されることがある。
「する」型表現と「なる」型表現の使い方の違いは次のとおりである。

「する」型表現　私は運転速度を時速50キロメートルにする。
「なる」型表現　運転速度が時速50キロメートルになる。

しかし、「なる」型表現は、上記の文例のように行為者が曖昧になり、表現としても弱くなるので、実用文には向いていない。（中略）「する」型表現にすることで行為の主体が見えてくるので、翻訳しやすくなる。また必要に応じて明快な受身形にすることで翻訳しやすくなる。

「日本語スタイルガイド第３版（一般財団法人テクニカルコミュニケーター協会編著）第５編　翻訳しやすい日本語の要点」より引用

校正用ユーザー辞書で検出する

この例文の「なる」型表現の箇所がJust Right!の校正用ユーザー辞書に登録して検出できるか確認します。まず、Just Right!に付属している形態素アナライザーを利用して、登録する語句の語幹、品詞を正しく把握します。

STEP1　形態素アナライザーで語幹や品詞を確認

「入力文」欄に例文をペーストし、「単語に分解」ボタンをクリックすると、分解された結果が表示されます。結果の「な」の部分をクリックすると「な」の単語情報がさらに表示されます。「～になる」の「な」を「ラ行五段」の動詞として登録すれば、語句の範囲が正しく認識され、検出できそうなことが確認できました。

STEP2　校正用ユーザー辞書への登録

形態素アナライザーで確認できた語幹や品詞を、校正用辞書ユーティリティを使用してユーザー辞書に登録します。

指摘レベルは仮に「1:警告」としました。検出された場合にオレンジ色でハイライト表示されます。指摘理由には、検出されたあとの処理等ヒント情報的なコメントを入力しました。

STEP3　Just Right!でトライ

先ほどの辞書を指定した校正設定を作成し、先ほどの例文の他、いくつか派生した例文を作成し校正してみます。

語幹「な」の語尾が活用していても適切に検出されていることが確認できました。設定した指摘理由も校正結果にヒントとして表示されました。

課題

ただし、かな表記の「な」だけを登録したため、敬語表現「お召しになる」など正しい表記の箇所についても指摘されています。動詞をユーザー辞書に登録して指摘させるだけでは、指摘し過ぎることになります。この現象を「過指摘」と呼びます。
「過指摘」を回避したり、さらに実用的な検出ができるようにするためには、ユーザー辞書への登録だけでなく、前後に組み合わされる表記と組み合わせて検出できるようにするルール辞書の作成が必要となります。

ルール辞書については次回以降の連載で少しずつ触れていきます。

（「なる」型表現を検出する第１回　終わり）

＜お問合せ＞
記事に関するご質問、お問合せはこちらまで

ルール辞書で検出する

ルール辞書を作成することで、「過指摘」を回避できます。ルール辞書でどのように実現すればよいか、段階を追って解説します。

STEP1　「なる」型表現を検出するルール辞書を作成

まず、校正辞書で検出できるようにした「なる」型表現を、ルール辞書でも検出できるようにしてみます。
ルール辞書に変換する前のルール定義を下記のようなテキストファイルとして作成します。1行目はソースファイルとしてのお約束で、最後の3行部分が「なる」型表現を検出する定義です。検出したときに表示させるコメントもユーザー辞書と同じにしてみました。

この定義ファイル「rule.src.txt」をルール辞書変換ツールで辞書形式に変換します。

「入力ファイル」欄でルール定義ファイルを指定し、「出力ファイル」欄でルール辞書ファイルの書き出し先およびルール辞書の名前を指定してから、「ルール辞書を作成」ボタンをクリックすると、エラーがなければルール辞書が作成されます。

STEP2　ルール辞書で検出するように校正設定を編集

この作成された辞書を使用するためには、校正設定を編集してルール辞書を指定する必要があります。
少なくとも「用語基準」タブの「辞書登録された指摘」および「ルールチェック」タブの「ルール辞書によるチェックを行います」の2つのチェックを付けたうえで、ルール辞書ファイルを指定します。

STEP3　Just Right!でトライ

第1回連載の例文を校正してみます。

語幹「な」の語尾の活用形部分はハイライトされませんが、検出されていることが確認できました。設定した指摘理由も校正結果にヒントとして表示されました。

組合せで指定する場合は？

次回は「この表記は正しいです」というルール定義を追加していくことで、正しい表記は指摘されないようにしていきます。下記の敬語表現の正しい表記が指摘されないようにしてみます。
・お召しになる
・おいでになる
・お見えになる
・お越しになる
・ご覧になる
・お聞きになる
・お思いになる
・お会いになる

（終わり：「なる」型表現を検出する２ – ルール辞書による過指摘回避【基本編】）

＜お問合せ＞
記事に関するご質問、お問合せはこちらまで

ルール辞書で過指摘を回避する

正しい表記は指摘しないルール辞書を作成することで、「過指摘」を回避できます。ルール辞書でどのように実現すればよいか、段階を追って解説します。

STEP1　「なる」型表現を検出しつつ、正しい表記は指摘しないルール辞書を作成

「なる」型を検出する定義に続けて、新たに「お召しに」で始まる「なる」型は正しい表記なので検出しなくてよいです、という定義を追記します。
赤枠で囲った3行の最後の行を「1」とすることで正解ルールであると定義しています。

この定義ファイル「rule.src.txt」を再度ルール辞書変換ツールで辞書形式に変換します。

STEP2　JustRight!でトライ

例文を校正してみます。

「お召しになる」は指摘されなくなりました。
その他の尊敬語についても、同じように正しい表記を定義すれば指摘されなくなりますが、メンテナンス性がよくないため、もう少し汎用的なルールにしてみます。

STEP3　グループ定義を使用してルール辞書を作成する

「お召しになる、おいでになる、お見えになる、お越しになる、ご覧になる、お聞きになる、お思いになる、お会いになる」について形態素アナライザーで確認してみます。

一部を除いて「接尾語」＋「尊敬語の語幹部分」＋「なる」型であることが分かります。この「尊敬語の語幹部分」をグループ定義として別ファイルで定義します。
「尊敬語の語幹部分」として「召し」「いで」「見え」「超し」「覧」「聞き」「思い」「会い」のいずれの表記がきても検出できるように下記のように定義します。

あわせて、「尊敬語の語幹部分」を「@尊敬語語幹」と指定することで「尊敬語の語幹部分」の表記が変わっても検出できるように汎用的なルールにしました。

ルール辞書変換ツールで辞書形式に変換する際には、新たに作成したグループ定義のファイルも指定します。

STEP4　JustRight!で再トライ

例文を校正してみます。

「おいで」と「ご覧」の表記を除いて「接尾語」＋「尊敬語の語幹部分」＋「なる」型の表記は指摘されなくなりました。
この「おいで」と「ご覧」は、Just Right!標準の辞書に名詞として登録されており、名詞としてセットで認識されるため、今回のルール定義だけでは指摘を回避できませんでした。ただし、例外対応として、正しい表記としての定義を追加することで指摘しないようにできます。

辞書を生成し直して例文を校正してみます。

「接尾語」＋「尊敬語の語幹部分」＋「なる」型の表記は指摘されなくなりました。

（終わり：「なる」型表現を検出する３ – ルール辞書による過指摘回避【応用編】）

＜お問合せ＞
記事に関するご質問、お問合せはこちらまで

Just Right! 活用コラムへ

Just Right!・ATOK活用ガイド

「なる」型表現を検出する – 翻訳しやすい日本文を

「なる」型表現とは

校正用ユーザー辞書で検出する

STEP1 形態素アナライザーで語幹や品詞を確認

STEP2 校正用ユーザー辞書への登録

STEP3 Just Right!でトライ

課題

ルール辞書で検出する

STEP1 「なる」型表現を検出するルール辞書を作成

STEP2 ルール辞書で検出するように校正設定を編集

STEP3 Just Right!でトライ

組合せで指定する場合は？

ルール辞書で過指摘を回避する

STEP1 「なる」型表現を検出しつつ、正しい表記は指摘しないルール辞書を作成

STEP2 JustRight!でトライ

STEP3 グループ定義を使用してルール辞書を作成する

STEP4 JustRight!で再トライ

STEP1　形態素アナライザーで語幹や品詞を確認

STEP2　校正用ユーザー辞書への登録

STEP3　Just Right!でトライ

STEP1　「なる」型表現を検出するルール辞書を作成

STEP2　ルール辞書で検出するように校正設定を編集

STEP3　Just Right!でトライ

STEP1　「なる」型表現を検出しつつ、正しい表記は指摘しないルール辞書を作成

STEP2　JustRight!でトライ

STEP3　グループ定義を使用してルール辞書を作成する

STEP4　JustRight!で再トライ