著者
久野 靖
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:03875806)
巻号頁・発行日
vol.25, no.4, pp.515-523, 1984-07

計算機を使用して日本語文書を作成する方法の一つとして, かな分ち書きテキストから出発し, テキストごとに固有の辞書を用意し, つづり単位の置換えによって漠字かなまじりテキストを生成する, というものがある. このかな漢字変換方式をマクロ方式と呼ぶ. その特徴は, かなテキストを基本とするためテキストを能率よく入力, 編集できること, および変換方式が単純なため処理速度が速いことである. しかるに, マクロ方式では利用者自身がテキストごとの辞書を管理し, 同音異語に対する処置を行うので, その手間がどのくらいかは重要な問題である. そこで本文では, 翻訳書1冊分のデータを分析することにより, この問題に対する解答を与えることを試みる. その結果, 利用者が管理しなければならない辞書の項目数は書籍1冊でも数千程度で, しかもある程度以上大きなテキストについてはその数はテキストの大きさのせいぜい平方根程度でしかふえないこと, およびテキストの全つづりのうち, 同音異語に対する処置を個別に行わなければならないものの比率約1.2%であることがわかる. マクロ方式は用語の統一やつづり誤りの検出などを通じて文章を改良していく道具としても有効であるので, そのことを考え合わせると文章作成を中心とした日本語文書処理において有望であると結論される.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

収集済み URL リスト