著者
Halstead Patrick 奥村 薫
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.55-56, 1997-03-12

膠着言語である日本語は単語境界が自明でないため、さまざまなアプリケーションで文章を取り扱う際に、「単語」単位の操作が英語ほどには簡単でなかった。単語の選択・置換・検索といった基本的な操作を可能にし、また更に深い自然言語解析の第一歩とするために、われわれは極めてコンパクトな形態素解析コンポーネント、愛称"T-Hammer"を研究開発した。本稿では、共通コンポーネントとしての T-Hammerの概要、精度、および今後の課題について考察する。現在 T-HammerはWord 97, Encarta, Bookshelf, IISなどの製品に実装されている。
著者
脇田 早紀子 奥村 薫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1993, no.79, pp.135-142, 1993-09-16
被引用文献数
2

日本語の場合、単純に見えるタイプミスでも機械に発見させようとするとけっこう難しい。タイプミスを検出するには、形態素解析を行いその失敗箇所を警告する方法が一般的だが、誤り文でも形態素解析ができてしまうことが多いので、この方法だけでは不十分である。本研究は、「形態素解析失敗」では発見できないミスタイプ文を発見することを目的としている。ミスタイプ文の特徴を記述した検出ルールの原型と、それを実用レベルにまで高めるために必要な修正作業について述べる。It is hard to make useful Japanese spell-checker. General way to detect typographical error is to regard failure of morphological analysis as the indicator of error position, but it's not perfect. In this paper, we propose rules to detect typographical error which can't be detected by the general method.