著者
浦本 直彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.37, no.12, pp.2182-2189, 1996-12-15
被引用文献数
11

本論文では コーパスに基づくシソーラスを構築するための基礎として 既存の中規模のシソーラスとコーパスを用いて シソーラスを拡張する手法について述べる. シソーラス上にない単語に対して その単語がシソーラスのどの部分に配置される可能性が高いかをコーパスから抽出した統計情報を用いて決定する. シソーラスの分類基準(視点)を自動的に獲得することで 効率良く単語の位置を推定することが可能である. これらの知識を用いて 拡張されたシソーラス上での位置 上位語 単語間の類似度などを計算する関数群を提供するためのシステムを作成した.This paper describes development of a corpus-based thesaurus system. For the purpose, a method for positioning unknown words in an existing thesaurus is proposed. A likely area of the thesaurus for an unknown word is estimated by integrating the human intuition buried in the thesaurus and statistical data extracted from the corpus. To overcome the problem of data sparseness, distinguishing featured called "viewpoints" of each node are extracted automatically and used to calculate the similarity between the unknown word and a word in the thesaurus. The results of an experiment confirm the contribution of the viewpoints to the positioning task. By using some functions for accessing the thesaurus with viewpoints, users can get information for words in the thesaurus including unknown words.
著者
丸山不二夫 浦本直彦
雑誌
デジタルプラクティス (ISSN:21884390)
巻号頁・発行日
vol.5, no.4, pp.300-308, 2014-10-15

本インタビューでは,モバイル時代のサービスについて,モバイルサービスの現在の位置づけとそこから生まれてきたプラクティス,今後の方向性や日本企業や開発者の進む道についてさまざまな角度から議論した.
著者
渡辺 日出雄 浦本 直彦
雑誌
全国大会講演論文集
巻号頁・発行日
vol.45, pp.105-106, 1992-09-28

近年、Example-Based Approach(EBA)がMTの様々な部分で試みられ始めている。我々はEBAを用いたシステムとして、翻訳例だけでなく文法的要素だけからなる翻訳規則をも同一の枠組み(翻訳パターン)で扱うExample-Based Transfer SystemでるSim Tranと、英文解析の構造的意味的曖昧さを制約と用例ベースを利用して解消するシステムであるSENAを開発し使用している。一般にEBAによるMTの特徴は、・用例(又は知識)が相互に独立している。・用例の選択を類似性により行なう。という点にある。これらは、旧来の人間の直観に頼って規則を選択していたシステムとの大きな違いである。EBAが持つ特長についてはこの他にも隅田佐藤において議論されている。主なものを挙げると、以下のようになる。・知識(翻訳パターン)の獲得が容易である。・高品質な翻訳結果を得ることが出来る。・新たな翻訳パターンの追加が容易であり、システムの向上も容易となる。・ ラバストかつ安定したシステムを構築できる。更に、長尾はシソーラスを用いたExample-Basedの格フレーム選択処理が意味マーカーを用いたものよりも正解率が高いことを示している。さて、このようにEBAは非常に有望な手法であるが、今までの手法が抱えていたあらゆる問題点を解消できる万能薬というわけでない。どのような問題が存在するのかについては計算量の問題を除きそれほど議論されていないのが実情である。そこで本論文では、Sim Tran,SENAの開発を通して得られたEBAによるMTが抱える問題点について述べ、同時にその問題点に対する対処方法について論じる。