著者
吉村 衛 木村 文則 前田 亮
雑誌
じんもんこん2011論文集
巻号頁・発行日
vol.2011, no.8, pp.261-268, 2011-12-03

現在,日本語の古文に対して汎用的に用いることができる形態素解析器は存在しない.それゆえ日本語の古文に対しては,文章を単語に分割することさえ困難である.単語分割が行えるようになると,古文テキストの解析に役立てることができる.本論文では,日本語の古文の文章を単語に分割する手法を手案する.本手法では,文字Nグラムの単語らしさを評価し,この単語らしさが高い文字Nグラムを単語として文の単語への分割を行う.今回は,「源氏物語」に対し本手法の評価実験を行い,評価・考察を行う.
著者
木村 文則 前田 亮 波多野 賢治 宮崎 純 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.49, no.7, pp.59-71, 2008-03-15
参考文献数
18
被引用文献数
1

本論文では,Web 文書の言語横断情報検索において,Web ディレクトリの階層構造を利用して問合せの検索対象分野の推定に基づいた検索手法を提案する.提案手法では,Yahoo! カテゴリのような複数の言語版を持つWeb ディレクトリを問合せ翻訳における訳語の曖昧性解消のための言語資源として利用し,Web ディレクトリの下層のカテゴリを上位のカテゴリに統合したうえで,利用者が入力した問合せ語群から検索対象分野の範囲を推定することで,問合せ語群の最適な訳語に翻訳することにより,言語横断情報検索を行う.評価実験では,Web 文書の言語横断情報検索に適切なカテゴリ統合度がどの程度であるのか検証し,提案した検索対象分野の推定の有効性を検証した.In this paper, we propose a cross-language information retrieval (CLIR) method based on an estimate of query domain related with search results using hierarchic structures of Web directories. To get the most appropriate translation of the queries, we utilize the Web directories written in many different languages as multilingual corpus for disambiguating translation of the query and estimate a domain of search results using hierarchical structures of Web directories. Experimental evaluations showed that we could have an advantage in retrieval accuracy using our proposal for disambiguating translation in CLIR system.
著者
澤田 敬治 手塚 太郎 木村 文則 前田 亮
雑誌
全国大会講演論文集
巻号頁・発行日
vol.第71回, no.データベースとメディア, pp.563-564, 2009-03-10
著者
佐藤 貴文 後藤 真 木村 文則 前田 亮
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.57-64, 2013-12-05

本稿では,遠隔地にいる複数の人文系研究者によって,文献資料に関する注釈情報を共同で入力するためのWebシステムの試作について述べる.本研究で対象とする文献は『東大寺要録』という歴史資料であり,これに対して注釈作業を行っている人文系研究者による利用を想定している.本システムの特徴として,複数の研究者が同一の史料に対して同時に注釈の付与が可能である点,複数の研究者による注釈が部分的に重なる場合や,離れた文字にまとめて注釈を付与するなど,複雑に入り組んだ注釈への対応を考慮している点が挙げられる.本発表では,実際に利用する人文系研究者の意見を得ながら進めている本システムの構築について,現状の報告および今後の展望について述べる.