著者
荒井 俊介 辻 慶太
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.23, no.1, pp.1-19, 2013-02-20 (Released:2013-04-18)
参考文献数
34
被引用文献数
1 2

Blog やTwitter に書かれた日常的な質問を収集し回答を呼びかけるWeb サイトを構築すれば,記事の著者は効率よく回答を得ることが出来るかもしれない。本研究では次の2 つのステップからなる記事の収集方法を提案し,実際に質問を提示するWebサイトを構築して,有効性の検証を行った。即ち,(1)疑問の書かれた記事に特徴的な表現を用いた,既存のサーチエンジンによる検索,(2)テキスト自動分類を用いた疑問の書かれた記事の抽出,である。(1)では「タイトルが思い出せない」をキーワードとして用いることで,効率的に疑問の書かれた記事を抽出できることを明らかにした。(2)ではブースティングと決定木を用いる事で効率よく抽出できることを明らかにした。さらに疑問の書かれたBlog 記事30 個とTwitter 記事31 個をWeb サイトに提示した結果,それぞれ6 個と5 個の記事の著者を満足させる回答が得られた。
著者
荒井 俊介 辻 慶太
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.25, no.1, pp.23-40, 2015-02-28 (Released:2015-04-30)
参考文献数
23
被引用文献数
2

国立国会図書館は,レファレンス協同データベースでレファレンス事例を公開・提供している.レファレンス事例はこの事業に参加している各図書館によって登録されるが,登録の際の項目の一つであるNDCの項目に関しては全体の約2/3にしか記述されていない.本研究では機械学習を用いて,レファレンス事例に対して自動的にNDCを付与する手法を提案する.NDCの自動付与を行う事で,NDC を付与する図書館員の負担を軽減する事ができると考える.本研究では以下の3 つの手法を提案する.即ち(1)参考資料のNDC を用いる手法,(2)質問文から疎でない特徴ベクトルを作る手法,(3)両方同時に用いる手法,である.NDC の2 桁目(綱)まで自動付与する実験の結果,(1)では45.6%,(2)では53.8%,(3)では45.6%の精度で自動付与を行う事ができた.従来手法による精度は32.4%であり,精度を向上させる事ができた.