著者
海野 裕也 那須川 哲哉
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

企業の国際化が進むにつれ,複数言語で書かれた文書を解析する需要が増えている.こうした企業のもつ文書は分野固有の語彙が多いため,一般的な辞書を使って解析することは難しい.本研究の目的は,対訳辞書を対象文書から自動獲得し,実際にテキストマイニング技術へ応用するまでを全て自動的に行うことである.実験的に性能を評価して,構築された対訳辞書の精度が高くなくても有用な知見を発見できたことを報告する.
著者
西山 莉紗 竹内 広宜 渡辺 日出雄 那須川 哲哉
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.24, no.6, pp.541-548, 2009 (Released:2009-10-20)
参考文献数
19
被引用文献数
3 2

It is important for R&D managers, consultants, and other people seeking broad knowledge in technology fields to survey technical literature such as research papers, white papers, and technology news articles. One of the important kinds of information for those people regards the effectiveness of new technologies in their own businesses. General search engines are good at selecting documents revealing the details of a specific technology or a technology field, but it is hard to obtain useful information about how a technology will apply to individual business cases from such search results. There is a need for a technology survey assistance tool that helps users find technologies with suitable capabilities. In this paper, two technical tasks were tackled to develop the prototype of this assistance tool: Extraction of advantage phrases and scoring for the advantage phrases to find novel applications in the target technology field. We describe a new method to identify advantage phrases in technical documents and our scoring function that gives higher scores to novel applications of the technology. The results of evaluations showed our phrase identification method with only a few phrasal patterns performs almost as well as human annotators, and the proposed scoring conforms better to the decisions made by professionals than random sort.
著者
那須川 哲哉
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.68, no.7, pp.326-331, 2018-07-01 (Released:2018-07-01)

個々のテキストに目を通しただけでは得られない有用な知見を大量のテキストデータから獲得するためのテキストアナリティクスの技術について,概要と仕組みと動向を紹介した上で,その要素技術である自然言語処理における深層学習の影響について考察する。さらに,特許情報分析に対するこれらの技術の影響と方向性を考察する。
著者
武田 浩一 住田 一男 那須川 哲哉
雑誌
デジタルプラクティス (ISSN:21884390)
巻号頁・発行日
vol.7, no.4, pp.394-405, 2016-10-15

「デジタルプラクティスの読者の方には,自分の専門をちょっと壊してほしい!」.人工知能の父と呼ばれるMarvin MinskyやAlan Kay等との親交が深い静岡大学教授の竹林洋一氏を迎え,これまでの人工知能技術の研究開発を俯瞰するとともに,「ディープラーニングには何が足りていないのか」,「将来を見据えて研究開発のターゲットを設定することの大切さ」,現在精力的に取り組まれている「人工知能の医療介護への応用」といったテーマで大いに語っていただきました.
著者
那須川 哲哉 金山 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.73, pp.109-116, 2004-07-16
参考文献数
15
被引用文献数
12 5

組織・製品などに関して好不評を示す表現,及びそれが好評を示すか不評を示すかの極性を,文書データから教師なし学習で獲得する手法を示す.ある対象に関して評価を述べる内容を記述する際には,好評もしくは不評の意見を列挙することが多く,好不評の極性を反転させる際には「けれども」「しかし」といった接続表現で明示することが多い.本手法では,この『評価表現の文脈一貫性』を利用し,「満足する」「不満だ」などの種表現の周辺文脈から評価表現の候補とその極性を抽出し,各候補の文書データ全体における分布から評価表現としての妥当性を判定する.得られた評価表現を種表現に追加する操作を再帰的に実行することで,好不評の極性付きの語彙を,少数の種表現から自動構築することが可能になる.デジタルカメラと映画に関する掲示板のデータで実験したところ,各々の分野に特徴的な評価表現を高い精度で抽出することができた.This paper presents an unsupervised learning method to acquire sentiment expressions that indicate either favorable or unfavorable opinion toward a specific subject. Our approach is based on a characteristic of sentiments that multiple sentiment expressions often appear near each other in texts with the same polarity of favorability, unless the change is explicitly indicated by a clue term such as an adversative conjunction. By taking advantage of this characteristic, our unsupervised method extracts sentiment expressions and their polarities from a corpus starting from a very small set of seed expressions and analyzing their neighboring expressions in the corpus. In our experiment on discussion board messages about digital cameras and movies, we could acquire a good set of sentiment expressions relevant to each domain.
著者
西山 莉紗 竹内 広宜 渡辺 日出雄 那須川 哲哉
出版者
The Japanese Society for Artificial Intelligence
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.24, no.6, pp.541-548, 2009
被引用文献数
1 2

It is important for R&D managers, consultants, and other people seeking broad knowledge in technology fields to survey technical literature such as research papers, white papers, and technology news articles. One of the important kinds of information for those people regards the effectiveness of new technologies in their own businesses. General search engines are good at selecting documents revealing the details of a specific technology or a technology field, but it is hard to obtain useful information about how a technology will apply to individual business cases from such search results. There is a need for a technology survey assistance tool that helps users find technologies with suitable capabilities. In this paper, two technical tasks were tackled to develop the prototype of this assistance tool: Extraction of advantage phrases and scoring for the advantage phrases to find novel applications in the target technology field. We describe a new method to identify advantage phrases in technical documents and our scoring function that gives higher scores to novel applications of the technology. The results of evaluations showed our phrase identification method with only a few phrasal patterns performs almost as well as human annotators, and the proposed scoring conforms better to the decisions made by professionals than random sort.
著者
村上 明子 那須川 哲哉
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.73, pp.117-124, 2004-07-16
被引用文献数
1

大量のテキストを分析し傾向を捉えるテキストマイニングにおいて、分析の観点で同義表現とみなせる語を代表的な表現に集約することは、表層表現の出現頻度のみで分析をするよりも有効である。そのためには、一般的な同義表現のみならず、分析対象の文書と目的に特化した同義表現の辞書が必要になる。本稿では、筆者別に分けられた文書集合を、表現の一貫性が保たれた文書集合として用いることにより、同義表現抽出の精度を向上させる手法を示す。我々は同一の筆者であれば一つの対象を表現するために、常に同じ表現を使う傾向があると仮定した。この仮定によれば、筆者別に分けられた文書内で似た文脈をもつ語あるいは表現のほとんどが類義表現であっても同義表現ではないといえる。コールセンターの対応記録データを用いて実験を行った結果、この仮定と本手法の有効性が示された。We present a text mining method for finding synonymous expressions based on the distributional hypothesis in a set of coherent corpora. This paper proposes a new methodology to improve the accuracy of a term aggregation system using each author's text as a coherent corpus. Our approach is based on the idea that one person tends to use one expression for one meaning. According to our assumption, most of the words with similar context features in each author's corpus tend not to be synonymous expressions. Our proposed method improves the accuracy of our term aggregation system, showing that our approach is successful.