著者
吉岡 真治 落合 翔平
出版者
公益社団法人 精密工学会
雑誌
精密工学会学術講演会講演論文集 2007年度精密工学会秋季大会
巻号頁・発行日
pp.513-514, 2007 (Released:2008-03-28)

TRIZなどに代表されるようにアイディア検索のために特許を利用する方法が提案されている。このような状況では、表面上の表記に注目した同分野の特許を検索するのではなく、類似の問題を扱っている特許を検索することが重要となる。本研究では、アイディアの根幹にある物理法則をキーとした検索を考え、学習により文書に対して関連物理法則のラベルをつけ、分類する方法を提案する。
著者
高橋 佑介 横本 大輔 宇津呂 武仁 吉岡 真治
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2011, no.6, pp.1-6, 2011-11-14
被引用文献数
1

本論文では,時系列ニュースを対象として,情報集約を行うための二種類の方式として,バースト解析およびトピックモデルの2つの手法の考え方を組み合わせることにより,トピックのバーストを検出する方式を提案する.時系列ニュースにおけるバーストとは,世の中における特異な出来事に対応して,ある時期からその出来事に関連するニュース記事が急激に増加する現象を指す.バーストを検出するための代表的な手法として,Kleinbergのバースト解析が挙げられる.この手法においては,一般的に,バーストの検出はキーワード単位で行われる.一方,文書集合におけるトピックの分布を推定するものとしてLDA (latent Dirichlet allocation) やDTM (dynamic topic model) に代表されるトピックモデルがある.トピックモデルを適用することにより,ニュース記事集合全体の情報を,いくつかのトピックに集約することができる.以上の既存技術をふまえて,本論文では,DTMを用いて推定したトピックに対してバースト度を付与することで,トピック単位のバーストが検出可能であることを示す.Among various types of recent information explosion, that in news stream is also a kind of serious problems. This paper studies issues regarding two types of modeling of information flow in news stream, namely, burst analysis and topic modeling. First, when one wants to detect a kind of topics that are paid much more attention than usual, it is usually necessary for him/her to carefully watch every article in news stream at every moment. In such a situation, it is well known in the field of time series analysis that Kleinberg's modeling of bursts is quite effective in detecting burst of keywords. Second, topic models such as LDA (latent Dirichlet allocation) and DTM (dynamic topic model) are also quite effective in estimating distribution of topics over a document collection such as articles in news stream. This paper focuses on the fact that Kleinberg's modeling of bursts is usually applied only to bursts of keywords but not to those of topics. Then, based on Kleinberg's modeling of bursts of keywords, we propose how to measure bursts of topics estimated by a topic model such as LDA and DTM.
著者
吉岡 真治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2021, no.SWO-055, pp.05, 2021-11-26 (Released:2022-01-12)

Wikipedia is one of the largest knowledge resources available via the Internet. Several methods have been proposed for extracting knowledge/information from Wikipedia, but methods based on extracting knowledge from the Wikipedia category structure can not utilize whole part of its structure because of the complexity of the relationships between the various categories. In this paper, we briefly review our previous researches on analyzing Wikipedia category and introduce a framework called "Wikipedia Category Ontology" (WCO) that aims to act as a basis for interpreting the Wikipedia category structure. It is based on a classification of category types and relationship types and available online in the form of Linked Open Data at http://wcontology.org/. We also demonstrate the system by using Wikipedia category analysis scenarios.
著者
吉岡 真治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2017, pp.1E1OS24a3, 2017

<p>本試論では、自動運転の車のようなオープンな環境で利用される人工知能を搭載された人工物の製造物責任について検討する。オープンな環境における責任を議論するためには、様々な事態と付随するリスクを認識し、製造者と利用者が適切に分担する枠組が必要になると考えている。本論では、トロッコ問題を例にとり、製造者と利用者がリスクを適切に認識するための枠組とその実現のための人工知能の果たすべき役割について考察する。</p>
著者
片寄 諒亮 吉岡 真治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.3Rin412, 2020 (Released:2020-06-19)

近年、時系列データや金融指標を用いたテクニカル分析やファンダメンタル分析、さらにニュース情報を用いたテキスト分析など様々な形で株価の予測が行われている。我々は、テクニカル分析などを用いたアルゴリズム取引が増えていることを考慮し、複数のテクニカル指標を用いた機械学習による株価予測の手法を提案する。この際に、企業の決算発表やニュースリリースなどテクニカル分析以外の要因の影響を考慮し、テクニカル分析による当てはまりが良い銘柄、悪い銘柄などを分類した上で作成した学習・評価データを作成して評価を行うと共に、複数のテクニカル指標の組み合わせ方法について検討を行う。
著者
立浪 紀彦 吉岡 真治
雑誌
研究報告知能システム(ICS) (ISSN:2188885X)
巻号頁・発行日
vol.2018-ICS-192, no.6, pp.1-4, 2018-06-29

多様な配信元によるインターネット上のニュース記事について,それぞれの記事が,取り上げているトピックに対してどのような姿勢 (スタンス) で報道されているのかについて分析するために,統計的有意かつ比較対象とする記事群での支持度 (アイテムの出現頻度 / 全データ数) の比が大きなパターンに注目した Statistical Emerging Pattern Mining を用いた分析手法を提案する.また,予備的な実験をおこない,その考察を行い,提案手法がトピックに特徴的な語を見つけるという性質を持つことを確認したが,ニュースサイトの分析という意味では,まだ不十分であることを確認した.今後は,ニュースサイトの特徴を,より,抽出しやすくするための比較対象とする記事群の設定方法などについて,考察を進めていくことが必要であることが分かった.
著者
神門 典子 吉岡 真治 山本 岳洋 酒井 哲也 相澤 彰子 大島 裕明
出版者
国立情報学研究所
雑誌
基盤研究(A)
巻号頁・発行日
2016-04-01

平成28年度の研究実績の概要は下記の通りである。(1)ユーザの状況の捕捉と分析:探索的検索の例として、網羅的な情報探索タスク、探索中のユーザの時間認識、および、モバイル検索と音楽検索における複雑さの異なる検索タスクにおいて、ユーザ実験を行い、ログと、視線・インタビュー・アンケートなどのインタラクションデータを収集し、タスクと状況に応じた傾向を分析した。(2)ユーザの状況に応じて、ユーザを支援する技術: a) 網羅的情報探索のタスクにおいて探索を支援するクエリ推薦インターフェース、b) マルチファセット検索インタフェース、c)検索結果の多様化と多段階要約提示、d)ファセット検索の精緻化に必要な要素技術として 1) Wikipedia、DBPediaなどからのNamed Entityの属性抽出と組織化、2)文書中の非自然言語要素(数式など)へのアクセスについて、研究を進めた。上記a)は、あるクエリに対する未知の適合情報を含む度合いを、観点多様性と既知適合情報のディスカウントを考慮して定式化している。ユーザ実験の結果、既存方式よりも有効なことが示唆された。b)は、広く多様なタスクに適用可能な基盤技術の一つである。c)は、モバイル検索など、画面の小さいデバイスを用いて、探索的な検索において、特に有用である。(3)検索の基礎技術として、検索の多様化について研究を進めた。また、検索実験の規模(とくに、検索課題(topic)数)による実験結果の信頼性・妥当性を検証する方式を提案し、数学・統計学の理論に基づいて考究するとともに、多くの実例に適用して検証をすすめた。
著者
吉岡 真治
出版者
東京大学大学院工学系研究科精密機械工学専攻
巻号頁・発行日
1996-03-29

報告番号: 甲11796 ; 学位授与年月日: 1996-03-29 ; 学位の種別: 課程博士 ; 学位の種類: 博士(工学) ; 学位記番号: 博工第3594号 ; 研究科・専攻: 工学系研究科精密機械工学専攻
著者
竹内 孔一 内山 清子 吉岡 真治 影浦峡 小山 照夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.5, pp.1446-1456, 2002-05-15
被引用文献数
8

本研究では,主辞がサ変名詞である複合名詞の語構成において,構成する単語間の係り関係を支配する語彙的性質に着目し,それに基づく複合名詞解析モデルの作成を試みる.主辞がサ変名詞の複合名詞内の係り関係の解析は,並列関係の場合を除くと,主辞であるサ変名詞の項関係なのか修飾なのかを同定することが解析の第1歩である.項関係とは名詞が動詞の目的語や主語といった関係であることを意味している.本論文では,この関係をとらえる方法として,語彙概念構造を利用した動詞の分類と,その構造を利用した名詞の分類に基づく複合名詞解析手法を提案する.情報処理関連の専門用語と新聞記事中の一般的な複合名詞に対してテスト的な実験を行った.その結果,平均で1231語の複合名詞対して約99.4%の複合名詞を正しく解析する結果を得た.In this paper,we describe a principled approach for analyzing relations between constituent words of compound nouns,specifically those whose heads are deverbal nouns,based on the classification of deverbal nouns by their lexical conceptual structure (LCS) and the classification of nouns in modifier position vis-a-vis LCS of head deverbal nouns.There are two kinds of relations of compounds with head deverbal nouns.The one is that a modifier noun becomes an argument of deverbal head and the other is that a modifier becomes an adjunct.It is an important starting point for analyzing relations to disambiguate the two kinds of relations.Through the qualitative analysis of the data and the experimental evaluation of 1231 compound nouns, we show that the use of LCS as the theoretical basis is very promising for constructing compound analyzer.
著者
内山 清子 竹内 孔一 吉岡 真治 影浦 峡 小山 照夫
出版者
国立情報学研究所
雑誌
学術情報センター紀要 (ISSN:09135022)
巻号頁・発行日
vol.11, pp.49-57, 1999-03
被引用文献数
1

専門分野における複合名詞を分析する時に、複合名詞を構成している語構成要素の情報が必要となってくる。本研究では、語構成要素の文法情報だけでどこまで複合名詞の性質を分析することができるかどうかを見きわめるために、語構成要素を文法情報である品詞相当カテゴリーに分類するための検討を行った。語構成要素においては、従来の文/単語関係で定義された品詞カテゴリーをそのまま適用することは難しい。そこで本研究では、従来の品詞カテゴリーを参照しつつ、新たに語構成用の品詞相当カテゴリーとその定義を設定することを試みた。
著者
吉岡 真治 冨岡 克広 原 真二郎 福井 孝志
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

ナノ結晶デバイスの開発プロセスにおいては、製造プロセスがデバイスの性質に大きな影響を与えるため、試行錯誤的な実験の繰り返しが必要とされる。しかし、その試行錯誤に関する知識はあまり明示化されていないため、熟練者の「匠の技」である暗黙知に依存している。本研究では、デバイス生成のための実験を行った記録を情報源として、この暗黙知の明示化を支援する実験記録データの活用システムを提案する。
著者
吉岡真治
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012, no.1, pp.1-5, 2012-07-25

現在、Wikipedia の情報を中心に様々な Open Data を関連づけて活用する Linked Open Data の研究が行われている。本発表では、Wikipedia のページが表現する情報の粒度が与える影響について考察を行う。
著者
吉岡 真治 劉 亦奇 神門 典子
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.5, no.3, pp.141-148, 2012-09-28

近年,地理情報を扱う情報システムの増加にともない,地理情報に関するデータベースへのニーズが高まっている. GeoNames は, Open Data としては,最大規模の地理情報データベースである.本データベースを Linked Open Data として Wikipedia の情報を媒介として関連づけることにより, Web Ontology の開発などに役立てられている.ただし, GeoNames と Wikipedia の間のリンクについては,自動的なリンク発見の試みがいくつか行われているものの,十分な数のリンクが付与されている状態ではない.本論文では, Wikipedia のカテゴリ情報を使うことで,精度良く Wikipedia のページに対応する GeoNames のエントリを発見する方法を提案する.また,本手法は,既存のリンク中の不適切なリンクを発見する際にも利用可能であることを示す.本手法の成果については,すでに, GeoNames の管理者に報告しており,その成果の一部は, GeoNames 中のリンク情報として公開・修正が行われている.Recently, due to the higher demand for geographic information system, it is necessary to have a good geographical database for such systems. GeoNames is one of the largest geographical database as Open Data. This database is also used for constructing web ontology by adding links to the Wikipedia page as a part of Linked Open Data. Even though, here are several attempts to find links automatically, the number of links between GeoNames and Wikipedia is not sufficient. In this paper, we propose an automatic link discovery method to use Wikipedia categories to identify the correspondence between Wikipedia page and GeoNames entry. We also propose to use this method for inappropriate link detection. Link data obtained in this paper is already sent to the manager of GeoNames and a part of the result is used for updating the site.
著者
吉岡 真治 原口 誠 大久保 好章
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.41, pp.151-158, 2002-05-21

情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。この問題に対し、検索者の検索意図を推定し、検索者の補完を行う検索システムが提案されている。しかし、補完した結果は複雑であることが多く、検索者が補完結果自体を評価することが困難である。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案する。本報では、概念階層の汎化のレベルを決定するために、検索者により入力された検索語が持つ適合性判定への寄与度を考える。また、本システムの性能を向上させるためには、概念階層自体が目的に応じて再構成されることが必要であることについて述べ、目的指向の概念階層の修正の方法を提案する。It is not easy for a user of Information Retrieval (IR) system to select appropriate keywords. Therefore, many IR systems have capability to modify keywords by estimating user's intent. However, since modified keywords are usually represented as complicated form, it is difficult to judge the appropriateness of them. In this research, we proposed a new IR system that uses adaptive generalization of keywords. When the system can selects appropriate generalization by estimating user's intent, the system can generate good keywords that have high readability and good retrieval performance. In this report, we proposed to use the contribution value of each keyword for relevance judgement to select appropriate generalization. In addition, we confirm general concept structure stored in a thesaurus is not sufficient for representing particular user's intent. Therefore, we proposed a purpose oriented method to modify concept structure.
著者
大塚 博紀 吉岡 真治
出版者
一般社団法人情報処理学会
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2009, no.35, pp.9-14, 2009-03-18

Web 文書の特徴はリンクによりお互いの文書の関係が示されている点にあり、この情報は PageRank に代表される Web 空間の解析手法に用いられている。しかし、これらの解析では、サイト内、サイト外といった分類は考慮されているものの、ページの中でのアンカーテキストの役割には、注目していない。本研究では、このアンカーテキストの役割の違いに注目し、適切に分類することで、リンク構造解析や Web ページ上でのユーザーの行動解析に役立てる事を目標としている。本稿では、人手による役割分析の結果に基づいたアンカーテキストの自動分類システムを提案する。また、その有効性を検証するために、実際に人手の分類とシステムの出力を比較した結果について報告する。A Link Structure among Web documents represents the relationship among these documents. Web structure analysis methods such as PageRank use this information. However, most of these methods pay little attention to the type of link (e.g., most of the methods use simple classification such as link to the same site or not). In this research, we proposed a method to classification criteria of anchor texts based on the role analysis of the text in Web documents for better link structure analysis and the users' behavior analysis on the Web page. In this paper, we propose an automatic classification method based on the result of manually classification experiment. In order to evaluate this method, we compare the result of automatic classification results with manually classified ones.