著者
宮本 雅人 酒井 浩之 増山 繁
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics (ISSN:13477986)
巻号頁・発行日
vol.18, no.5, pp.752-760, 2006-10-15
被引用文献数
1 2

研究のプレゼンテーションでは,限られた時間の中で,聴衆に研究成果をよく理解してもらうために,プレゼンテーションスライドの作成が必要不可欠である.しかし,スライドの作成には多くの時間と手間を要する.そのため,多くの研究者がスライド作成の効率化を望んでいる.本研究では,研究者の負担軽減を目的として,論文LATEX原稿からスライドを自動生成する手法を提案する.本手法では,LATEXファイルの解析,スライドへの内容の割り当て,接続詞を利用した箇条書き生成を行なう.LATEXファイルの解析では,スライド生成に必要な情報は残し,不要な情報の削除を行なう.LATEXファイルの定型的な構造を利用すれば,必要な情報を特定することが可能である.スライド割り当てにおいては,論文中での名詞の出現頻度,エントロピー,idf値に基づいて名詞の重要度を計算する.その重要度に基づいて,各セクションに対して,スライド枚数の割り当て,重要文の抽出を行なう.接続詞を利用した箇条書き生成においては,並列関係を表す接続詞を利用する.なぜなら,並列関係を表す接続詞を含む文には,その文と対になる文が存在する場合が多いからである.評価の結果,本手法は論文に忠実なスライド生成に有効であることがわかった.
著者
坂地 泰紀 酒井 浩之 増山 繁
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

本論文では,決算短信PDFから因果関係を抽出し,それを用いて過去の因果関係を表示させるシステムを提案する. 例えば,企業名をシステムに入力すると,その企業に関連する過去の因果関係を表示する.原因として「猛暑」,結果として「冷房需要の盛り上がり」という因果関係が表示されたとすると,現在,「猛暑」であれば,この銘柄に投資するためのポジティブな判断材料として役立つことができる.
著者
酒井 浩之 西沢 裕子 松並 祥吾 坂地 泰紀
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.172-182, 2015-01-06 (Released:2015-01-06)
参考文献数
13
被引用文献数
4

In this paper, we propose a method of extracting causal information from PDF files of the summary of financial statements of companies, e.g., ''The sales of smart phones was expanded continually''. Cause information is useful for investors in selecting companies to invest. We downloaded 106,885 PDF files of the summary of financial statements of companies from Web pages of the companies automatically. Our method extracts causal information from the PDF files by using clue expressions (e.g., ''was expanded'') and keywords relevant to a company. The clue expressions are extracted from the PDF files of the summary of financial statements of companies and articles concerning business performance of companies automatically. We developed the search system which is able to retrieve causal informations extracted by our method. The search system shows causal information containing a keyword inputted by users, and the summary of financial statements containing the retrieved causal information. We evaluated our method and it attained 83.91% precision and 55.04% recall, respectively. Moreover, we compared our method with Sakai et al's method originally proposed for extracting causal information from financial articles concerning business performance of companies and experimental results showed that our method outperforms Sakai et al's method.
著者
酒井 浩之 増山 繁
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.12, no.5, pp.207-231, 2005-10-10 (Released:2011-03-01)
参考文献数
17

略語とその略語に対する元の語 (原型語と定義) との対応関係を, コーパスから自動的に獲得する手法を提案する.本手法は, 同一の再現率においてより高い精度を達成できるように, 我々の既提案手法 (酒井, 増山2002) を改良したものである.このような知識は, 情報検索や文書要約などにおいて有用である.本手法は, まず, 略語候補とそれに対応した原型語の候補を, それらを構成している文字情報から獲得する.そして, 略語候補と原型語の候補の名詞問類似度を計算することで, 略語とその原型語との対応関係を取得する.例えば, 略語「原発」に対して, 原型語「原子力発電所」のような対応関係を取得できる.なお, 本手法はコーパスに出現する各名詞が略語か原型語であるかどうかの情報が与えられていることを前提としていない.評価の結果, 名詞間類似度の閾値を0.4に設定した場合, 精度73.4%の結果を得た.本手法と既提案手法とを比較した結果, 同一の再現率においてより高い精度を達成し, 既提案手法よりも有効な手法であることを確認した.
著者
児玉 実優 酒井 浩之 永並 健吾 高野 海斗 中川 慧
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.3K4GS1001, 2022 (Released:2022-07-11)

近年, 投資家は, ESG(E:環境,S:社会,G:統治)情報を投資判断において重視しており,ESG関連情報をテキストデータから抽出する技術が必要とされている. ESG関連情報は統合報告書に多く記載がある. しかし, 企業によってレイアウトや内容が異なり, 学習データの作成が困難である. そこで本研究では, まず有価証券報告書(有報)から ESG関連情報を抽出する. 有報にも統合報告書ほどではないが, ESG 関連情報の記述がある. また, レイアウトはどの企業も同じであり, さらに XBRL 形式と呼ばれるテキスト形式で配布されているので, テキスト処理を行いやすい. 次に有報から抽出したESG関連情報を学習データとして,BERTモデルをファインチューニングする. 最後に当該BERTモデルを用いて統合報告書からESG関連情報を抽出することで,統合報告書から直接学習データを作成する困難を解決できた. 実際に, 本手法で各企業の統合報告書から ESG 関連情報を抽出した.結果, E,S,Gに関する情報をそれぞれ93.3%,91.7%,77.4%の適合率で取得でき,良好な結果が得られた.
著者
太田 貴久 南 拓也 山崎 祐介 奥野 好成 田辺 千夏 酒井 浩之 坂地 泰紀
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

本研究では,発明の新たな用途先を探す手法を提案した.提案手法では,はじめに,技術的特徴とそれに対応する効果を抽出する.その後,ユーザが指定した発明と,技術的特徴が類似し,かつ効果が類似しない他の特許を検索する.このような手法によって,発明の新たな用途先を探索する.提案手法に対して実験を行った結果,実際に別用途へ展開された特許の例を再現することでできた.
著者
北森 詩織 酒井 浩之 坂地 泰紀
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.2, pp.150-161, 2017-02-01

本論文では,企業の決算短信PDFから,今後の業績に関する記述がある文を抽出する手法を提案する.近年,証券市場における個人投資家の比重が増大しており,個人投資家に対して投資判断の支援をおこなう技術の必要性が高まっている.そのため,人工知能分野の手法や技術を,金融市場における様々な場面に応用することが期待されており,例えば,膨大な金融情報を分析して投資判断の支援を行う技術が注目されている.ここで,投資の際,投資家にとって重要なのは,企業の今後の業績予測を知ることである.なぜなら,現在の業績が赤字であったとしても,今後の業績が回復することが企業側から示されれば,株価は上昇する場合がある.そこで,本研究では,企業の決算短信PDFから,業績予測文(企業の今後の業績予測を示す文)を抽出する手法を提案する.本手法では,業績予測文の文頭と文末に特徴的に出現する表現を用いることで,業績予測文を抽出する.加えて,これらの特徴的な表現を,半自動的に収集することが可能な手法となっており,業績予測文を幅広く網羅できる.
著者
根岸 龍 酒井 浩之 永並 健吾
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.35, no.3, pp.693-699, 2023-08-15 (Released:2023-08-16)
参考文献数
10

本研究では,日経平均市況概況記事を自動生成するための一環として,株価と決算短信から株式動向を表現する文を自動的に生成することを目的とする.本手法によって自動生成される株式動向を表現する文は,例えば「小売業,卸売業,建設業関連が上昇.機械,鉄鋼,電気機器関連が下落」のような文である.本手法では,株価と決算短信から株式市場の動向,株価の変動要因となる事業,製品,社会背景等を投資テーマとして抽出する.具体的には,株価データから大きく変動した企業群を抽出し,各企業の決算短信から抽出したキーワードを基に,企業群をクラスタリングして絞り込みを行う.次に,絞り込みを行った企業群の各キーワードから投資テーマを推定し,推定された投資テーマを基に株式動向を表現する文の自動生成を行う.また,生成した株式動向を表現する文を用いて,日経平均市況概況記事の生成を試みる.
著者
坂地 泰紀 野中 尋史 酒井 浩之 増山 繁
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2009-NL-192, no.14, pp.1-8, 2009-07-15

特許文書から直接的なユーザの便益に相当する表現と,技術上の解決課題を示す表現を自動的に抽出するアルゴリズム 「Cross-Bootstrapping」 を提案する.抽出した直接的なユーザの便益に相当する表現と,技術上の解決課題を示す表現はパテントマップを生成するために役立つ.本手法は,二つの手がかりと統計情報を用いて,ブートストラップ的に表現対を抽出する.また,辞書や人手により作成したパターンを用いず,自動的に表現を抽出することができる.最後に本手法の評価実験を行い,パテントマップを自動生成するために,十分な性能を達成したことを確認した.
著者
太田 貴久 南 拓也 山崎 祐介 奥野 好成 田辺 千夏 酒井 浩之 坂地 泰紀
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.2L103, 2018 (Released:2018-07-30)

本研究では,発明の新たな用途先を探す手法を提案した.提案手法では,はじめに,技術的特徴とそれに対応する効果を抽出する.その後,ユーザが指定した発明と,技術的特徴が類似し,かつ効果が類似しない他の特許を検索する.このような手法によって,発明の新たな用途先を探索する.提案手法に対して実験を行った結果,実際に別用途へ展開された特許の例を再現することでできた.
著者
田原 如菜 坂地 泰紀 酒井 浩之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.113, no.429, pp.5-10, 2014-01-30

本研究では,キャラクターに対応する印象表現をTwitterから抽出する手法を提案する.具体的には,キャラクターとして,ゆるキャラを対象とし,キャラクター名に対応する印象表現(「可愛い」や「癒される」等)を抽出する.人手で印象表現辞書(喜,怒,哀,怖,恥,好,嫌,昂,驚,安,楽,その他のカテゴリーから成る363表現)を作成し,キャラクター名と印象表現辞書に存在する印象表現が含まれているツイートを取得する.そして,キャラクターごとに印象表現を抽出し,実際にアンケートで印象調査した結果と,本手法で抽出した印象表現を比べて評価した.
著者
野中 尋史 小林 暁雄 坂地 泰紀 鈴木 佑輔 酒井 浩之 増山 繁
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

特許文書中に出現する効果に相当する語(効果語)と技術要素に相当する語(技術語)を軸としてマッピングした「効果ー技術型パテントマップ」は、知財戦略や研究戦略の策定等で重要な役割を果たす。本研究では、効果語と技術語を特許文書中から自動的に抽出し、さらに、重複した意味を持つ語を統合した上で、「効果ー技術型パテントマップ」を作成する手法を提案する。
著者
松田 耕史 山本 悠二 酒井 浩之 増山 繁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.595, pp.13-18, 2006-01-27

Web上の情報量の増加とWeblogなどの簡易な情報発信手段の普及によって、Web上のリンクを単に「リンク先ページへの信頼」と解釈することはできなくなってきた。Web上のリンクに込められた感情を知ることによって、より密に連携したWebコミュニティを発見することが可能になると考えられる。そこで本研究では、Weblog内のリンクに対して、教師付き学習によって感情スコアを推定することを試みた。肯定的文書、否定的文書間の表現の偏りや、Weblog特有の文書構造を考慮した結果、ピアソンの相関係数で0.45程度と、かなりの相関をもって推測可能であることがわかった。
著者
酒井 浩之 増山 繁
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2006, no.94, pp.43-50, 2006-09-12

新聞やインターネットなどで1日に配信される個々の企業に関する記事は膨大な数になるが,人間にとって重要な記事とは企業業績に影響を与えるほどのインパクトのある記事である.そのため,本研究では,経済新聞記事を対象とし,新聞に掲載される個々の企業の記事の内容を解析し,企業業績に影響を与えるほどのインパクトのある記事(以下,インパクト記事)であるかどうかを判定し,そのような記事を抽出する.また,インパクト記事の内容が企業業績にとってポジティブな影響を与えるか,ネガティブな影響を与えるかを自動的に判定する.さらに,本手法で抽出対象としている企業業績発表の記事の内容を解析し,その主要因(好調な事業,もしくは,不振の事業)が記載されている文を抽出する.本手法を評価したところ,インパクト記事抽出の精度は85.8%,再現率は66.8%であり,主要因(好調な事業,不振な事業)の記述のある文抽出の精度は82.2%,再現率は26.3%であった.Many articles about each company are distributed on the newspaper or Internet in a day.However,an important article for human is an article containing a story that influences the corporate performance.In this research,we propose a method for identifying an article containing a story that influences the corporate performance and extracting such articles from a newspaper corpus.Our method judges whether the story contained in the extracted article is positive or negative to the corporate performance.Moreover,we target the articles of the announcement on the corporate performance,we propose a method for extracting sentences containing its key factor(good business or bad business).Experimental results showed that our method for extracting articles containing a story that influences the corporate performance attained 85.8% precision and 66.8% recall and our method for extracting sentences containing the key factor attained 82.2% precision and 26.3% recall.
著者
鈴木 佑輔 横田 隼 酒井 浩之 増山 繁
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.1, pp.168-173, 2010 (Released:2010-01-06)
参考文献数
6

We propose a method to extract a lot of correspondences between questions and answers from a Web message board automatically. We use Web message boards as information sources because Web messasge boards have a lot of articles posted by general users. We extract correspondences between questions and answers that can be used in question answering systems to support natural language sentence input. At first, our proposed method classifies messages of a Web message board into either questions or others. Next, our method extracts a set of root-node pairs from the thread tree of a Web message board, where we define the thread tree when the root is an article classified as a question, and nodes are articles classified as answer candidates. Our method finds correspondences between questions and answers using two clues, (1)similarity between their articles, (2)link count between their articles. We experimented the proposed method, discussed results, and analyzed errors.