著者
金山 知俊 増山 繁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.7, pp.1843-1851, 1997-07-25
参考文献数
9
被引用文献数
11

自然物のCGシミュレーションを行う場合, 形状のみならず, 動きの再現も重要である. CGによる樹木の画像生成の研究はさまざまな研究者によってなされてきたが, それらの多くは樹形を生成する生長モデルや, テクスチャの生成に関するものが大部分であり, 風などの外力による樹木の揺れの表現については従来あまり行われていない. 本研究では, 樹木を質量をもった節点とそれらの隣接関係で近似し, 節点の動きのシミュレーションを行うことで樹木の揺れのアニメーションを実現している.
著者
鶴田 雅信 増山 繁
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.6, pp.977-988, 2011-06-01

手掛り語「会社概要」,及び,企業の公式ページのトップページURL一覧を入力とし,企業の基本情報を含むページの探索を行いながら,基本情報の属性を属性名,属性値の組の形で自動的に抽出する手法を提案する.提案手法は,企業の公式Webサイト全体からの属性抽出というタスクの一部を,基本情報ページの探索問題に置き換え,属性抽出の対象となるページ数を削減した上で,属性抽出を行う.そのため,Webサイト全体から属性抽出を行う場合に比べ,属性抽出手法そのものが単純であっても,良好な抽出を行うことが可能となることが特徴である.評価実験の結果,抽出された属性の精度は0.656,再現率は0.416,探索に成功したページのみにおける抽出結果の精度は0.781,再現率は0.625となり,幅優先探索によりページを探索するベースライン手法,及び,幅優先探索によって探索したページから,ナイーブベイズ分類器を用いて基本情報ページを選択するベースライン手法と比較して,良好な結果を示した.
著者
鶴田 雅信 増山 繁
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.6, pp.742-756, 2010 (Released:2010-09-22)
参考文献数
12

We propose an informative DOM node extraction method from a Web page for preprocessing of Web content mining. Our proposed method LM uses layout data of DOM nodes generated by a generic Web browser, and the learning set consists of hundreds of Web pages and the annotations of informative DOM nodes of those Web pages. Our method does not require large scale crawling of the whole Web site to which the target Web page belongs. We design LM so that it uses the information of the learning set more efficiently in comparison to the existing method that uses the same learning set. By experiments, we evaluate the methods obtained by combining one that consists of the method for extracting the informative DOM node both the proposed method and the existing methods, and the existing noise elimination methods: Heur removes advertisements and link-lists by some heuristics and CE removes the DOM nodes existing in the Web pages in the same Web site to which the target Web page belongs. Experimental results show that 1) LM outperforms other methods for extracting the informative DOM node, 2) the combination method (LM, {CE(10), Heur}) based on LM (precision: 0.755, recall: 0.826, F-measure: 0.746) outperforms other combination methods.
著者
大竹清敬 岡本 大吾 児玉 充 増山 繁
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.43, no.2, pp.37-47, 2002-03-15
被引用文献数
9

日本語の新聞記事を対象とした新聞記事要約システムYELLOW について報告する.YELLOWは,「重要な情報を洩れなく抽出する」ことに重点をおいて作成した.本システムは,二重修飾に着目した削除を中心とした文内要約と,重要度付与による文選択の2 つの部分より構成される.文内要約では,構文解析結果を積極的に利用する.ある名詞に対し,複数の修飾部がある場合,名詞を限定する働きが弱い修飾部を削除する新たな手法を提案する.また,換言処理,例示の削除などの要約手法も用いる.重要度付与では,主要語,高頻度の名詞,位置情報,見解文であるか否かなど,従来,文の重要度を決定するにあたって重要であるといわれてきた種々の情報を,複合的に用いる.情報検索と自動要約の評価のためのワークショップ,NTCIR-2 の要約タスクTSC-1 に参加した結果,YELLOW は平均値で良好な結果を得た.We propose a new automatic summarization system, YELLOW, for Japanese newspaper articles. YELLOW is designed to avoid omission of important information. The system was composed of two components, an abstract-type summarizer and an extract-type summarizer. The abstract-type summarizer summarizes sentences by deleting one of multiple modifiers for nouns and illustrations and by paraphrasing, etc. In the extract-type summarizer, features such as main terms, high frequency words, location information in a paragraph, are used to decide the weight of each sentence. We participated in tasks A-1 and A-2 of TSC-1 in NTCIR-2 and the evaluation results showed that YELLOW outperformed all other partici-pants in average precision.
著者
鈴木 佑輔 横田 隼 酒井 浩之 増山 繁
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.1, pp.168-173, 2010 (Released:2010-01-06)
参考文献数
6

We propose a method to extract a lot of correspondences between questions and answers from a Web message board automatically. We use Web message boards as information sources because Web messasge boards have a lot of articles posted by general users. We extract correspondences between questions and answers that can be used in question answering systems to support natural language sentence input. At first, our proposed method classifies messages of a Web message board into either questions or others. Next, our method extracts a set of root-node pairs from the thread tree of a Web message board, where we define the thread tree when the root is an article classified as a question, and nodes are articles classified as answer candidates. Our method finds correspondences between questions and answers using two clues, (1)similarity between their articles, (2)link count between their articles. We experimented the proposed method, discussed results, and analyzed errors.
著者
鶴田 雅信 増山 繁
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

企業の公式 Web サイトには、投資家などにとって有用な情報である、企業の基本情報が記述されているページが存在する。本研究では、基本情報が含まれるページへのリンクに含まれやすいと考えられる語(手がかり語)、および、企業の公式 Web サイトのトップページリストのみを用いて、クローリングと同時に企業の基本情報の属性、および、属性値を自動的に抽出するシステムを提案する。
著者
秋田 真彦 増山 繁
雑誌
全国大会講演論文集
巻号頁・発行日
vol.45, pp.361-362, 1992-09-28

本研究は4層ニューラルネット[5]を用いて2種類の楽器の単音の混成音から各楽器の単音を識別、分離し、音高を同定することを目的とする。では、ニューラルネットを用いた楽音識別の研究がなされている。ところが、音高の識別まで試みようとすると、そのままではネットワークの規模が大きくなり、多くの学習時間を要し、また、汎化できなくなる可能性がある。そこで、本研究ではニューラルネットの規模を縮小するため入力に対して主成分分析12,61を用いるアプローチをとり、以下の手続きでクラスター分割を容易にさせると同時に、入力情報を圧縮する。1.テンプレー卜のための音声データをメモリ上で合成し、一つの音声データに対し、10個の任意に定めた解析点から256点フーリェ変換する。2.一つの音声データを1行256列の行列に対応させると、(10×音声データ数)行256列の行列ができる。これに対し主成分分析を行ない、256行256列の固有ベクトルQ得る。また、Qを寄与率の高い順に並び変えたベクトルQ'を作っておく。3.一定の累積寄与率を定めておき、Q'のうちその累積寄与率を実現するまでに影響するQ'の行数nだけコピーしたn行256列の行列Q"を作る。4.Q"に1行256列の音声データの転置(256行1列の行列)を掛けると、1行n列の行列を得る。これは音声データ群を主成分分析し、(1-累積寄与率)×100%の誤差範囲内におさまる第n主成分までの座標である。5.こうして得られたn次元の座標を入力とし(入力素子は、素子)、ニューラルネットワークを組む。この結果、例えば2章に示すように、通常なら256入力のところを2入力に削減することができた。本稿では、第2章で単一楽器の単音から音高を識別する実験を示し、3章で2つの楽器の単音の混成音から楽器を分離、音高を識別する実験を示す。なお、類似した実験例では、阿部[1]らがニューラルネットを用いて単音からの楽器識別を行ない、片寄[3]はアコースティックアルゴリズムコンパイラを用いて音源分離および採譜を行なっている。また、田村ら[4]は4層ニューラルネットを用いて雑音抑制の解析を行なっている。本研究ではまず、実際の楽器音を用いず、メモリ上で合成した波形を用いて実行可能性を検討した。メモリ上での合成、各係数での解析、ニューラルネットワークのプログラムはすべてSun SPARC Station1上でC言語を用いて作成した。
著者
太田 貴久 増山 繁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.594, pp.37-42, 2006-01-26
被引用文献数
6

近年の情報技術の発達により,レポートの剽窃が非常に容易なものとなり問題となっている.本研究ではSmith-Watermanアルゴリズムを基礎とした,さまざまな「類似」を検出できるレポート類似部分発見法を考案した.そして,現実に提出されたレポートを含めた文書集合に対して実験を行った結果,F値=1となり,完全に剽窃レポートを検出することに成功した.
著者
金山 知俊 阪田 省二郎 増山 繁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.8, pp.1362-1373, 1996-08-25
被引用文献数
14

本論文では, さまざまな樹種に共通の分枝規則を再現し, 光, ホルモンの影響も考慮した樹木の生長モデルについて述べる. この生長モデルは, 光環境の影響による枝の枯死と屈曲, 植物ホルモンによる頂芽優勢, 休眠芽の休眠打破, 枝の短枝化, 屈光性, 屈地性などの樹木のさまざまな性質の再現, 節, 葉序などの樹木の分枝規則の正確な再現を, それぞれ光環境モデル, ホルモンモデル, 分枝モデルという三つのサブモデルを用いて実現している. これらサブモデルに与えるパラメータを変更することで, 環境の変化, 樹種の変更への対応を可能としている.