著者
井手 一郎 木下 智義 高橋 友和 孟 洋 片山 紀生 佐藤 真一 村瀬 洋
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.23, no.5, pp.282-292, 2008
被引用文献数
9 2

Recent increase of digital storage capacity has enabled the creation of large-scale on-line broadcast video archives. In order to make full use of the data in the archive, it is necessary to let a user easily grasp the availability of certain video data and their contents. Considering this problem, we have been investigating efficient and effective retrieval and reusing methodologies of archived video data. The archive used as a test-bed consists of more than 1,000 hours of news video obtained from a Japanese news program during the past six years. This paper first proposes a news topic tracking and structuring method. A structure called the `topic thread structure', is organized so that it should represent the temporal flow of news topics originating from a specified news story. The paper next introduces a browsing and editing interface that enables the user to browse through news stories along the topic thread structure, and also assists the compilation of selected news stories as a customized video summary or a documentary. The method was applied to the archived news video data in order to observe the quality of the topic thread structure and the usability of the prototype interface. As a result, some structures represented the flow of topics quite close to real-world comprehension. In addition, experiments showed that when the structure could be considered meaningful, the interface combined with the structure could drastically reduce the time needed to browse through the archive for news stories related to the user's interest.
著者
柏野 邦夫 中臺 一博 木下 智義 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.11, pp.1751-1761, 1996-11-25
被引用文献数
70

音楽演奏の音響信号を対象として演奏情報を認識する試みとしては,従来自動採譜の研究が行われているが,複数種類の楽器音を含む音楽演奏を対象とする場合には,認識処理の有効性は極めて限られていた.そこで本論文では,複数種類の楽器音を含む音楽演奏の認識を音楽情景分析の問題としてとらえ,その解決を図る.ここで音楽情景分析とは,音楽演奏の音響信号から,単音や和音などの音楽演奏情報を記号表現として抽出することを指す.本論文ではまず,音楽情景分析を実現する上では情報統合の技術が不可欠であるとの認識から,ベイジアンネットワークによる情報統合の機構を備えた音楽情景分析の処理モデルOPTIMAを提案する.次に,特に単音の認識に的を絞って,提案する情報統合機構の有効性を示す.
著者
木下 智義 坂井 修一 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.4, pp.1073-1081, 2000-04-25
被引用文献数
19

音響信号により外界の事象を理解する聴覚的情景分析に関して, 従来多くの研究がなされてきた.特に対象を音楽に絞った場合, 自動採譜等の実現を目指し, いくつかの研究例がある.その一つとして, 筆者らはこれまでに音楽音響信号を対象とした聴覚的情景分析の処理モデルOPTIMAを提案し, その実験システムを構築した.しかしながら, その認識精度は実用上十分とはいえず, その改善が課題となっている.本論文では, 従来の処理の問題点である周波数成分の重なりに対する脆弱性を改善するための新たな処理を提案する.本手法では, 周波数成分が重なったときの特徴に合わせて特徴量を分類し, それに応じて重なりのある周波数成分の特徴量を適応的に変化させ, 音源同定処理を行う.また, 各特徴量の音源同定の際の手掛りとしての重要度を計算し, 同定処理に導入した.評価実験の結果, 処理精度の向上が認識され, 提案する処理の有効性が明らかになった.