著者
嵯峨山 茂樹 川本 真一 下平 博 新田 恒雄 西本 卓也 中村 哲 伊藤 克亘 森島 繁生 四倉 達夫 甲斐 充彦 李晃伸 山下 洋一 小林 隆夫 徳田 恵一 広瀬 啓吉 峯松 信明 山田 篤 伝 康晴 宇津呂 武仁
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.14, pp.57-64, 2003-02-07
参考文献数
24
被引用文献数
42

筆者らが開発した擬人化音声対話エージェントのツールキット``Galatea''についてその概要を述べる。主要な機能は音声認識、音声合成、顔画像合成であり、これらの機能を統合して、対話制御の下で動作させるものである。研究のプラットフォームとして利用されることを想定してカスタマイズ可能性を重視した結果、顔画像が容易に交換可能で、音声合成が話者適応可能で、対話制御の記述変更が容易で、更にこれらの機能モジュール自体を別のモジュールに差し替えることが容易であり、かつ処理ハードウェアの個数に柔軟に対処できるなどの特徴を持つシステムとなった。この成果はソース公開し、一般に無償使用許諾する予定である。This paper describes the outline of "Galatea," a software toolkit of anthropomorphic spoken dialog agent developed by the authors. Major functions such as speech recognition, speech synthesis and face animation generation are integrated and controlled under a dialog control. To emphasize customizability as the dialog research platform, this system features easily replaceable face, speaker-adaptive speech synthesis, easily modification of dialog control script, exchangeable function modules, and multi-processor capability. This toolkit is to be released shortly to prospective users with an open-source and license-free policy.
著者
大槻知史 齋藤 直樹 中井 満 下平 博 嵯峨山 茂樹
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.2, pp.245-255, 2002-02-15

本稿では,隠れマルコフモデル(HMM)を用いて,人間が鍵盤入力した演奏情報(標準MIDIファイル)の発音時刻の間隔から,意図された音価列を復元推定する手法を提案し,実験によりその効果を実証する.人間が音楽演奏する際の物理的音長は,音価に対応する正規の長さから意識的・無意識的に揺らぐため,楽譜入力や自動採譜などでは,楽譜として意図された各音符の音価を正しく推定するのは容易ではない.そこで,連続音声認識の定式化にならって,音楽的な演奏を学習・認識する原理をHMMの手法を用いてモデル化する.さらに,同様の原理により小節線・拍子推定,テンポ変化推定も可能となることを示す.
著者
大槻知史 齋藤 直樹 中井 満 下平 博 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.2, pp.245-255, 2002-02-15
被引用文献数
12

本稿では,隠れマルコフモデル(HMM)を用いて,人間が鍵盤入力した演奏情報(標準MIDIファイル)の発音時刻の間隔から,意図された音価列を復元推定する手法を提案し,実験によりその効果を実証する.人間が音楽演奏する際の物理的音長は,音価に対応する正規の長さから意識的・無意識的に揺らぐため,楽譜入力や自動採譜などでは,楽譜として意図された各音符の音価を正しく推定するのは容易ではない.そこで,連続音声認識の定式化にならって,音楽的な演奏を学習・認識する原理をHMMの手法を用いてモデル化する.さらに,同様の原理により小節線・拍子推定,テンポ変化推定も可能となることを示す.This paper proposes the use of Hidden Markov Model (HMM) for rhythmrecognition from musical performance recorded in the standard MIDIfile format. Intentionally or unintentionally, physical durations ofmusical notes in human performances often fluctuate from nominallengths of the intended notes. Estimating intended note sequences is,therefore, not trivial for computers. In this paper, we formulate theprocess of understanding and recognizing musical rhythm patterns usingHMM similarly to continuous speech recognition (CSR). It is shownthat the same principle enables bar line allocation, beat recognition,and tempo estimation.
著者
川上 隆 中井 満 下平 博 嵯峨山 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.99, no.627, pp.25-32, 2000-02-18
参考文献数
14
被引用文献数
2

本稿では、隠れマルコフモデル(HMM)を用いて与えられた旋律に自動で和声付けを行なう手法を提案し、実験的検討結果を報告する。旋律は背後に隠れた和声進行から生成される、とする旋律生成の隠れマルコフモデルを提唱し、その逆問題として、与えられた旋律から背後の和声進行を最尤推定する。2種類の和声進行のモデル、いくつかの旋律生成のモデル、さらにN-bestアルゴリズムによる和声付け複数候補抽出や、与えられた旋律の調性推定及び転調検出についても論じる。童謡や歌曲及びバッハのコラールから学習した和声進行確率モデルを用いた、実際に和声付け実験を行なった結果についても述べる。
著者
齋藤 直樹 中井 満 下平 博 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.106, pp.27-32, 1999-12-11
参考文献数
17
被引用文献数
12

本稿では、隠れマルコフモデルを用いて人間によって、鍵盤演奏された音符音長系列情報(スタンダードMIDIファイル)から意図された音符列を推定する手法を提案し、実験によりその有効性を実証する。人間が音楽演奏するときの各音符の物理的長さは、音符の正規の音長から意識的・無意識的に揺らぐため、楽譜投入・自動採譜などでは、意図された各音符の音価を正しく推定するのは容易ではない。本研究では、連続音声認識の定式化に倣って、演奏入力を音楽的に理解する原理を隠れマルコフモデル(M)によりモデル化し、意図された音符列を推定する。更に、同じ原理によりテンポ変化推定・小節線推定・拍子推定を提案する。評価実験により、一般に用いられている閾値処理より良好な結果が得られることを示す。This paper proposes the use of Hidden Markov Model (HMM) for restoration of a music note sequence from the music performance by human (reprenseted by a standard MIDI file). Successful experimental results are also presented. As the physical duration of a musical note in a human music performance fluctuates, intentionally or unintentionally, from the nominal length of the note, it is not easy to estimate the intended sequence of notes in autonmatic music transciption or music entry to computers. In the present paper, utilizing the formulation of continuous speech recognition, we use Hidden Markov Model (HMM) for modeling the process of the human understanding music performances and estimate the intended sequence of musical notes. We also apply the same principle to tempo estimation, bar line allocation, and beat estimation. Through experimental evaluation, we show the proposed method outperfoms existing methods.
著者
嵯峨山 茂樹 伊藤 克亘 宇津呂 武仁 甲斐 充彦 小林 隆夫 下平 博 伝 康晴 徳田 恵一 中村 哲 西本 卓也 新田 恒雄 広瀬 啓吉 峯松 信明 森島 繁生 山下 洋一 山田 篤 李 晃伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.103, no.518, pp.73-78, 2003-12-12

擬人化音声対話エージェントのツールキット"Galatea"の開発プロジェクトについて報告する.Galateaの主要な機能は音声認識,音声合成,顔画像合成であり,これらの機能を統合して,対話制御の下で動作させるものである.研究のプラットフォームとして利用されることを想定してカスタマイズ可能性を重視した結果,顔画像が容易に交換可能で,音声合成が話者適応可能で,対話制御の記述変更が容易で,更にこれらの機能モジュール自体を別のモジュールに差し替えることが容易であり,かつ処理ハードウェアの個数に柔軟に対処できるなどの特徴を持つシステムとなった.この成果はダウンロード可能となっており,一般に無償使用許諾している.
著者
飯田 栄治 下平 博 木村 正行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. COMP, コンピュテーション
巻号頁・発行日
vol.94, no.354, pp.51-60, 1994-11-18
被引用文献数
1 2

8パズル及び一回り大きくした15パズルについて、探索に基づいた解法がこれまでいくつか研究されている。通常、これらのパズルの探索による解法では、ゴール状態までの手数が少し長くなると容易には解けない。また、効率良い探索を行なうためにヒューリスティック関数を考案することも一般に難しい。そこで、今回は8パズルに対し、探索ではなく問題をいくつかの小問題に分割しそれらの各サブゴールに到達するための整列戦略に従って、状態遷移オペレータを次々に適用することにより高速に問題を解決する手法を提案する。また、いくつか例題に対し代表的な探索方法と比較実験を行なったのでその結果を報告する。