著者
深山 覚 中妻 啓 米林裕一郎 酒向慎司 西本 卓也 小野 順貴 嵯峨山 茂樹
雑誌
情報処理学会研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2008, no.78(2008-MUS-076), pp.179-184, 2008-07-30

本稿では歌詞の韻律を用いた歌唱曲の新しい自動作曲手法を提案する。旋律を音の経路と捉え作曲を経路探索問題として定式化することで、任意の日本語の歌詞を用いた歌唱曲の自動作曲が、歌詞の韻律に基づく制約条件下での最尤経路探索問題を解くことで実現できることを示す。さらにこの作曲原理を実装した自動作曲システム "Orpheus" を用いて実際に楽曲生成を行い、作曲家による生成された楽曲に対する評価を踏まえて、今回の手法によって妥当な音楽性をもった歌唱曲が生成されたことを検証する。
著者
小野 順貴 SCHEIBLER ROBIN
出版者
首都大学東京
雑誌
特別研究員奨励費
巻号頁・発行日
2017-11-10

本研究の目的は、音を光に変換するセンサノードとカメラを組み合わせ、カメラを一種の多チャンネル音響デバイスとして用いる新たな多チャンネル音響信号処理の枠組みを構築することである。これらにより、従来は困難であった広範囲に分散するセンサノードからの音響情報の取得を容易にし、音響シーン認識、音源定位、音源強調などをカメラによって行う新しい音響応用システムを実現することを目指している。2018年度は以下の研究成果を得た。1) 音強度情報からの音源定位を行った。具体的には,首都大学東京日野キャンパスの体育館において,多数の音光変換デバイス「ブリンキー」を配置し,ビデオカメラで撮影したブリンキーの光強度信号から,機械学習により画像上での音源位置を推定した。2) 前年度に引き続き,通常のマイクロホンアレイと組み合わせ、光信号を教師信号として用いる教師有りビームフォーミングを行い、その有効性を確認した。3) 複数音源を扱えるようにするため,ブリンキーで取得した音強度信号を非負値行列分解により分離する手法を考案し,実環境でも分離できることを確認した。さらに,4) 2)の拡張として,通常のマイクロホンアレイとブリンキーを組み合わせたマルチモーダルブラインド音源分離の理論を構築し,シミュレーションにより有効性を確認した。5) 音響シーン認識やイベント検出への応用として,人,自転車,バイクなどの通行の検出,研究室環境での複数人での会話といった実環境シーンでデータ取得を行い,分析法について検討した。
著者
深山 覚 中妻 啓 酒向 慎司 西本 卓也 小野 順貴 嵯峨山 茂樹
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.54, no.5, pp.1709-1720, 2013-05-15

日本語歌詞からユーザの意向を反映して多様な歌唱旋律を生成するための自動 作曲法があれば,歌のプレゼント,メールの歌い上げ,非専門家の創作支援な どが行える.本論文では初めに,自動作曲される旋律の多様性向上と音楽性の 保持の両立が難しいこ とを議論し,特に日本語歌詞から歌唱旋律を生成する際には,(1)音符数の変化 にかかわらず同じ印象を持つリズムの生成法と,(2)ユーザの意向,歌詞の韻律 と古典的な作曲法に基づ く制約条件を満たす音高列の生成法が必要であることを論じる.(1)については リズム木構造仮説に基づく方法,(2)については,動的計画法を用いた確率最大の音高系列 の探索により解決できることを示す.様々な制約条件のもと自動作曲した結果について専門家による評価を行ったと ころ,本手法によって古典的な歌唱旋律の作曲法からの逸脱の少ない旋律が生 成されることが示され,ユーザの意向を反映して多様な旋律を歌詞から生成す る方法として有効であることが分かった.
著者
嵯峨山 茂樹 小野 順貴 西本 卓也 金子 仁美
出版者
東京大学
雑誌
基盤研究(A)
巻号頁・発行日
2008

数理モデルに基づいて音楽信号および音楽情報の解析・認識・加工・生成の多角的な研究を行い、多大な成果を生み出した。この中には、多重音の解析のために多重音モデルのパラメータ推定(HTC)に基づく方法、同じくスペクトログラムの非負値行列分解(NMF)に基づく方法、調波音と打楽器音の信号分離(HPSS)、スペクトログラムからの位相成分の復元に基づく楽曲の速度変換やピッチ変換などの高品質な信号加工、ステレオ音楽信号からのパート分離、人声に含まれる揺らぎ成分に基づく歌声の抽出と消去、音楽信号からの和声自動推定、楽曲を構成するリズムの自動学習と小節分割(RhythmMap)、それに基づく楽曲ジャンルやムードの自動分類、多声部音楽信号からのリズム構造推定と自動採譜、上位の音楽理論から下位の信号観測までを統合したDynamic Bayesian Net に基づく音楽モデルと自動採譜、楽譜データからの作曲家自動推定、確率場学習に基づく楽譜からの音楽的な自動演奏、テーマ模倣を含む自動対位法による自動作曲、歌詞の日本語韻律を利用した自動歌唱作曲、以上の研究を支える機能和声データベースの構築など、極めて広い範囲の研究成果を含む。これらは、ジャーナル論文、国際会議論文、解説論文、国内学会発表、自動作曲のwebサービス、メディアによる報道などにより社会に公表している。
著者
小野 順貴 Kien LE TRUNG 宮部 滋樹 牧野 昭二
出版者
一般社団法人 電子情報通信学会
雑誌
電子情報通信学会 基礎・境界ソサイエティ Fundamentals Review (ISSN:18820875)
巻号頁・発行日
vol.7, no.4, pp.336-347, 2014-04-01 (Released:2014-04-01)
参考文献数
69

マイクロホンアレー信号処理は,複数のマイクロホンで取得した多チャネル信号を処理し,単一マイクロホンでは困難な,音源定位,音源強調,音源分離などを,音源の空間情報を用いることによって行う枠組みである.マイクロホンアレー信号処理においては,チャネル間の微小な時間差が空間情報の大きな手がかりであり,各チャネルを正確に同期させるために,従来は多チャネルA-D 変換器を備えた装置が必要であった.これに対し,我々の身の回りにある,ラップトップPC,ボイスレコーダ,スマートフォンなどの,同期していない録音機器によりマイクロホンアレー信号処理が可能になれば,その利便性は大きく,適用範囲を格段に広げることができる.本稿では、非同期録音機器を用いたマイクロホンアレー信号処理の新しい展開について,関連研究を概観しつつ,筆者らの取組みを紹介する.
著者
深山 覚 中妻 啓 米林裕一郎 酒向慎司 西本 卓也 小野 順貴 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.78, pp.179-184, 2008-07-30
被引用文献数
8

本稿では歌詞の韻律を用いた歌唱曲の新しい自動作曲手法を提案する。旋律を音の経路と捉え作曲を経路探索問題として定式化することで、任意の日本語の歌詞を用いた歌唱曲の自動作曲が、歌詞の韻律に基づく制約条件下での最尤経路探索問題を解くことで実現できることを示す。さらにこの作曲原理を実装した自動作曲システム "Orpheus" を用いて実際に楽曲生成を行い、作曲家による生成された楽曲に対する評価を踏まえて、今回の手法によって妥当な音楽性をもった歌唱曲が生成されたことを検証する。In this paper, we discuss a new algorithm for automatic song composition and introduce our new composition system named "Orpheus". We show that composing melody on Japanease lyrics can be done automatically by considering musical composition task as an optimal-path search problem under constraints of the upward and downward pitch motions given from the prosody of the lyrics. Valuation on the results generated by "Orpheus" by a musical composer is also reported, which indicates that our new system can compose a song with a proper degree of musicality.
著者
長谷川 隆 西本 卓也 小野 順貴 嵯峨山 茂樹
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.53, no.3, pp.1204-1215, 2012-03-15

本論文では,音楽から受ける「作曲家らしさ」の印象を説明し定量的に測定できる工学的手法を目指して,音楽学における様式分析手法の1つであるラルーらの綜合的様式分析において論じられている様々な定性的特徴に対応する特徴量を提案する.対象データはMIDIデータとし,音の厚み等の音楽的な表現語の意味を解釈し,楽譜情報から計算可能な量を検討する.正準判別分析の作曲家推測精度を求めることにより,提案した特徴量群による特徴空間上で同作曲家の楽曲が近接して配置されていることが,判別分析結果の階層クラスタ分析により,時代・文化が類似していて類似した印象を受けると考えられる作曲家の特徴重心が近接して配置されていることが示された.以上から,提案した特徴群は「作曲家らしさ」の尺度として妥当性を持つと考えられる.The purpose of this paper is to establish technique to explain and measure "composer-characteristic" impression extracted from music. For that purpose, musical features are proposed by quantifying various qualities stated in Style Analysis by LaRue et al., one of musicological analysis methods. Input is assumed to be MIDI data, and measurable features from sheet music information are investigated by elucidating musicological descriptors such as "sound thickness". Composer discrimination accuracy evaluated with canonical discriminant analysis showed points of music by the same composer in the feature space of proposed features are placed nearby. In addition, the result of hierarchical cluster analysis showed centroids of similar composers with homogenous chronological and cultural backgrounds are also placed nearby. Therefore, the proposed features are presumed to be feasible for measuring "composer-characteristic" impression.
著者
松原 聖人 林 耕平 光本 大記 濱田 康弘 小野 順貴 嵯峨山 茂樹
雑誌
第78回全国大会講演論文集
巻号頁・発行日
vol.2016, no.1, pp.535-536, 2016-03-10

入力音声をケプストラム分析し、それによって取得した情報を基本周波数に関して操作したあと、パワースペクトルを経由して位相復元を用いて音声波形に戻すことによって、ピッチ変更などの変化を入力音声に与える。ケプストラムドメインで音声を加工することと、それを位相復元で音声波形領域に戻して可聴とすることの組み合わせによる音声加工法の提案である。
著者
ラチンスキスタニスワヴアンジェイ 小野 順貴 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.12, pp.193-198, 2008-02-09
参考文献数
13

We propose a new approach for dealing with multipitch analysis of musical signals that makes use of the fact that such signals are highly structured. This structure comes from the many musicological rules of the western tonal music and we model it by using the recently developed method of Hierarchical Hidden Markov Models. We propose a model with four layers: song key chord and note combination layer. One of the big advantage of this approach is that besides from information about pitches we get higher level musical information about chord progression and key modulation.We propose a new approach for dealing with multipitch analysis of musical signals that makes use of the fact that such signals are highly structured. This structure comes from the many musicological rules of the western tonal music, and we model it by using the recently developed method of Hierarchical Hidden Markov Models. We propose a model with four layers: song, key, chord, and note combination layer. One of the big advantage of this approach is that, besides from information about pitches, we get higher level musical information about chord progression and key modulation.
著者
長谷川 隆 西本 卓也 小野 順貴 嵯峨山 茂樹
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.53, no.3, pp.1204-1215, 2012-03-15

本論文では,音楽から受ける「作曲家らしさ」の印象を説明し定量的に測定できる工学的手法を目指して,音楽学における様式分析手法の1つであるラルーらの綜合的様式分析において論じられている様々な定性的特徴に対応する特徴量を提案する.対象データはMIDIデータとし,音の厚み等の音楽的な表現語の意味を解釈し,楽譜情報から計算可能な量を検討する.正準判別分析の作曲家推測精度を求めることにより,提案した特徴量群による特徴空間上で同作曲家の楽曲が近接して配置されていることが,判別分析結果の階層クラスタ分析により,時代・文化が類似していて類似した印象を受けると考えられる作曲家の特徴重心が近接して配置されていることが示された.以上から,提案した特徴群は「作曲家らしさ」の尺度として妥当性を持つと考えられる.
著者
中野 允裕 ルルージョナトン 亀岡 弘和 中村 友彦 小野 順貴 嵯峨山 茂樹
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.6, pp.1-8, 2011-07-20

本報告では,音楽信号のような多重音を解析するための手法として,Bayesian nonparametrics に基づく音響信号スペクトログラムのモデル化方法を提案し,その構成法と推論について議論する.近年,非負値行列分解に代表されるようなスパース表現基づく音楽信号のモデル化が盛んに研究されている.その中で解決すべき二つの問題が注目を集めている.一つ目は楽器音が時間変化する多様なスペクトルを持つ点であり,もう一点は観測信号中に含まれる音源の数が一般的には未知なことである.さらに,楽器音の多様なスペクトルは音源数の推定を困難にし,また逆に音源数が未知であることによって一音一音がどの程度多様なスペクトルを持つか推定することを困難にしている.本報告では,これら二つの課題を同時に解消するために,信号の重畳を表す非負値行列分解型のスパース表現と時系列パターンを表現する隠れマルコフモデルを Bayesian nonparametrics 上で融合させたスペクトログラムモデルを提案する.This paper presents a Bayesian nonparametric latent source discovery method for music signal analysis. Recently, the use of latent variable decompositions, especially nonnegative matrix factorization (NMF), has been a very active area of research. These methods are facing two, mutually dependent, problems: first, instrument sounds often exhibit time-varying spectra, and grasping this time-varying nature is an important factor to characterize the diversity of each instrument; moreover, in many cases we do not know in advance the number of sources. Conventional decompositions generally fail to cope with these issues as they suffer from the difficulties of automatically determining the number of sources and automatically grouping spectra into single events. We address both these problems by developing a Bayesian nonparametric fusion of NMF and hidden Markov model (HMM).
著者
嵯峨山 茂樹 小野 順貴 西本 卓也 齋藤 大輔 堀 玄 中村 和幸 金子 仁美
出版者
国立情報学研究所
雑誌
基盤研究(A)
巻号頁・発行日
2011-04-01

統計的信号処理と音楽理論の数理モデルを融合して、音楽(および音響・音声)の信号処理と情報処理に多面的に取り組んだ。音声認識分野では音響処理と言語処理の融合がキー技術であったように、音楽においては信号処理と音楽理論の融合が必須である。具体的には、A: 数理モデルと統計学習を軸にした音楽信号の解析・変換・加工・分離・検出、B: 音楽理論の数理的定式化を軸にした音楽信号の和音認識・リズム解析・セグメンテーション・構造解析・ジャンル認識、C: 機械学習と最適化を軸にした自動演奏・自動作曲・自動伴奏・自動編曲などを研究・開発した。
著者
橘 秀幸 小野 順貴 嵯峨山 茂樹
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.12, pp.1-6, 2009-07-22

本稿では,歌声と楽器音を両方含むような音楽音響信号から,歌声成分を強調,または抑圧する信号処理手法について述べる.歌声に相当する成分を検出するために,本稿ではスペクトルの時間変化に由来するスペクトログラムの特徴的な形状に着目する.歌声にはスペクトルの時間変化や旋律的な動きがあるため,スペクトルの形状が長時間一定であることはなく,またこれらの時間変化の影響で歌声のスペクトルは周波数軸方向にある程度の幅を有するという点で特徴的である.このような特徴をスペクトログラムの異方性という観点から捉えると,歌声と楽器音の滑らかさは異方的であり,異方的な信号を分離する手法を使って歌声と伴奏を分離することができる。本稿ではそのような手法を具体的に提案し,実際の音楽信号を用いた実験を行った結果,聴感上,歌声成分が強調/抑圧された信号が得られることを確認した.We address a problem of enhancing or suppressing singing voice components in music audio signals. To achieve the purpose, we focus on peculiar spectral shapes of singing voice: they are not maintained unchanged for a while, and they occupy broad bandwidth, both of them is caused by spectral fluctuations and melodic nature of singing voice. When we regard those characteristic shapes as anisotropic smoothness of spectrogram, we can separate a music into singing voice and accompaniment, by applying a method which separates a signal into anisotropic components. In this paper, we propose a signal processing algorithm to enhance/suppress singing voice, based on those natures of spectral shapes of singing voice. We also conducted an auditory evaluation to confirm the effectivenes of the method using real music audio signals.
著者
猿渡 洋 鹿野 清宏 戸田 智基 川波 弘道 小野 順貴 宮部 滋樹 牧野 昭二 小山 翔一
出版者
東京大学
雑誌
基盤研究(A)
巻号頁・発行日
2011-04-01

本研究では、高次統計量追跡による自律カスタムメイド音声コミュニケーション拡張システムに関して研究を行った。具体的なシステムとして、ブラインド音源分離に基づく両耳補聴システムや声質変換に基づく発声補助システムを開発し、以下の成果が得られた。(1)両耳補聴システムに関しては、高精度かつ高速なブラインド音源分離及び統計的音声強調アルゴリズムを提案し、聴覚印象の不動点を活用した高品質な音声強調システムが実現できた。(2)発声補助システムに関しては、データベース間における発話のミスマッチを許容する声質変換処理を開発した。実環境模擬データベースを用いてその評価を行い、有効性を確認することが出来た。
著者
齊藤翔一郎 亀岡 弘和 小野 順貴 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.90, pp.85-92, 2006-08-08
被引用文献数
1

本稿では 音楽音響信号の多重ピッチ推定を行う手法であるSpecmurt分析をMAP推定の観点から定式化し 事後確率を最大化することによって基本周波数分布と共通調波構造パターンを求めるアルゴリズムについて述べる.我々はこれまでに非線型写像を用いて基本周波数分布に関する先験情報を利用しつつ共通調波構造パターンを推定する手法を提案してきた. この手法は直感的には理解がしやすいが アルゴリズムが何を目的関数としているかなどの見通しが立ちにくく アルゴリズムの収束も保障されなかった. そこで我々はSpecmurt分析における多重ピッチ推定を事後確率を最大化する推定として定式化し直し 今までの反復推定に新たな解釈を加えるとともに そこで明らかになった問題を踏まえ事後確率を最大化するような新たなアルゴリズムを提案する.評価実験によって平均で64.11%のMIDI変換正解率を得た.This paper describes a iterative algorithm for estimating a fundamental frequency distibution and a harmonic structure pattern by reformulating Specmurt analysis form a standpoint of maximum a posteriori probability. We have proposed specmurt Analysis which calculate the fundamental frequency distribution of multi-pitch music signals by iterative estimation algorithm using non-linear mapping function based on prior information. This iterative algorithm is easy to understand, but it is not obvious what the algorithm considers as an objective function, and the convergence is not ensured. Therefore, we make a explanation of the algorithm from the standpoint of maximum a posteriori probability, and propose a new algorithm based on MAP estimation. Evaluation result shows an avarage 64.11% accuracy of WAV to MIDI conversion.
著者
角尾 衣未留 George Tzanetakis 小野 順貴 嵯峨山 茂樹
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.1, pp.1-6, 2009-07-22
参考文献数
10

本研究は音楽音響信号中に含まれる小節単位の低音旋律パターンをジャンルごとに複数種類抽出し、ジャンル認識の精度を向上させる事を目的としている。小節単位の低音旋律パターンは例えばロックでは同じ音を同じリズムで演奏されるのに対し、ジャズではウォーキングベースと呼ばれる複雑なパターンであるなど、ジャンル毎に特徴的である。低音旋律パターンのピッチシフトに対する不変性を考慮した k-means クラスタリング法を提案し、ジャンル毎のパターンテンプレートの学習を行い、楽曲に含まれているパターンとテンプレートの距離に基づく特徴量ベクトルを算出することによって、ジャンル認識を行いその有効性を検証する。This paper discusses a new approach for clustering musical bass-line patterns representing particular genres and its application to audio genre classification. Many musical genres are characterized by not only timbral information but also representative bar-long bass-line patterns. For instance, while a bass-line in rock music is constant pitch and a uniform rhythm, in jazz music there are many characteristic movements such as walking bass. We propose a representative bass-line pattern template extraction method based on k-means clustering handling a pitch-shift problem. After extracting the templates for each genre, a feature vector is calculated and used for automatic genre classification.