著者
安部武宏 佐古淳
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.5, pp.1-6, 2014-08-18

本稿では,事前に登録した打音の励起をリアルタイムで検出する技術について述べる.ゲームのインターフェースの入力として打音を利用することは,従来のボタンなどの物理的な装置を介した入力よりも直感的であり,音声マイクが低コストかつ手軽に使用できるという点においても有用である.ユーザにストレスを感じさせないための課題として,リアルタイム性,安定した認識率,豊富な登録数,雑音への対処がある.これら課題に対するアプローチとして,打音検出を前提とする処埋過程を導入した拡張NMF(Non-negative Matrix Factorization)を用いる.タブレットデバイス上でリアルタイムで動作できる実験条件にて試行した評価実験では,課題の中で最も重要だと思われる認識率に着目して評価した.最後に,評価の結果を踏まえて本手法のゲームでの実用性について述べる.
著者
多田 圭吾 岡村 亮吾 山西 良典 加藤 昇平
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011-MUS-91, no.12, pp.1-6, 2011-07-20

近年,Desktop Music(DTM) 関連機器やソフトウエアなどの発展・普及により,音楽を嗜む一環として作曲が注目されているが,作曲は高度な知識や経験を必要とする.そこで本研究では,楽譜コンテキストのベイジアンマイニングに基づく自動伴奏付与システムを提案する.提案システムでは,音楽の時間的変動を楽譜コンテキストとして扱い,ベイジアンマイニングを用いて学習曲における音楽構成要素間の因果関係を学習する.提案システムは,ユーザの音楽経験の有無に関わらず,任意のニュアンスが付与された伴奏を生成する.伴奏生成実験および主観評価実験によって,入力されたメロディに応じて学習曲のジャンル的ニュアンス,および,印象的ニュアンスが付与された伴奏が生成されることを確認し,また既存システムとの比較実験により提案システムの高い有用性を確認した.
著者
橘 誠 中岡 慎一郎 剣持 秀紀
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.14, pp.1-6, 2010-02-08

本稿では,2009年10月に開催されたCEATEC JAPAN 2009にて,ヤマハブースに出展した歌声合成システムVOCALOIDと産業技術総合研究所が開発したサイバネティックヒューマンHRP-4C"未夢"のコラボレーションによる歌うロボットの演出について,その概要とデモシステムの技術を紹介する.This paper describes the technique applied to a robot to perform singing-voice as exhibited at CEATEC JAPAN 2009. To achieve a realistically robot-singing performance, facial motions such as lip-sync and facial gestures are required. This work is a result of a collaboration between the technology "VOCALOID" (developed by YAMAHA) and the cybernetic Human HRP-4C named "Miim" (developed by AIST). We report the technical overview of the system developed for the mentioned exhibition.
著者
山本 龍一 酒向 慎司 北村 正
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-96, no.13, pp.1-6, 2012-08-02

本稿では,楽譜に基づく音楽音響信号から,演奏位置とテンポを推定する問題について論じる.隠れセミマルコフモデル (HSMM) に基づく演奏位置推定と,線形動的システム (LDS) に基づくテンポ推定を組み合わせることで,入力信号の未来の情報が使えない制約の元で効果を発揮する実時間拍予測アルゴリズムを提案する.具体的には,遅延を許容して信頼性のある演奏位置を推定し,テンポを用いて現在位置を予測する.クラシック音楽およびジャズ音楽データベースを用いてオンセット検出に関する評価実験を行った結果,提案する実時間拍予測アルゴリズムを用いることで,許容誤差 300ms において約 15% 精度が向上することが確認された.
著者
村主 大輔 馬場 隆 森勢 将雅 片寄 晴弘
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-94, no.3, pp.1-8, 2012-01-27

日本ではカラオケや DTM の普及によって音楽活動がますます一般化され,年間 200 組以上のアーティストがメジャーデビューしている.それに伴い,新たなジャンルや歌唱スタイルが生まれることは少なくない.その一つの例として,ポピュラーソングに沖縄や奄美大島などアーティスト出生地の特色を出した音楽表現のスタイルが近年注目されるようになっている.そこで本研究は,歌唱スタイルが特徴的な奄美大島出身歌唱者の歌い回しに注目し,一般歌唱を奄美大島出身の歌唱者の歌い回しにするシステムの開発を目指す.具体的には,「グイン」 と呼ばれる奄美大島出身歌手の歌唱音声を歌唱特徴の定量的な分析を実施し,その分析結果に基づいて,一般歌唱に 「グイン」 を付加するシステムの概要と,その動作結果について報告する.
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014-MUS-103, no.55, pp.1-6, 2014-05-17

本研究では通常歌唱をグロウル系統の歌唱音声の印象をもつ音声に変換するシステムの検討を行っている.先行研究では簡単な信号処理で歌唱音声にグロウルらしさを付与する方法が提案された.本報告では提案手法で用いる特徴付与のパラメタを対話的に操作し,歌唱音声にグロウルらしさを付与する GUI について紹介する.提案手法は時間変調による基本周波数の高速な時間振動の付与,FIR フィルタによる処理範囲に共通した帯域強調処理,及び近似時変フィルタによる第 3 フォルマント周辺の高速な時間変調の付与の 3 つより構成されている.提案手法は変換処理に分析・合成を必要としないためリアルタイム処理を可能とし,ライブで一種のエフェクターとして用いることが出来る.GUI の開発は主にデモやポスターセッションの場で本手法による処理内容と処理の影響について直感的理解を促すことを目的としている.開発した GUI は実際にポスターセッションの場で操作し,操作性やデザイン性についてコメントを頂きたい.
著者
的場達矢 馬場隆 成山隆一 松本秀一 森勢将雅 片寄晴弘
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014-MUS-102, no.12, pp.1-5, 2014-02-16

VOCALOID などの音声合成技術の普及に伴い,歌声に関連する研究は活性化し,歌声情報処理と呼ばれる研究領域が定着した.また,歌声のうまさを自動採点する技術が実用化され,プロ歌手が 「うた」 の上手さを競う TV 番組が制作されるなど,歌のうまさについて興味が高まっている.Pops 歌唱の主要な表現対象の一つに 「グルーブ感」 が存在するが,その構成要因については明らかになっていない.本稿では,プロ歌唱者による 「グルーブ歌唱」 と 「非グルーブ歌唱」 の比較に基づいて,聴取者が 「グルーブ感」 を感じる要因が何であるのかについて検討した結果について報告する.分析の結果,子音長が 「グルーブ感」 の重要な構成要因であることが見いだされた.
著者
平井 重行 榊原 吉伸 早川 聖朋
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011-MUS-90, no.2, pp.1-6, 2011-05-06

日常生活を送る場所で,音楽を自らが演奏して楽しめる環境組み込み型の楽器の研究を行っている.その一つとして入浴中に浴槽をこすると鳴る 「キュッ,キュッ」 という音を利用して,DJ スクラッチ演奏が行えるシステム Bathcratch を制作した.ここでは,浴槽こすり音の特徴であるピッチの存在に着目し,その検出によってこすり音とそれ以外の音とを区別し,浴槽をこすった場合にのみスクラッチ音が鳴る仕組みを実現した.本報告では,その浴槽こすり音の解析や,Bathcratch システムの演奏処理部分を中心とした機能について述べる.
著者
前澤 陽
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-112, no.19, pp.1-8, 2016-07-23

本稿では,人間の演奏に合わせて機械が伴奏するような合奏システムにおける,伴奏パートの発音タイミングについて述べる.合奏中の演奏者は,(1) 自分自身のパートに対して,目標となる演奏タイミングを持ち,(2) 相手の演奏を予測しながら聴き,(3) 互いの主従関係を踏まえながら演奏タイミングを補正すると考えられる.また,これらの三要素は,楽曲中のコンテキストやリハーサルや対話を通じて,独立して学習もしくは制御されると考えられる.そこで本研究では,演奏者の演奏タイミング予測,伴奏パート自体の生成過程,演奏者・伴奏パート間の主従関係の 3 要素を,独立に学習もしくは制御が可能な,発音タイミングの数理モデルを提案する.
著者
室伏 空 中野 倫靖 後藤 真孝 森島 繁生
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.21, pp.1-7, 2009-07-22
被引用文献数
1

本研究では、既存のダンス動画コンテンツの複数の動画像を分割して連結(切り貼り)することで、音楽に合ったダンス動画を自動生成するシステムを提案する。従来、切り貼りに基づいた動画の自動生成に関する研究はあったが、音楽{映像間の多様な関係性を対応付ける研究はなかった。本システムでは、そうした多様な関係性をモデル化するために、Web 上で公開されている二次創作された大量のコンテンツを利用し、クラスタリングと複数の線形回帰モデルを用いることで音楽に合う映像の素片を選択する。その際、音楽{映像間の関係だけでなく、生成される動画の時間的連続性や音楽的構造もコストとして考慮することで、動画像の生成をビタビ探索によるコスト最小化問題として解いた。This paper presents a system that automatically generates a dance video clip appropriate to music by segmenting and concatenating existing dance video clips. Although there were previous works on automatic music video creation, they did not support various associations between music and video. To model such various associations, our system uses a large amount of fan-fiction content on the web, and selects video segments appropriate to music by using linear regression models for multiple clusters. By introducing costs representing temporal continuity and music structure of the generated video clip as well as associations between music and video, this video creation problem is solved by minimizing the costs by Viterbi search.
著者
矢澤 櫻子 寺澤 洋子 平田 圭二 東条 敏 浜中 雅俊
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.1, pp.1-7, 2010-10-07
参考文献数
8

本稿では Eugene Narmour が提唱した暗意実現モデルを用いたメロディ構造分析システムについて報告する.暗意実現モデルは旋律中に現れる 3 つの音のパターン (シンボル) を発見し楽曲を分析する.シンボル全部で 8 つの基本類型と 2 つの例外型が定義されている.我々は,与えられた旋律の中からその 8 つの基本形を発見する分析器を実装した.本発表では分析器の構成と実行結果について報告し,問題点や今後の改良点などを議論する.This paper describes a melody analysis system based on Implication Realization Model (IRM), which was proposed by Eugene Narmour. In IRM, melodies are segmented into sets of three notes or two notes, which are attributed to eight basic melody archetypes and two other exceptional types. Our melody analysis system segments a melody and then identifies the archetype for the three- or two-notes sets according to IRM. This paper describes structure of the system, reports the experimental results, and discusses the current problems and future directions.
著者
糸山 克寿 尾形 哲也 奥乃 博
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.29, pp.1-7, 2012-01-27

本稿では,多重奏音楽音響信号に対する自動和音和音手法について述べる.和音の認識においては,音楽的要素の関連性を考慮することが重要である.我々は,和音を表現する音響特徴であるクロマベクトルに加えて和音と関わりの深い音楽的要素であるベース音を用いた自動和音認識手法を構築した.和音遷移のパターンを事前に階層 Pitman-Yor 言語モデルで学習し,Viterbi アルゴリズムに基づく最大事後確率推定で和音系列を推定する.Beatles の 150 楽曲を用いた評価実験で,本手法は 73.7% の認識率を達成した.This paper describes a method that identifies musical chords in polyphonic musical signals. As musical chords mainly represent the harmony of music and are related to other musical elements such as melody and rhythm, we should be able to recognize chords more effectively if this interrelationship is taken into consideration. We use bass pitches as clues for improving chord recognition. The proposed chord recognition system is constructed based on Viterbi-algorithm-based maximum a posteriori estimation that uses a posterior probability based on chord features, chord transition patterns, and bass pitch distributions. Experimental results with 150 Beatles songs that has keys and no modulation showed that the recognition rate was 73.7% on average.
著者
朝比奈 わかな 岡田 成美 岩本 尚也 増田 太郎 福里 司 森島 繁生
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2015, no.23, pp.1-6, 2015-02-23

近年,3DCG 制作ツール (MikuMikuDance 等) の普及により,楽曲に合わせて CG キャラクタを踊らせる動画作品が増加傾向にある.このようなダンス動画においてキャラクタの表情は作品全体の印象に大きく影響する.例えば,楽曲やダンスモーションの印象と全く異なる印象の表情を付与した場合,その動画は違和感のある作品となってしまう.また,楽曲の印象が一定でも,ダンスモーションの激しさの度合いやキャラクタの姿勢などによって,印象が大きく左右される場合がある.そのため,作品の印象を決定する要素として,楽曲の印象だけでなく,ダンスモーションの情報も考慮する必要がある.そこで我々は,ダンス動画の印象についての主観評価実験に基づき,音響特徴量とモーション特徴量を用いて重回帰分析を行うことで,ダンスモーションにシンクロした楽曲印象推定を可能にした.
著者
竹野 真帆 高田 明典
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.18, pp.1-6, 2013-03-08

筆者らは,これまで,MMORPG やアメーバピグの調査・分析を通して,若年層プレイヤーの実態把握に務めてきた.しかしながら,コンテンツ側の検討のみでは,その利用実態の把握が十分ではないことから,本研究においては,中学生 3000 人程度に対してアンケート調査を実施し,当該層におけるネットコミュニケーションの現状把握を試みた.アンケートへの回答には,トラブルに実際あったというものも存在しており,どのような属性を持った利用がトラブルに遭遇しているのか等のケース別の検討を,併せて行なった.We have tried to grasp real circumstances about young players' use of online games by surveying and analyzing MMORPG and Ameba-pigg. Analyzing method we have used was only for narrative structure of the contents, therefore we could have understood the partial aspect of the users actual circumstances. The main purpose of this research was to know the real circumstances about the use of online communication tools in young players, especially in junior high school students. For this purpose we surveyed more than three thousands junior high-school students. There were some students who had experienced troubles in the Internet, also we tried to determine the aspect of troubled students.
著者
吉井和佳 糸山克寿 後藤真孝
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.9, pp.1-8, 2014-08-18

本稿では,多数の楽器音が重畳している音楽音響信号を,音の三要素である音高 (基本周波数)・音色 (スペクトル包絡)・音量に分解するための確率的ソース・フィルタモデルについて述べる.ソース・フィルタ理論は楽器音分析に広く利用されており,楽器音のフーリエ変換スペクトルは,音源信号の基本周波数に起因するスペクトル微細構造と楽器音の音色を表すスペクトル包絡との積に分解される.このとき,スペクトル包絡が全極型モデルで表現できると仮定すると,理論的には線形予測分析 (LPC) を用いて,線形周波数領域でスペクトル包絡を推定することができる.しかし,実際には,調波構造のピークのみがスペクトル包絡からの信頼できるサンプルであるとみなせるため,スペクトル包絡推定に全周波数帯域を利用することは適切ではない.この問題の解決法のひとつに離散全極型モデルが知られているが,多重音に対して適用することはできなかった.本研究では,離散全極型モデルを LPC の多重音拡張である複合自己回帰モデルの枠組みに組み入れることで,調波構造が複数重畳した音響信号を扱うことができる無限重畳離散全極型モデルを提案する.本モデルは,人間の聴覚特性に則した対数周波数領域で定式化されるノンパラメトリックベイズモデルであり,適切な個数のスペクトル包絡とそこからサンプルされた適切な個数の調波構造を推定することができる.実験の結果,提案手法の有効性を確認した.
著者
吉田 周平 星野 厚 浜中 雅俊
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2010-MUS-86, no.19, pp.1-6, 2010-07-21

本論文ではTwitterへの単旋律データの投稿と,これらを素材として再利用することで作曲を行うことのできるシステムについて述べる.素材の再利用によって作られた曲データは再びTwitterに投稿でき,また改編可能にすることで未完成状態での投稿や,作曲の過程を共有することができる.多くの作曲システムは一人で作曲することが前提のシステムとなっており,素材データの作成,共有という概念はなく,プロの作った素材を購入して使用するのが一般的となっていた.そこで我々はTwitterのつぶやきのような気軽さで旋律を投稿でき,ユーザー同士のつながりを生かした多人数参加型の作曲システムを設計することを考えた.具体的にはデータ形式としてMML(Music Macro Language)を採用することで,テキストで音楽を表現することを可能とした.そして素材の作成からTwitterへの投稿,投稿された素材を利用した作曲とその曲のTwitterへの投稿,さらに投稿された曲の改変までを統合的に行えるシステムを実装した.
著者
深山覚 後藤真孝
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.14, pp.1-7, 2014-08-18

ダンスと音楽が連動したデータから機械学習を行い、新しく入力する楽曲に対して 3 次元コンピュータグラフィックスのキャラクタのダンスを自動生成できる手法 MachineDancing を提案する。従来、ダンスの断片を準備しそれを確率モデルなどを用いて音楽に合わせて接続することでダンス自動生成が実現されてきた。しかしダンスの断片を切り貼りするのみで、ダンス動作自体の学習・生成手法とはなっておらず、生成結果のバリエーションに限界があった。本研究ではダンス動作の確率モデルとしてガウシアンプロセス (GP) を用い、ダンスと音楽の対応関係のみでなく、ダンス動作自体をも学習することで、新たな動作を楽曲に連動して自動生成できる手法を提案する。
著者
平田 圭二 東条 敏 浜中 雅俊 松原 正樹
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.20, pp.1-8, 2014-08-18

本発表では,現在我々が進めている計算論的音楽理論に関するプロジェクトについて述べる.我々が提案する計算機の存在を前提とした音楽の意味論とその意味論に基づいて構築された音楽に対する代数的な計算体系について,ゴール,設計思想を議論し,これまでの研究成果を紹介し,今後の課題や展望を述べる.
著者
川瀬 佑司 峯松 信明 齋藤 大輔 広瀬 啓吉 沈 涵平
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014-MUS-103, no.27, pp.1-6, 2014-05-17

国際共通語である英語は、それぞれの国や地域の母語干渉により、多様な発音、所謂訛りが存在することが知られている。筆者らの先行研究では、様々な英語発音に対して話者を単位とした自動分類を検討している。ボトムアップ的な分類を行う場合、一般的には対象とする要素群に対して要素間距離行列が必要となる。先行研究では任意二話者間の発音距離の自動推定を行っている。この距離行列を可視化する場合には、多次元尺度法 (Multi-Dimensional Scaling, MDS) や樹形図を用いることが多い。本研究ではこれらに代わる、発音距離行列に対する新しい可視化手法を提案する。従来の可視化は、距離行列全体を表現することが狙いである。しかし可視化結果を呈示される特定の学習者にとってみれば、知りたい主情報は自分とそれ以外の話者の関係性である。そこで本研究では、特定話者とそれ以外の話者の発音距離に着目し、さらには年齢や性別といった情報も含め、英語発音の自己視点からの可視化を提案する。提案手法では従来手法と異なり、可視化結果に歪みが全く生じないことが保証されている。
著者
平井 重行 榊原 吉伸 早川 聖朋
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.2, pp.1-6, 2011-05-06

日常生活を送る場所で,音楽を自らが演奏して楽しめる環境組み込み型の楽器の研究を行っている.その一つとして入浴中に浴槽をこすると鳴る 「キュッ,キュッ」 という音を利用して,DJ スクラッチ演奏が行えるシステム Bathcratch を制作した.ここでは,浴槽こすり音の特徴であるピッチの存在に着目し,その検出によってこすり音とそれ以外の音とを区別し,浴槽をこすった場合にのみスクラッチ音が鳴る仕組みを実現した.本報告では,その浴槽こすり音の解析や,Bathcratch システムの演奏処理部分を中心とした機能について述べる.We developed an environmental embedded instrument which we enjoy playing in everyday life. The Bathcratch system which is utilizing rubbing sounds of bathtub with some water enables us to play DJ scratch sounds. In this paper, we describe the system overview and its some functionalities including analyzing bathtub rubbing sounds and playing DJ scratch sounds.