著者
武田 太一 濱崎 雅弘 後藤 真孝
出版者
Webインテリジェンスとインタラクション研究会
雑誌
Webインテリジェンスとインタラクション研究会 予稿集 第15回研究会 (ISSN:27582922)
巻号頁・発行日
pp.9-12, 2019 (Released:2022-11-07)
参考文献数
5

バーチャルYouTuber (VTuber) と呼ばれる,動画投稿者を模したバーチャルキャラクターの活動が盛んになっている.VTuberという言葉は2016年頃から使われ始め,2019年9月時点ではVTuberを名乗るキャラクターは少なくとも9000人を超えている.VTuberの活動はタレントやクリエータなど様々であり多くの分野で注目を集めている.本研究ではそうしたVTuberらの活動の理解と支援を目的として,Webから関連情報を収集し分析した.具体的にはWebからVTuberのプロフィール情報等を収集し基礎的な調査した.さらにVTuberらのTwitterフォロワー情報を収集しその共起関係から,活動傾向の違いやVTuber間の関係性について分析した.
著者
中村 聡史 山本 岳洋 後藤 真孝 濱崎 雅弘
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.3, pp.148-158, 2013-06-28

本稿では,動画共有ウェブサイトにおいて日々アップロードされる膨大な楽曲動画について,ユーザがその動画に対して興味があるかどうかを短時間で判断する手段として,15秒のサムネイル動画を自動生成する手法を提案する.ここでは,楽曲動画作成者と楽曲動画視聴者に注目し,楽曲動画のサビ検出技術と,視聴者の盛り上がり検出技術を使うことにより,サムネイル動画を自動生成する仕組みを実現する.また,評価実験により,組合せ手法の有効性とその特徴を明らかにする.
著者
後藤 真孝
雑誌
情報処理学会研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2002, no.100(2002-MUS-047), pp.27-34, 2002-10-25

本稿では、ポピュラー音楽の音響信号に対して、サビの区間の一覧を求める手法を提案する。従来、楽曲の音響信号中に何度も出現するサビのどこか一箇所を、指定した長さだけ切り出して提示する研究はあったが、サビ区間の開始点と終了点はわからず、サビの転調も扱えなかった。本手法は、様々な繰り返し区間の相互関係を調べることで、楽曲中で繰り返されるすべてのサビ区間を網羅的に検出し、それらの開始点と終了点を推定できる。また、転調後でも繰り返しと判断できる類似度を導入することで、転調を伴うサビも検出できる。この検出結果は、リアルタイム音楽情景記述システムにおける大局的な記述に相当する。RWC研究用音楽データベース100曲を用いて本手法を評価したところ、80曲のサビが検出できた。
著者
後藤 真孝
出版者
日本酪農科学会
雑誌
ミルクサイエンス (ISSN:13430289)
巻号頁・発行日
vol.61, no.3, pp.239-245, 2012

日本人には,牛乳やアイスクリームなどの乳製品を飲食すると腹痛・下痢などの腸内障害を起こす「乳糖不耐症」の人が多い。これは乳製品に含まれる乳糖から引き起こされ,予防・改善法の一つに酵素補充療法となるラクターゼ(乳糖分解酵素,β-ガラクトシダーゼ)の服用がある。本稿では乳糖を分解する酵素をラクターゼと呼ぶことにする。この経口服用用の酵素には,主にカビ由来のラクターゼが使用されている。しかしながら,日本において,ラクターゼは医薬品として規定(昭和46年6月1日付け薬発476号厚生省薬務局長通知「無承認無許可医薬品の指導取締りについて」の別紙「医薬品の範囲に関する基準」)されており,店頭販売されておらず一般健常人の入手は極めて難しい。日本人における乳糖不耐症の頻度は70~80%と言われながら,ラクターゼ製剤を入手できないことは乳製品の敬遠や低乳糖乳製品の飲食しかできない結果となり,美味しい食品をそのまま他の人と同じように味わえないことに繋がる。一方,米国ではダイエタリーサプリメントとしてラクターゼ製剤が店頭販売され,一般健常人が容易に入手できる。そこで本稿では,カビ由来ラクターゼに着目し,その利用について考察する。
著者
中野 倫靖 後藤 真孝 梶田 秀司 松坂 要佐 中岡 慎一郎 横井 一仁
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.3, pp.1222-1235, 2014-03-15

本論文では,ユーザ歌唱における顔表情を真似てヒューマノイドロボットの顔動作を生成するVocaWatcherについて述べる.ここで,我々が以前開発したVocaListenerを用い,ユーザ歌唱の歌い方(音高と音量)を真似て歌声合成も行う.従来,歌唱ロボットに関する研究はあったが,手作業による動作制御が主で,その自然さに限界があった.それに対して本研究では,単一のビデオカメラで収録した人間の歌唱動画を画像解析し,口,目,首の動作を真似て制御することで,自然な歌唱動作を生成した.ここで口の制御には,VocaListenerから得られる歌詞のタイミング情報を用いて,歌声に同期した動作を生成できる.さらに,ロボットによるより自然な歌唱を実現するために,我々が以前開発したブレス音の検出技術とVocaListenerを組み合わせ,ブレス音を真似て合成できるように拡張した.In this paper, we describe VocaWatcher that is a facial-motion generator for a singing robot by imitating user's singing. It can synthesize singing voices by using our previous VocaListener to imitate pitch (F0) and dynamics (power) of user's singing. Although singing humanoid robots have been developed with synthesized singing voices, such robots do not appear to be natural because of limitations of manual control. To generate natural singing expressions, VocaWatcher imitates a human singer by analyzing a video clip of human singing recorded by a single video camera. VocaWatcher can control mouth, eye, and neck motions by imitating the corresponding human movements. To control the mouth motion, VocaWatcher uses lyrics with precise timing information provided by VocaListener. Moreover, we extended VocaListener by combining our previous method of breath sound detection to imitate breathing sounds that make the robot singing more realistic.
著者
後藤 真孝 中野 倫靖 濱崎 雅弘
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.56, no.11, pp.739-749, 2014

本稿では,初音ミクとN次創作に関連した音楽情報処理の研究事例として,歌声合成技術VocaListenerと音楽視聴支援サービスSongriumを紹介する。VocaListenerは,初音ミク等の歌声合成ソフトウェアを用いて,録音された人間の歌声の事例からその歌い方(声の高さと声の大きさ)をまねて自然な歌声を合成する技術である。Songriumは,オリジナル楽曲とそれらのN次創作結果である派生作品といったさまざまな関係性を可視化できる音楽視聴支援サービスである。本稿ではさらに,より未来を見据えて自動創作と自動鑑賞の可能性を考察することで,音楽がもたらす感動の本質的な要因についても議論する。
著者
後藤 真孝
出版者
日本酪農科学会
雑誌
ミルクサイエンス (ISSN:13430289)
巻号頁・発行日
vol.61, no.3, pp.239-245, 2012 (Released:2014-03-15)
参考文献数
23

Lactose intolerant people in Asia are about 80% population. People with lactose intolerant do not produce enough of the lactase enzyme to break down lactose contained in milk and milk products. One method for prevention, reduction or improvement is lactase supplementation, and fungal lactase (β-galactosidase) is used generally. Characteristics of fungal lactase is stability at acidic pH. Acidic stability of three lactases produced by Aspergillus oryzae, Penicillium multicolor and Aspergillus niger are different. Lactase from A. niger is most stable among them, but low-reactivity at neutral pH. Amino acid sequence homology among three fungal lactases is more than 70%, but relation between lactase character and structure is unknown. In Japan, lactase for lactose intolerance is regulated as drug and it is hard to purchase generally. A. oryzae is known as ‘Koji’ used for japanese traditional fermented foods such as miso, syoyu and sake. For this reason, lactase produced by A. oryzae is thought to be safe. If lactase can be obtained like U.S. dietary supplement, it is expected that lactase supplementation will be known widely.
著者
後藤 真孝 根山亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.2, pp.299-309, 2002-02-15
被引用文献数
19

本論文では,Internetのような広域ネットワークを経由して,不特定多数のユーザが遠隔地間でジャムセッションできるシステムOpen RemoteGIGを提案する.本研究は,物理的に1カ所に集まらなくても,音楽的なインタラクションを楽しむことができるセッションを実現することを目的とする.従来,遅延の小さいネットワークを介したMIDI中継は実現されていたが,遅延の大きいInternet等を介した双方向のMIDI中継によって,調性とリズムのある音楽を合奏することはできなかった.そこで本研究では,不可避な遅延を積極的に利用した,調性とリズムのある音楽のための新たな形態の遠隔セッションシステムOpen RemoteGIGを実現した.Open RemoteGIGでは,同一のコード進行(12小節のブルース進行等)の繰返しを,テンポ一定で演奏することを前提として,遠隔地にいる複数の演奏者がInternet経由のセッションを行う.演奏者は,お互いの演奏をコード進行の1周期の整数倍の時間だけ遅れて聞き合いながら,即興演奏する.コード進行は繰り返すため,遅延した演奏は再び同じコードとなり調和する.さらに,Open RemoteGIGは,演奏相手の発見環境や打合せ用のチャット機能も提供する.MIDI中継は音楽用通信プロトコルRMCPに基づいて実装され,実際に遠隔地間で提案したセッションをできることが確認された.This paper describes a distributed session system called {\it Open RemoteGIG\/} which enables widely distributed musicians to join a worldwide jam session by using the Internet.Our goal is to have musicians participating in a truly interactive jam session without getting together physically.Although MIDI transmission via small-latency networks has been tried, performing a distributed jam session with tonality and rhythm has been considered difficult when we use a long-latency public network like the Internet.We therefore developed an innovative distributed session system for music with tonality and rhythm, {\it Open RemoteGIG}, which turns the long inevitable network latency to its advantage.In Open RemoteGIG, distributed musicians can interact over the Internet under the assumption that the tempo is constant and the chord progression is repetitive, like that of 12-bar blues.Each musician can improvise while listening to the others' performances that are intentionally delayed for multiples of the constant period of the repetitive chord progression; the delayed performance can fit the chords because the progression is repetitive.Open RemoteGIG also supports a musician-finding and group-chatting environment.The MIDI transmission was implemented by using a music network protocol called {RMCP} and we confirmed that the proposed distributed session was achieved.
著者
後藤 真孝 橋本 裕司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.1993, no.109, pp.1-8, 1993-12-10
被引用文献数
15

本稿ではMIDIとLANを融合した分散協調システムについて述べる.本システムでは,コンピュータの支援を受けながら複数のユーザがMIDI楽器を合奏できる.本システムにより,MIDIに対応した専用機器を用意しなくても,汎用のコンピュータを組み合わせて様々な演奏の支援や特殊効果を得られる.例えば,広域ネットワークを使って遠隔地間の合奏をしたり,他のユーザの演奏状態を視覚化したり,演奏情報に反応して変化するCGを表示したりすることなどができる.これらを実現するために,MIDIプロトコルをそのまま用いるのではなく,ブロードキャストなどの特徴を持つ通信プロトコルRMCPを設計した.本システムは実際にネットワークで結ばれたワークステーション上に実装され,3人での合奏が可能であった.This paper presents a distributed cooperative system, which integrates MIDI and LAN. This system allows the users to play an ensemble with computer support. Because of the integration of MIDI and LAN, various kinds of support are obtained by exploiting existing computers without special MIDI materials. For example, the users may play a remote session through a wide area network. They also may see visualized information of other user's play, and computer graphics reacting to the play. This paper also shows RMCP (Remote Music Control Protocol), which is an extension of MIDI protocol; it supports broadcasting, for example. This system was implemented on workstations connected to Ethernet. In our experience, 3 users were actually able to play an ensemble.
著者
大浦圭一郎 間瀬 絢美 山田 知彦 徳田 恵一 後藤 真孝
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.1, pp.1-8, 2010-07-21
被引用文献数
3

近年,コンピュータによる歌声合成が注目を集めている.中でも隠れマルコフモデル(hidden Markov model; HMM)に基づく歌声合成では,歌い手の特徴を歌声データと対応する楽譜から自動的に学習することができる.2009年12月,無料のオンラインサービス「HMM歌声合成システム: Sinsy」を開始した.ユーザーは楽譜をウェブサイトにアップロードすることで,任意の楽譜に対応した歌声を合成することができる.但し,Sinsyの歌声モデルには70曲で学習した特定話者モデルを用いており,新しい歌い手の歌声モデル追加の際の収録コストが高くなる問題があった.本稿ではSinsyのシステム構成について述べるとともに,話者適応手法により少量のデータから所望の歌い手の特徴を再現した歌声を合成することを検討する.A statistical parametric approach to singing voice synthesis based on hidden Markov models (HMMs) has been grown over the last few years. In this approach, spectrum, excitation, and duration of singing voices are simultaneously modeled by context-dependent HMMs, and waveforms are generated from HMMs themselves. Since December 2009, we started a free on-line service named "Sinsy." By uploading musical scores represented by MusicXML to the Sinsy website, users can obtain synthesized singing voices. However, a high recording cost may be required to train new singer's model because a speakerdependent model trained by using 70 songs is used in Sinsy. The present paper describes the recent developments of Sinsy and a speaker adaptation technique to generate waveforms from a small amount of adaptation data.
著者
糸山 克寿 後藤 真孝 駒谷 和範 尾形 哲也 奥乃 博
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.3, pp.1-6, 2009-07-22

本報告では,楽曲の楽器パート音量操作によってユーザがクエリをカスタマイズすることが可能な類似楽曲検索手法を提案する.楽曲の雰囲気やジャンルは楽曲を構成する楽器およびその音量バランスと強く関係する,という仮説に基づく.楽曲の音響信号を楽譜に基づいて楽器パートへと分離し,その分離信号の音量を操作することで楽曲の音響的特徴を変化させる.楽曲の音響特徴はガウス混合分布で表現され,楽曲間の類似性を分布間の Earth Movers Distance で定義する.実験により,歌声,ギター,ドラムスパートの音量を操作した際にジャンルシフトが起こることを示す.This report presents a novel Query-by-Example (QBE) approach in Music Information Retrieval, which allows a user to customize query examples by directly modifying the volume of different instrument parts. The underlying hypothesis is that the musical genre shifts (changes) in relation to the volume balance of different instruments. Our QBE system first separates the musical audio signal into all instrument parts with the help of its musical score, and then lets a user remix those parts to change acoustic features that represent musical mood of the piece. The distribution of those features is modeled by the Gaussian Mixture Model for each musical piece, and the Earth Movers Distance between mixtures of different pieces is used as the degree of their mood similarity. Experimental results showed that the shift was actually caused by the volume change of vocal, guitar, and drums.
著者
土井啓成 戸田智基 中野倫靖 後藤真孝 中村哲
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.5, pp.1-9, 2012-08-02

歌声の声質には,歌手の個人性が反映されており,他者の声質に自在に切り替えて歌うことは難しい.そこで我々は,歌声の声質を他者の歌声の声質へと自動変換することで,任意の声質での歌唱を実現する手法を提案し,歌唱という音楽表現の可能性を広げることを目指す.従来,統計的声質変換に基づく歌声声質変換が実現されていたが,提案手法では様々な声質に少ない負担で変換可能にするため,多対多固有声変換を導入する.これにより変換時に数秒程度の少量の無伴奏歌声さえあれば,任意の歌手の歌声から別の任意の歌手の歌声への声質変換が実現できる.しかし,その声質変換モデルの事前学習データとして,ある参照歌手の歌声と多くの事前収録目標歌手の歌声とのペアから構成されるパラレルデータセットが必要で,その歌声収録は困難であった.そこで提案手法では,歌唱表現を模倣できる歌声合成システム VocaListener を用いて目標歌手の歌声から参照歌手の歌声を生成することで,その学習データ構築を容易にする.実験結果から提案手法の有効性を確認した.
著者
浜中 雅俊 後藤 真孝 麻生 英樹 大津展之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.100, pp.71-78, 2002-10-25
被引用文献数
5

本稿では、実在する人間の演奏者固有のフレーズを模倣するためには、ジャムセッションの演奏記録から、フレーズを再利用可能な形で切り出し、フレーズデータベース上に蓄積する必要がある.本研究では、自動でフレーズデータベースを作成するための手法として、(1)確率モデルに基づいた発音時刻のクォンタイズとそのモデルパラメータの教師なし推定法、(2)ボロノイ線図を用いたグルーピング手法によるフレーズ分割、(3)局所自己相関関数を用いたフレーズからの特徴抽出法とフレーズの空間配置法、を提案する.This paper describes a jam session system that enables a human player to interplay with virtual players, each of which imitates musical phrases of a human player. In order to imitate musical phrases of a human player, it is necessary to build a database of phrases extracted from session recording. We propose the following three methods for creating a database automatically:(1) a probabilistic-model-based quantization method for estimating the positions of onset times in a score and an unsupervised estimating method for the model parameters, (2) a phrase dividing method using the Voronoi diagram, and (3) a method of extracting the phrase characteristics by using autocorrelations and a method of locating phrases in a space.
著者
室伏 空 中野 倫靖 後藤 真孝 森島 繁生
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.21, pp.1-7, 2009-07-22
被引用文献数
1

本研究では、既存のダンス動画コンテンツの複数の動画像を分割して連結(切り貼り)することで、音楽に合ったダンス動画を自動生成するシステムを提案する。従来、切り貼りに基づいた動画の自動生成に関する研究はあったが、音楽{映像間の多様な関係性を対応付ける研究はなかった。本システムでは、そうした多様な関係性をモデル化するために、Web 上で公開されている二次創作された大量のコンテンツを利用し、クラスタリングと複数の線形回帰モデルを用いることで音楽に合う映像の素片を選択する。その際、音楽{映像間の関係だけでなく、生成される動画の時間的連続性や音楽的構造もコストとして考慮することで、動画像の生成をビタビ探索によるコスト最小化問題として解いた。This paper presents a system that automatically generates a dance video clip appropriate to music by segmenting and concatenating existing dance video clips. Although there were previous works on automatic music video creation, they did not support various associations between music and video. To model such various associations, our system uses a large amount of fan-fiction content on the web, and selects video segments appropriate to music by using linear regression models for multiple clusters. By introducing costs representing temporal continuity and music structure of the generated video clip as well as associations between music and video, this video creation problem is solved by minimizing the costs by Viterbi search.
著者
齋藤 毅 後藤 真孝
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.109, no.100, pp.1-6, 2009-06-18
被引用文献数
2

歌唱指導による歌声中の音響特徴の変化を分析し,その変化が歌唱力評価与える影響を調査した.3名の男性アマチュア歌唱者が歌唱指導を受ける前,及び後に収録した歌声(歌謡曲歌唱)を対象に,歌声特有の各種音響特徴を分析した結果,歌唱ホルマントに類似した3kHz付近のスペクトルピークの生起,及びF0変動成分であるオーバーシュートとヴィブラートにおける特性の変化を確認した.聴取実験によってF0情報及びスペクトル情報の変化に対する歌唱力変化を調査した結果,F0変化を指導前から指導後のパターンに変化させた場合の方がスペクトルを変化させた場合に比べて歌唱力の向上が大きい結果となった.また,個々の音響特徴の歌唱力評価への寄与度を比較した結果,ヴィブラート,歌唱ホルマント,オーバーシュート,プレパレーションの順で大きいことが明らかとなった.
著者
根山 亮 後藤 真孝 村岡 洋一
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.275-276, 1997-03-12
被引用文献数
2

近年, 計算機とのジャズセッションを実現するシステムに関する研究が多くなされてきた. しかし, これらのシステムは, ある特定の計算機環境でしか動作せず, またぞれぞれのシステムで用意された特定の計算機演奏者としかセッションを行なうことができなかった. 本稿では, ユーザが新しい計算機演奏者を容易に開発・カスタマイズしてWWW上に公開したり, 計算機演奏者をWWW上から自宅のパソコンのような身近な場所にダウンロードし, セッションを行なうことを可能とする枠組を提案する. 特にダウンロードした計算機演奏者がセッションをする際に必要となる通信を, 安全性を確保して行なうための方法, 新しい計算機演奏者の開発労力を削減する方法について述べる. 本システムはJavaで記述されており, Java対応のWWWブラウザ上で動作するので, 計算機環境に依存しない. 我々は演奏者の実装例として, ジャズのピアノトリオのべーシストとドラマーを実装した. ユーザはピアノを演奏することにより, 計算機演奏者と即興演奏を楽しむことができる. 実験の結果, 実際にHTTPサーバからダウンロードしたべーシストとドラマーをWWWプラウザ上で実行し, 人間のピアノの演奏にあわせてリアルタイムに演奏させることができた. また本システムが異なる複数の計算機環境で動作することも確認した.
著者
吉井和佳 糸山克寿 後藤真孝
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.9, pp.1-8, 2014-08-18

本稿では,多数の楽器音が重畳している音楽音響信号を,音の三要素である音高 (基本周波数)・音色 (スペクトル包絡)・音量に分解するための確率的ソース・フィルタモデルについて述べる.ソース・フィルタ理論は楽器音分析に広く利用されており,楽器音のフーリエ変換スペクトルは,音源信号の基本周波数に起因するスペクトル微細構造と楽器音の音色を表すスペクトル包絡との積に分解される.このとき,スペクトル包絡が全極型モデルで表現できると仮定すると,理論的には線形予測分析 (LPC) を用いて,線形周波数領域でスペクトル包絡を推定することができる.しかし,実際には,調波構造のピークのみがスペクトル包絡からの信頼できるサンプルであるとみなせるため,スペクトル包絡推定に全周波数帯域を利用することは適切ではない.この問題の解決法のひとつに離散全極型モデルが知られているが,多重音に対して適用することはできなかった.本研究では,離散全極型モデルを LPC の多重音拡張である複合自己回帰モデルの枠組みに組み入れることで,調波構造が複数重畳した音響信号を扱うことができる無限重畳離散全極型モデルを提案する.本モデルは,人間の聴覚特性に則した対数周波数領域で定式化されるノンパラメトリックベイズモデルであり,適切な個数のスペクトル包絡とそこからサンプルされた適切な個数の調波構造を推定することができる.実験の結果,提案手法の有効性を確認した.
著者
後藤 真孝 橋口博樹 西村拓一 岡隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.3, pp.728-738, 2004-03-15
被引用文献数
55

本論文では,研究者が研究目的で共通に利用できる著作権処理済み音楽データベースの,制作方針と構成について述べる.他の研究分野では,以前から多様な共通データベースが構築され,研究の進展に大きく貢献してきていたが,音楽情報処理の分野では,従来,共通楽曲データベースや大規模な楽器音データベースは存在していなかった.そこで我々は,RWC(Real World Computing)研究用音楽データベースとして,「ポピュラー音楽データベース」(100曲),「著作権切れ音楽データベース」(15曲),「クラシック音楽データベース」(50曲),「ジャズ音楽データベース」(50曲),「音楽ジャンルデータベース」(100曲),「楽器音データベース」(50楽器)の6つを構築した.全315曲に対し,音響信号,標準MIDIファイル,歌詞のテキストファイルを用意し,50楽器に対し,音域全体を半音間隔で収録した単独演奏音を用意した.これらを共通ベンチマークとして活用することで,様々なシステムや手法の比較・評価が可能になる.また,統計的手法や学習手法を活用した,データベースに基づく多様な研究の進展も期待できる.さらに,学会等における研究成果の対外発表の際にも,著作権の制約を受けずに自由な使用ができるようになる.本データベースはすでに広く利用され始めており,音楽情報処理の研究分野の発展に寄与していくことが期待される.This paper describes the design policy and specifications of a copyright-cleared music database that is available to researchers as a common foundation for research.Shared databases are common in other fields of academic research and have frequently made significant contributions to progress in those areas.The field of music information processing, however, has lacked common databases of musical pieces and large-scale databases of musical instrument sounds.We therefore built the RWC (Real World Computing) Music Database which contains six original collections: the Popular Music Database (100 pieces), Royalty-Free Music Database (15 pieces), Classical Music Database(50 pieces), Jazz Music Database(50 pieces), Music Genre Database(100 pieces), and Musical Instrument Sound Database(50 instruments).For all 315 musical pieces, we prepared audio signals, standard MIDI files, and text files of lyrics.For the 50 instruments, we captured individual sounds at half-tone intervals.These collections will provide a benchmark that enables researchers to compare and evaluate their various systems against a common standard.The database can also be used to stimulate research in database-oriented approaches that use statistical methods and learning techniques.In all cases, researchers can use the database for research publications and presentations without copyright restrictions.The RWC Music Database has already been widely used and will contribute to further advancements in the field of music information processing.
著者
深山覚 後藤真孝
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.14, pp.1-7, 2014-08-18

ダンスと音楽が連動したデータから機械学習を行い、新しく入力する楽曲に対して 3 次元コンピュータグラフィックスのキャラクタのダンスを自動生成できる手法 MachineDancing を提案する。従来、ダンスの断片を準備しそれを確率モデルなどを用いて音楽に合わせて接続することでダンス自動生成が実現されてきた。しかしダンスの断片を切り貼りするのみで、ダンス動作自体の学習・生成手法とはなっておらず、生成結果のバリエーションに限界があった。本研究ではダンス動作の確率モデルとしてガウシアンプロセス (GP) を用い、ダンスと音楽の対応関係のみでなく、ダンス動作自体をも学習することで、新たな動作を楽曲に連動して自動生成できる手法を提案する。