著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-115, no.52, pp.1-5, 2017-06-10

本稿はテレパシー通信,即ち,マイクロ波聴覚刺激を応用して音声信号を頭部に直接,伝えるマイクロ波通信の起源を探求するものであり,クロード ・ シャノン等が発明者である米国特許 2801281 号を分析することにより,1948 年にクロード ・ シャノン等が公表した 「パルス符号変調の哲学」 は具体的な通信機,電子回路を秘匿しつつ,通信理論に抽象化してテレパシー通信を公表した旨を指摘する.
著者
高橋 響子 赤木 正人
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2019-MUS-123, no.24, pp.1-4, 2019-06-15

歌声には,喉頭および口腔内で生じる乱流雑音が多い.そのため,音声生成過程の数理モデルによる歌声の声道共鳴特性および声帯音源特性の推定は困難であった.本研究では,歌声生成過程の解明に向け,乱流雑音を含む歌声の声帯音源波形と声道共鳴特性の同時推定法を提案する.推定される声道共鳴特性の安定性を保つために,声道共鳴特性は声帯音源特性に比較してゆっくりと変化するという仮定のもと声道共鳴特性を推定した.歌声のシミュレーション波形をデータとして用いた分析実験により,乱流雑音が声帯音源に含まれる歌声において,声帯音源波形と声道共鳴特性が同時推定可能であることが確認された.
著者
飯野 なみ 浜中 雅俊 西村 拓一 武田 英明
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2019-MUS-124, no.13, pp.1-6, 2019-08-20

楽器演奏において上級者のノウハウを抽出し体系化することは,効率的な弾き方や効果的な表現の実現に繋がる.我々はこれまで,多くの演奏技法が求められるクラシックギターに着目し,知識工学的アプローチによってギター奏法オントロジーを構築した.これは,クラシックギターの演奏技法を主概念として分類し,具体的な行為や手順を記述したものである.本研究では,ギター奏法オントロジーの概念を対象として,ギターコンクールで選曲率の高い楽曲における演奏技法の傾向や変遷を調査した.その結果,上級者から記譜情報の約 2 倍の演奏技法を抽出し,それらの使用方法や難しさについて知見を得ることができた.
著者
竹川 佳成 植村 あい子 奥村 健太 高道 慎之介 中村 友彦 平井 辰典 森尻 有貴 矢澤 櫻子
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-112, no.10, pp.1-6, 2016-07-23

「新博士によるパネルディスカッション」 は,音楽情報科学の研究に取り組んできた博士号を取得したばかりの方を集め,研究の紹介,博士課程進学の動機,博士課程在学中のドラマ,今後の抱負などについてパネル形式で議論する.本稿では,今回パネリストとして参加していただく 7 名の新博士を紹介する.
著者
辰巳 直也 森勢 将雅 片寄 晴弘
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2010-MUS-87, no.7, pp.1-6, 2010-10-07

Vocaloid 「初音ミク」 の発売以来,歌唱合成に対する注目が高まりつつある.Vocaloid では,メロディと歌詞を入力することにより,サンプリングされた人の声を元にした歌声を合成することができる.また,表情パラメタを調整することにより,様々な表情を付与することができる.しかし,より人間らしい表情豊かな歌声にするには,表情パラメタの調整を細かく設定することが必要なため,非常に煩雑で時間がかかる.本研究では,ロック歌手の一人 「GACKT」 の歌い方に見られるビブラートやポルタメントといった音高・(音量) 等の歌唱技法を低次のモデルパラメタで近似し,混合ガウス分布を用いた手法でモデルパラメタを決定する.それらの値を Vocaloid の出力に付加することで,ロック歌手らしい歌い方を実現する 「ロックボーカルレゾネータ」 を提案する.
著者
渡邉 彰吾 六沢 一昭
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-115, no.25, pp.1-5, 2017-06-10

本稿は,Perl プログラムから楽曲を作成するシステムについて述べる.プログラムを見た時に感じる印象を,聴いて楽しむことのできる楽曲という形で表現することがこのシステムの目標である.楽曲は,プログラムの 1 行を 1 小節として作成する.まず,プログラムを見た時の印象に影響する情報を解析し,各小節のコードを決定する.そして,コードをもとにメロディとリズム,それにハーモニーを作成する.
著者
宮本 春奈 塩田 さやか 貴家 仁志
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2019-MUS-123, no.28, pp.1-5, 2019-06-15

本論文では,x-vector に基づく話者照合システムにおいて帯域拡張法を用いて生成した広帯域音声によるデータ拡張に着目する.x-vector に基づく話者照合システムにおけるデータ拡張には,様々なノイズを加えるだけでなく,狭帯域音声をアップサンプリングしたデータ,またアップサンプリングしたデータと帯域拡張データとを混ぜ合わせて学習に用いるものがこれまでに報告されており,さらに DNN による帯域拡張を用いたデータ拡張についても報告されている.一方近年,帯域拡張法の一つとして非線形帯域拡張法 (N-BWE) が提案されている.N-BWE はモデル学習を行わず,計算量が非常に軽い手法として提案された.N-BWE は単純な非線形関数とフィルタのみで構成されているにも関わらず,話者照合の等価エラー率 (EER) と二乗平均平方根対数スペクトル歪みそれぞれにおいて高い性能を得られることが報告されている.そこで本論文では,x-vector に基づく話者照合システムを構築する際に,N-BWE を適用した音声を拡張データとして使用して実験を行った.実験結果より,アップサンプリングした音声と N-BWE で帯域拡張した音声を拡張データとして加えて学習を行った結果,アップサンプリングした音声のみを拡張データとして用いたシステムと比較して EER のエラー改善率は 24.5% を達成した.
著者
河原 英紀 榊原 健一 坂野 秀樹 森勢 将雅
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-121, no.1, pp.1-5, 2018-11-14

瞬時周波数と群遅延は,それぞれ位相の時間微分と周波数微分として定義されており,そのままでは,逆三角関数や位相の unwrap という脆弱で効率の悪い演算を必要としていた.Flanagan によって 1966 年に紹介された信号の瞬時周波数を求める式は,これらを必要とせず,群遅延の計算にも応用できることから広く用いられてきた.しかし,マルチメディア処理の普及により,最近の処理系では逆三角関数の計算を高速に実行することができるため,明示的に位相を経由することなく瞬時周波数と群遅延の計算を実装することができようになった.ここでは,サイドローブの減衰が急峻な余弦級数を時間領域の振幅包絡とする解析信号をインパルス応答とするフィルタを用いて有声音の音源を分析する方法を提案する.
著者
小口 純矢 嵯峨山 茂樹
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.29, pp.1-4, 2018-06-09

本論文は,波形生成モデルである複合ウェーブレットボコーダのさらなる品質の向上を目指す.これまでに我々は,音声分析合成や HMM 音声合成系において,複合ウェーブレットボコーダの安定性を示してきた.ここで,さらに WORLD や STRAIGHT で用いられている非周期性指標のような,音声の準周期性を取り入れることができれば,有声摩擦音やかすれ声のように周期成分と非周期成分の両方を持つ音声を表現でき,高品質な音声を合成できると期待される.本論文では,複合ウェーブレットの基本波形を完全な周期ではなく Jitter を付与した準周期的なパルス列によって駆動させることで実現した.また,主観評価実験により,改良後の音声が改良前の音声より品質が有意に高いことを示した.
著者
馬場 隆 橋田 光代 片寄 晴弘
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.49, pp.1-6, 2013-05-04

指揮システム"VirtualPhilharmony"は,実際にオーケストラを指揮する感覚に焦点を当てた指揮システムである.ヒューリスティックに構築されたオーケストラの演奏モデルを基に設計されたコンサートマスター機能や,本番前の練習期間をシミュレートしたリハーサルモードを実装することによって,オーケストラとプレイヤ(指揮者)とのインタラクションを実現し,これによりリアルな指揮感覚をプレイヤに提供する.従来の,単一のタイムラインによるスケジューラ管理を見直し,楽器ごと,声部ごとの複数タイムラインを導入する.また,指揮における左手の役割とシミュレートの方法を議論する.
著者
中野 允裕 ルルージョナトン 亀岡 弘和 中村 友彦 小野 順貴 嵯峨山 茂樹
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.6, pp.1-8, 2011-07-20

本報告では,音楽信号のような多重音を解析するための手法として,Bayesian nonparametrics に基づく音響信号スペクトログラムのモデル化方法を提案し,その構成法と推論について議論する.近年,非負値行列分解に代表されるようなスパース表現基づく音楽信号のモデル化が盛んに研究されている.その中で解決すべき二つの問題が注目を集めている.一つ目は楽器音が時間変化する多様なスペクトルを持つ点であり,もう一点は観測信号中に含まれる音源の数が一般的には未知なことである.さらに,楽器音の多様なスペクトルは音源数の推定を困難にし,また逆に音源数が未知であることによって一音一音がどの程度多様なスペクトルを持つか推定することを困難にしている.本報告では,これら二つの課題を同時に解消するために,信号の重畳を表す非負値行列分解型のスパース表現と時系列パターンを表現する隠れマルコフモデルを Bayesian nonparametrics 上で融合させたスペクトログラムモデルを提案する.This paper presents a Bayesian nonparametric latent source discovery method for music signal analysis. Recently, the use of latent variable decompositions, especially nonnegative matrix factorization (NMF), has been a very active area of research. These methods are facing two, mutually dependent, problems: first, instrument sounds often exhibit time-varying spectra, and grasping this time-varying nature is an important factor to characterize the diversity of each instrument; moreover, in many cases we do not know in advance the number of sources. Conventional decompositions generally fail to cope with these issues as they suffer from the difficulties of automatically determining the number of sources and automatically grouping spectra into single events. We address both these problems by developing a Bayesian nonparametric fusion of NMF and hidden Markov model (HMM).
著者
大浦圭一郎 間瀬 絢美 山田 知彦 徳田 恵一 後藤 真孝
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2010-MUS-86, no.1, pp.1-8, 2010-07-21

近年,コンピュータによる歌声合成が注目を集めている.中でも隠れマルコフモデル(hidden Markov model; HMM)に基づく歌声合成では,歌い手の特徴を歌声データと対応する楽譜から自動的に学習することができる.2009年12月,無料のオンラインサービス「HMM歌声合成システム: Sinsy」を開始した.ユーザーは楽譜をウェブサイトにアップロードすることで,任意の楽譜に対応した歌声を合成することができる.但し,Sinsyの歌声モデルには70曲で学習した特定話者モデルを用いており,新しい歌い手の歌声モデル追加の際の収録コストが高くなる問題があった.本稿ではSinsyのシステム構成について述べるとともに,話者適応手法により少量のデータから所望の歌い手の特徴を再現した歌声を合成することを検討する.
著者
大島千佳 中山功一 伊藤直樹 西本一志 安田清 細井尚人 奥村浩 堀川悦夫
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09135685)
巻号頁・発行日
vol.2013, no.1, pp.1-6, 2013-08-24

シンセサイザのボコーダの機能を利用し,発声をリアルタイムに長調や短調の音楽に変換することによる,気分の変化について調べた.音楽はさらに MusiCuddle というシステムを利用し,ユーザの発声と同じ音高から開始された.実験の結果,気分の変化に関して,短調と長調の和声フレーズの条件の間で,「陽気な」 「悲観した」 に差異が認められた.ここから,憂鬱な気分であっても,自分の発声が強制的に楽しい気分を誘う音楽に変換されると,気分が楽しくなることが示唆された.
著者
長嶋 洋一
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-118, no.11, pp.1-29, 2018-02-13

世界中で開発が進められている自動運転車は安全走行のため多種の搭載センサを外界に向けており,GPS を含むこのセンシング情報を生かして周囲の状況に反応する 「リアルタイム作曲システム」 として,運転の必要がない全ての搭乗者に快適で音楽著作権の不要な BGM をライヴ生成する自動作曲手法が求められている.英国 Forkswagen が 2013 年に発表した "Play the Road" は運転手目線のシステムでありやや目的が異なるが,その音楽スタイルの検討は重要な参考資料となった.ライブ生成の要素を除外するとしても,古今東西の音楽データを収集し深層学習させた AI が良質な音楽を自動生成するためには,教師データとして膨大な音楽嗜好感性ビッグデータを適用すればよいが,いまだに成功例が報告されていない.筆者は 2006 年に IPA 「未踏」 に採択され発表した "FMC3 (Free Music Clip for Creative Common)" において,音楽的ヒューリスティクスを重視した考え方を提案したが,豊田中央研究所に共同研究を依頼され開発した 2016 年版の車載用リアルタイム BGM 生成システムにおいて,この原則を発展させた.自動運転車が生成するセンサ情報と音楽音響的情報との関係を整理した上で,本稿ではこのリアルタイム BGM 生成システムの試作に関して,(1) BGM 進行のための音楽的な基本原理,(2) ループの繰り返しとリズム/ビートのスタイル,(3) センサ/マッピング / 音楽生成のブロック分割,(4) 音楽要素パラメータへの確率統計的な重み付け,(5) 調性とコードとスケールの構成,(6) 試作と実験の模様,などについて詳細に報告する.
著者
池田 輝政 菱田 隆彰
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011-MUS-91, no.10, pp.1-4, 2011-07-20

本研究では,コンテンツ内で 「劇伴」 として利用される楽曲を,素人が簡単に入手できるシステムを提案する.また,その実証として楽曲作成支援ソフトウェア 「Lazy Composer」 を開発した.
著者
大野将樹 岡村亮一 獅々堀正幹 沼尾雅之
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.35, pp.1-6, 2013-08-24

本稿では,音楽的・音響的に違和感の少ないメドレー曲を自動的に生成する手法を提案する.メドレー曲を構成する楽曲断片間の連結の妥当性に関する指標として,局所的接続と大局的接続がある.本研究では,局所的接続と大局的接続に対する個人の嗜好をシステムに反映することによって,違和感のないメドレーを生成する.7 段階評価による被験者実験により,パーソナライズを実施しなかった場合のメドレー曲は 3.74,提案手法は 5.02 のスコアが得られ,個人の嗜好を反映した提案手法の有効性が示された.
著者
堀 聡美
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.4, pp.1-4, 2009-11-28

フル CG アニメーション作品,もんちゃんのメイキングについて紹介を行う.This report introduce making and characters of animateion "mon-chan".
著者
横山 真男 八代 月光 植木 一也
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.41, pp.1-4, 2018-06-09

深層学習を用いて,演奏音からそのヴァイオリン製作者を当てる楽器識別および未知の楽器がどの製作者のヴァイオリンに近いか音色分析を行うプログラムを開発した.音響特徴量としてケプストラム法によるスペクトル包絡を深層学習の学習およびテストデータに用いた.ヴァイオリンは,ストラディバリをはじめとするオールドイタリアンの名器からモダン,国産の新作楽器まで 21 本で評価実験を行った.開放弦の演奏音を学習させたところおよそ 90% 以上の割合で識別ができ,楽曲の演奏音では約 60% 弱の正答率が得られた.また,未知の楽器が学習したどの楽器に類似しているかといった傾向分析についても試みた.
著者
才野 慶二郎 大浦 圭一郎 橘 誠 剣持 秀紀 徳田 恵一
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-94, no.7, pp.1-6, 2012-01-27

ラップのような短時間のうちに音高などの特徴が大きく変動するスタイルの歌い方は,それを適切に表現するための記譜法が確立されておらず,従来のように五線譜基づく合成の仕組みではユーザが直観的にそのスタイルの歌声を再現することが難しかった.本稿では,ラップスタイルの歌唱のための記譜法を定義し,それを用いて HMM 歌声合成の枠組みでラップスタイルの歌声合成を行った.その結果得られた合成音声はラップ特有のグリッサンド技法によるピッチ変動の現象を含むものになっていることが確認された.また,合成時に得られる対数基本周波数系列を素片接続型の歌声合成器に与えてラップスタイルの歌声を合成することも試みた.
著者
須田 仁志 深山 覚 中野 倫靖 齋藤 大輔 後藤 真孝
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-121, no.17, pp.1-6, 2018-11-14

本稿では,複数人が歌唱している楽曲に対して誰がいつ歌っているかを推定する歌唱者ダイアライゼーションの基礎的な検討を行う.とくに本稿ではグループアイドルソングのような複数の歌唱者が交互に歌ったり同時に歌ったりする楽曲を対象とする.本稿では伴奏音を除去した歌声を用いてアイドルソングのデータセットを構築した.またこれらの歌声に対して,歌唱者の音響モデルを未知とした手法と既知とした手法の 2 手法を用いて歌唱者ダイアライゼーションを行った.歌唱者の音響モデルを未知とした手法には,会話音声に対する話者ダイアライゼーションで広く用いられている修正ベイズ情報量規準を用いた手法を利用した.また音響モデルを既知とした手法では,i - vector を用いた話者認識を利用して短時間での歌唱者認識を繰り返し行うことで推定した.推定結果から,歌唱者の音響モデルの有無により大きな性能の差があること,また音響モデルが既知であっても短時間での歌唱者認識だけでなく適切な後処理によって推定誤りを減らせることが確認できた.