著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.35, pp.1-7, 2016-05-14

科学界は電波が聞こえないというパラダイムが支配している.しかしながら,マイクロ波は電波の一種であるが,矩形波のときに音として聞こえる現象が繰り返し報告されている.そこで,電波が聞こえないという旧来のパラダイムから電波が聞こえるという新たなパラダイムに転換することが求められる.このような視座に立脚して,パルス波形のマイクロ波が聴覚を刺激する現象について概説するとともに,気導,骨伝導及びマイクロ波聴覚効果を統一する理論的枠組みを提示する.
著者
辰巳 直也 森勢 将雅 片寄 晴弘
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-6, 2010-10-07

Vocaloid 「初音ミク」 の発売以来,歌唱合成に対する注目が高まりつつある.Vocaloid では,メロディと歌詞を入力することにより,サンプリングされた人の声を元にした歌声を合成することができる.また,表情パラメタを調整することにより,様々な表情を付与することができる.しかし,より人間らしい表情豊かな歌声にするには,表情パラメタの調整を細かく設定することが必要なため,非常に煩雑で時間がかかる.本研究では,ロック歌手の一人 「GACKT」 の歌い方に見られるビブラートやポルタメントといった音高・(音量) 等の歌唱技法を低次のモデルパラメタで近似し,混合ガウス分布を用いた手法でモデルパラメタを決定する.それらの値を Vocaloid の出力に付加することで,ロック歌手らしい歌い方を実現する 「ロックボーカルレゾネータ」 を提案する.Since the release of Vocaloid "Hatsune Miku", voice synthesizing applications have been known to the public people. Vocaloids generate human-like vocal melodies by giving lyrics and melodies. If the parameters for expression control are elaborated, Vocaloids yield more natural vocals. However, setting these parameters requires complicated expertise. This paper proposes a system called "Rock Vocal Resonator" that emphasizes Rock vocalist styles for Vocaloids, based on analysis of a Japanese Rock singer, GACKT's singing.
著者
西田 智 浜中 雅俊 平田 圭二 東条 敏
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.23, pp.1-7, 2010-07-21
参考文献数
6

本稿では,曲の雰囲気や特徴を変えずに,楽曲構造に基づきメロディ中に新たな音を追加して,メロディを生成する手法について述べる.本手法の特長は楽曲構造を利用したことであり,その結果,生成されたメロディは元のメロディの雰囲気を忠実に反映することができた.提案手法では,まず,メロディを音楽理論GTTMに基づき分析し,タイムスパン木を獲得する.次に,得られたタイムスパン木に,既存の曲のタイムスパン木を参考にして,新たな枝を追加することで,音数の増加した新たなメロディを生成する.実験の結果,簡約したメロディから楽曲構造に沿って具体的なメロディを生成できることを確認した.This paper presents a melody generation method which adds new notes to a given melody with its flavor and characteristics retained. The main advantage of our method is that musical structures are employed to keep the similar flavor of an original melody in a generated melody. First, we analyze an original melody based on music theory GTTM and acquire a corresponding time-span tree. Next, we add a new branch and a note, referring to the time-span tree of an original melody. As a result, we obtain a new melody in which a new note has been added. We conduct an experiment, which demonstartes that our method can generate an instantiated melody from a simple melody, unchanging its basic musical structure.
著者
阪上 大地
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.2, pp.1-13, 2018-06-09

本稿では音楽情報処理に深層学習を応用する方法を解説する.本稿は二部構成で,ニューラルネットの一般的な設計と学習方法を解説した後,音楽情報処理を含めた各種メディア処理への応用例を紹介する.前半ではパラメータの初期化方法など常識となってしまっている基本的な事柄,Dropout などのよく使われるテクニック,最先端でまだ整理が進んでいない研究成果を順番に解説する.後半では WaveNet や Encoder-Decoder モデルなど各分野の代表的な応用例を紹介し,和音認識 ・ ビートトラッキングなどに深層学習を応用した研究を紹介する.
著者
岩村 宏 安田 彰 岡村 淳一
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-115, no.24, pp.1-6, 2017-06-10

スピーカーの状態空間モデルを用いてボイスコイル電流 ・ ダイアフラム位置 ・ ダイアフラム速度等を推定し,その内部状態を考慮したフィードフォワード制御を行うことにより,スピーカーのインピーダンス,インダクタンス,フォース ・ ファクター,スティフネス,機械抵抗,可動部質量,キャビネット容量等を信号処理により仮想的にリアルタイムで変更できるシステムを開発した.制御はデジタル信号処理で行うため,各パラメータは独立して変更可能で,物理的には実現困難な特性も容易かつ安定に作り出すことができる.
著者
阿部ちひろ 伊藤彰則
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.3, pp.1-6, 2012-08-02

本稿では,Ngram 言語モデルをもとに歌詞候補文を生成する作詞補助システム 「patissier」 への実装を想定した,歌詞テキストの特徴分析結果を報告する.作詞においては,音韻やアクセントなど技巧的な側面の考慮とともに,楽曲のテーマや歌詞のストーリー設定も重要な要素である.より歌詞らしい候補の生成を目的として,コンテンツ投稿サイト 「ピアプロ」 に投稿された歌詞テキストを用い,一般に歌詞らしさと呼ばれる特徴の定量的検討を行った.また,CSJ (日本語話し言葉コーパス) や blog 記事との比較から,主に使用される単語の違いにより,歌詞とその他の文章は統計的に区別可能であることが示唆された.さらに,3 種類のモデルを用いた歌詞生成実験により,それぞれ異なった傾向を持つ文が生成されることが確かめられた.
著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.35, pp.1-8, 2018-06-09

マイクロ波聴覚効果とは矩形波のマイクロ波が聴覚を刺激する現象である.そこで,マイクロ波聴覚効果を応用したマイクロ波通信,即ち,テレパシー通信では,音声信号でパルス変調されたマイクロ波を搬送波として,受信者の頭部にビーム照射することにより,マイクロ波聴覚効果により頭部が音声信号を復調する.テレパシー通信では,ビーム幅が小さく,かつ,ビーム径が小さなマイクロ波ビームを形成することが求められる.そこで,マイクロ波のみを頭部に照射するのでなく,別途,レーザービームを頭部に照射して,大気中の気体分子をイオン化して,微量のプラズマをらせん状のビーム経路に生成する.すると,プラズマが導波管として作用して,マイクロ波がプラズマ導波管の内部をビームとなって直進し,特定の受信者のみが声を聴くことができる.
著者
寺島裕貴 岡田真人
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.43, pp.1-4, 2013-05-04

大脳皮質聴覚野が担う複雑な情報処理の原理解明に向け,皮質の一様性を根拠に視覚系相同領野のモデルが応用されつつある.しかし,既存研究で議論されてきたのは視覚野神経細胞のうち線形応答を示す単純細胞のモデルに限られており,非線形な複雑細胞に相当する概念については未着手だった.本研究で我々は,視覚野複雑細胞の学習モデルであるトポグラフィック独立成分分析を自然画像の代わりに自然音に適応させた.学習結果である聴覚版「複雑細胞」の特性は,近年聴覚野で発見されたピッチ細胞と同様に“missing fundamental”類似の非線形性を示した.聴覚野ピッチ細胞が視覚野複雑細胞と同一のモデルによる自然刺激学習で獲得可能であるという結果は,両者の計算論的相同性を示唆する.
著者
Bonada Jordi Blaauw Merlijn 才野 慶二郎 久湊 裕司
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.24, pp.1-6, 2013-08-24

音声,特に強め表現を伴う歌声においてはしばしば声帯振動に基本周期外の不規則な挙動が見られる.本稿ではこのような声質を持つ音声を再現するためのスペクトルモーフィングに基づいた音声合成手法について述べる.本手法は,ターゲットとなる声質を持った音声サンプルの励振源に相当する成分と,入力音声のスペクトル包絡を用いて合成を行うものである.まず,声質ターゲットサンプルに対し,その基本周波数を入力音声の基本周波数に合わせこむための時間領域リサンプリング処理を行う.その後,声質ターゲットサンプルのスペクトルの元々の包絡構造をなるべく復元するように,調波成分の再配置を行う.最後に,そこに入力音声の調波の振幅と位相を適用することで,入力音声の音色と声質ターゲットサンプルの声質を併せ持つ音声信号を得る.その音声信号と入力音声を任意の比率でモーフィングすることで,声質ターゲットサンプルの声質を任意の分量だけ持つ音声が合成可能となる.本稿では,グロウルの声質を持つ音声を使用した歌声合成および主観評価実験を行った.In this paper we introduce a morph-based approach for generating voice source aperiodicities frequently associated with strong vocal expressions, especially in singing. In our approach the excitation characteristics of one signal are combined with the fundamental frequency and spectral envelope characteristics of another signal. An exemplar sustained sample of the target voice quality is resampled in the time domain in order to generate a continuous signal matching the input voice's fundamental frequency. While we found the temporal scaling to be acceptable in many contexts, the frequency scaling has to be inverted in order to generate appropriate spectral content for the source excitation's entire bandwidth. Finally, the input signal's harmonic amplitudes and phases are applied to the transformed morph sample, allowing for a simple one-dimensional control of morph amount by linear interpolation with the input signal. The proposed system is evaluated and the results are discussed.
著者
才野 慶二郎 大浦 圭一郎 橘 誠 剣持 秀紀 徳田 恵一
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2012, no.7, pp.1-6, 2012-01-27

ラップのような短時間のうちに音高などの特徴が大きく変動するスタイルの歌い方は,それを適切に表現するための記譜法が確立されておらず,従来のように五線譜基づく合成の仕組みではユーザが直観的にそのスタイルの歌声を再現することが難しかった.本稿では,ラップスタイルの歌唱のための記譜法を定義し,それを用いて HMM 歌声合成の枠組みでラップスタイルの歌声合成を行った.その結果得られた合成音声はラップ特有のグリッサンド技法によるピッチ変動の現象を含むものになっていることが確認された.また,合成時に得られる対数基本周波数系列を素片接続型の歌声合成器に与えてラップスタイルの歌声を合成することも試みた.This paper addresses rap-style singing voice synthesis. Since it has not been very clear how to write a musical score for rap-style songs, existing singing voice synthesis systems based on musical scores are not suitable for synthesizing them with an intuitive input. Here a new type of musical score specialized for a rap-style is defined. An HMM-based singing voice synthesis system is used to realize an automatic synthesis of realistic rap-style singing. Glissando phenomenon which is special for the style could be found in synthesis results. It was also tried to apply pitch parameters generated from the HMMs to a sample-concatenation-based singing voice synthesis system.
著者
剣持秀紀
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.26, pp.1-1, 2013-08-24

歌声合成技術は楽曲制作に幅広く用いられるようになってきている.また特に若い層を中心に,そのような楽曲 (いわゆる 「ボカロ曲」 ) を愛聴する人々も多い.なぜ人間の歌声でなく,合成された歌声が使われ,聴かれるのかについて考えてみたい.併せて歌声合成技術 VOCALOID の現在の仕組み (システム) について解説し,その将来の展開について述べる.
著者
森勢 将雅 山下 洋一
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.4, pp.1-6, 2012-08-02
被引用文献数
2

スマートフォン等のマイクロフォンを備えた携帯端末は,携帯電話としての機能だけではなく,音楽再生,音収録等様々な機能をユーザに提供しつつある.本研究では,スマートフォンを用いた音楽試聴スタイルの 1 つとして,タイトルやアーティスト等の情報,および歌詞が音楽に同期して表示される音楽試聴システムの実現に取り組む.本システムを実現するため,音楽に知覚的な影響を与えず情報を埋め込み,埋め込まれた情報をリアルタイムで抽出する技術を提案する.知覚に影響せず情報を埋め込むための技術として電子透かしが一般的に用いられるが,雑音に対する頑健性や通信速度の問題があり,実時間での情報伝達手段に用いることは困難であった.本研究では,モスキート音の考え方に基づくシンプルな方法を提案することで,目的とするシステムへの要求を満たす技術の確立を目指す.本稿では,モスキート音を用いた電子透かしの概要,および情報を埋め込むための仕様について説明する.次いでスマートフォン上に実装されたプロトタイプシステム,およびいくつかの音楽を用いた動作確認テストにより本システムの有効性について議論する.Smartphone that has a microphone has been used as a good tool for dairy life, and we can easily record a sound. In this research, a lyric-synchronized music listening system with smartphone is introduced to provide users with a new music listening style. The system can display the information such as title, lyric, and so on, extracted from the recorded music. The information is hidden in the music signal to avoid deteriorating the sound quality. Digital watermarking is one of the technology to hide the information, and several watermarking technologies for audio signal have been proposed. However, it was difficult for them to realize the good noise tolerance and transmission performance. In this paper, we focus on the mosquito sound to develop the digital watermarking to solve these problems. This paper shows the method to hide the information and the specification about the transmission of the information. The implemented system is introduced and tested in a real environment, and its effectiveness is also discussed.
著者
中野倫靖 吉井和佳 後藤真孝
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.23, pp.1-7, 2013-08-24

本稿では、複数の歌声から得られる音響特徴量をトピックモデルによって分析することで、歌声の特性を説明する新しい手法を提案する。従来、歌手の特性 (性別や声種等)、歌い方の特性 (声区やF0軌跡のモデル化等)、聴取印象 (明るさ等)、楽曲の特性 (楽曲ジャンルや歌詞等) を分析・推定したりする研究はあったが、複数の歌声から分かるような潜在的な意味を分析する研究はなかった。本稿では、伴奏と歌声を含む音楽音響信号から、歌声の線形予測メルケプストラム係数 (LPMCC) と ΔF0 を特徴量として自動推定した後、潜在的ディリクレ配分法 (LDA) で分析を行う。LDA によって得られた潜在意味 (トピック) の混合比が歌手名同定にも適用可能であることを示し、声道長の正規化に相当する処理を導入することで、性別を超えた類似歌手検索を実現することも示す。また、トピックの混合比を用いて、各トピックにおいて支配的な曲の歌手名をタグクラウドのように提示することで、トピックや歌声の意味を可視化する方法を提案する。
著者
濱崎 雅弘 武田 英明 西村 拓一
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.11, pp.1-6, 2009-05-14
参考文献数
10
被引用文献数
1

本研究では,Web を介して多くの人が集い,創発的・協調的に行われる創造活動の分析を行う.ニコニコ動画は国内でもっとも人気の動画共有サイトであるが,投稿された動画の多くに協調的な創作活動が見られる.特に初音ミクという合成音声ソフトウェアを用いた動画は,作詞作曲をする人たちだけでなく,絵を描く人やビデオ編集をする人たちなど,異なるタイプの作者が参加することで新たなコンテンツが作り出されている.本論文では,そのような異なるタイプの作者が互いに影響を受けながら新しいコンテンツを作っていく様子のネットワーク分析を用いて解析する.The Web technology enables numerous people to collaborate in creation. We designate it as massively collaborative creation via the Web. As an example of massively collaborative creation, we particularly examine video development on Nico Nico Douga, which is a video sharing website that is popular in Japan. We specifically examine videos on Hatsune Miku, a version of a singing synthesizer application software that has inspired not only song creation but also songwriting, illustration, and video editing. As described herein, creators of interact to create new contents though their social network. In this paper, we analyzed the process of developing thousands of videos based on creators' social networks.
著者
山岸 祐己 斉藤 和巳
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.2, pp.1-6, 2012-08-02

動画共有サービスに投稿されている楽曲動画の評価法を提案する.一般に,楽曲動画は再生数等の絶対数の推移を用いてランキングされるため,上位にランクインするのは楽曲動画集合のうちの僅かな上澄みであることが多い.これに対し,動画情報に統計的な正規化を施してランキングを行うことにより,全ての楽曲動画を平等な評価基準にかけることを試みる.さらに,動画に対して外的に与えられた情報のみで動画同士の歪み距離を計算し,類似した楽曲動画を探索する手法も提案する.提案法は,いずれも動画共有サービスの特性を上手く利用していることを示す.We propose evaluation methods for VOCALOID music videos which are posted in Nico Nico Douga. Generally, music videos are ranked by transition of the absolute numbers of playbacks and comments. However, the top rankers obtained by this conventional ranking method are limited to a part of the music videos with hot topics. In contrast, we tried to apply all the music videos to equal valuation standards by new ranking methods which uses statistical normalization. Furthermore, we also propose a new technique for searching similar music videos by calculating the distortion distance of video information given externally. We show each proposing methods can make use of the characteristics of video hosting service well.
著者
佐々木渉
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.29, pp.1-1, 2013-08-24

Vocaloid3 版リリースと,それ以降も視野に入りつつある 「今の初音ミク」 が目指す方向性を 「初音ミクが増えている」 というテーマで掘り下げていきます.V3 ミクのコンセプトの説明や,歌声データベースが増えるということ,歌う曲が増えるということ,作家が増えること,ネットやメディアでの露出量が増えるということ.それぞれ 「増え続けた事」 に着目し,増えたことにより何が起こったのか?について考える他,その解釈 / 分析や,現場からの反省から今後どういった初音ミクの可能性があるのか考えてみたいと思います.
著者
今井 慎太郎
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.6, pp.1-3, 2009-11-28

アコースティック楽器とリアルタイム・デジタル音声信号処理技術を組み合わせたインタラクティブ・コンピュータ音楽の日本における先鞭をつけた 「音楽デザイン学科」 創設から 18 年が経過し,国立音楽大学のコンピュータ音楽スタジオやソフトウェア環境もずいぶんと様変わりした.ここに近年の活動をスタジオ・レポートというかたちで総括したい.18 yea rs pa ssed since the foundat ion of the Sonolog y Depa r tment of Kunitachi College of Music where took the initiative on interactive computer music in Japan. And the computer systems, softwares and audio equipments in the studio have been variously modified. Here I would like to report our recent activities.
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.60, pp.1-6, 2015-05-16

本研究では提案法を用いて通常歌唱音声にグロウル系歌唱の特徴を付与した際の印象を評価した.これまでの研究よりグロウル系歌唱音声特有の物理的特徴として 「1k~4kHz の帯域強調」,「基本周波数の振動」 及び,「スペクトル形状の高速な時間変動」 が確認された.従来法である 「スペクトル形状の高速な変動」 を付与したモデルは,観察された現象を表面的に模擬するために 4 個のガウス関数を組み合わせたものであり,声質の表現や発声の機構を考慮したものでは無かった.本研究では 「スペクトル形状の高速な時間変動」 を披裂喉頭蓋の形状変化と声帯音源波形の時間変化の相互作用としてモデル化することで,グロウル系歌唱音声の特徴を付与する手法をこれまでに提案した.本稿では,従来法と提案法を変換後の歌唱音声の一対比較実験により評価した.結果をサーストンの一対比較法により分析した結果,提案法がグロウル系歌唱音声の印象を付与するのに効果的であることが示唆された.
著者
伊藤博之
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.27, pp.1-1, 2013-08-24

当社では毎日多くの問い合わせを海外から受けます.地域は北米から中南米,それにアジア諸国が中心.問い合わせ内容はコンサートやイベントへのお誘いからファンレターまで様々です.初音ミクをコアとしたボカロムーブメントは確実に世界に拡がっており,それに応える形で当社は初音ミク英語版を遂にリリース致します.本講演では,世界から届くファンからの声や実際に参加した海外でのイベントを通じて見聞きした事をご紹介するとともに,海外展開における課題をお話しいたします.
著者
蓮井 洋志
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.11, pp.1-7, 2010-11-27

本研究では、作曲モデルにメロディー内のユーザの好みの偏りを学習する方法を導入し、それを用いて対話型選択集団山登り法を利用した対話型作曲支援システム rank-c-Sonneteer2 を実現する。本手法は、評価のランクによって親を選択する集団山登り法である。Rank-c-Sonneteer2 は、対話、親の入れ換え、選択、学習と生成をくり返す。まず、対話において、ユーザが、入力のメロディーを改善、評価する。評価では各音符ごとに 4 段階評価する。親の入れ換えにおいて、評価値が親よりも高ければ、前の親と入れ換えて、親ベースに登録する。選択において、システムは評価のランクに親を選ぶ。学習と生成において、作曲モデルがシステムに選ばれた親を 11 回学習し、親ベースの他の親を 1 回学習し、その学習情報をもとに近傍解、つまり子を生成する。この 4 つのプロセスを好みのメロディーを作曲するまで繰り返す。モデルは学習データをもとにメロディーを生成するが、ランダムウォークで生成するために好みの部分を持たないメロディーを作曲してしまう場合がある。モデルが音符ごとの 4 段階の評価に対して好みの部分の音符の重みを大きくして学習すれば、よりユーザの好みを反映した近傍解を生成できる。本論文では、このモデルを実現したシステムとそのシステムを使って作曲したメロディーについて述べる。In this study, I implemented the computer aided composition system, rank-c-Sonneteer2, with the interactive selective population climbing, where the composing model introduced on learning the favorite bias of the user's evaluation. This method is population climbing which selects the parent with respect of the rank of its evaluation value. Rank-c-Sonneteer2 repeats the interaction, the exchanging the parent, the selection, and the learning and generating until the user gets the favorite melody. First, in the interaction, the user improves the inputted 10 melodies into more favorite melodies, and evaluates the improved melodies. The evaluation method is that the user evaluates 4 level of every note in these melodies. In the exchanging the parent, the system exchanges the offspring higher evaluation value with the parent, and enters into the parent base. In the selection, the system selects 10 parents with respect of the rank. In the learning and generating, the composing model learns the selected melodies 11 times and the other parents in the parent base once, and generates the melody, the offspring near the parent, with randomwalk. Although the model generates the melody based on learning information, it sometimes generates a melody which does not have favoroite part, because of generating with randomwalk. If can learn the favorite bias, the model can generate neighbours which are more reflected on the user's favor. In this paper, we described about the implementation of rank-c-Sonneteer2 with this composing model and the composed melodies with the system.