著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.35, pp.1-7, 2016-05-14

科学界は電波が聞こえないというパラダイムが支配している.しかしながら,マイクロ波は電波の一種であるが,矩形波のときに音として聞こえる現象が繰り返し報告されている.そこで,電波が聞こえないという旧来のパラダイムから電波が聞こえるという新たなパラダイムに転換することが求められる.このような視座に立脚して,パルス波形のマイクロ波が聴覚を刺激する現象について概説するとともに,気導,骨伝導及びマイクロ波聴覚効果を統一する理論的枠組みを提示する.
著者
辰巳 直也 森勢 将雅 片寄 晴弘
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-6, 2010-10-07

Vocaloid 「初音ミク」 の発売以来,歌唱合成に対する注目が高まりつつある.Vocaloid では,メロディと歌詞を入力することにより,サンプリングされた人の声を元にした歌声を合成することができる.また,表情パラメタを調整することにより,様々な表情を付与することができる.しかし,より人間らしい表情豊かな歌声にするには,表情パラメタの調整を細かく設定することが必要なため,非常に煩雑で時間がかかる.本研究では,ロック歌手の一人 「GACKT」 の歌い方に見られるビブラートやポルタメントといった音高・(音量) 等の歌唱技法を低次のモデルパラメタで近似し,混合ガウス分布を用いた手法でモデルパラメタを決定する.それらの値を Vocaloid の出力に付加することで,ロック歌手らしい歌い方を実現する 「ロックボーカルレゾネータ」 を提案する.Since the release of Vocaloid "Hatsune Miku", voice synthesizing applications have been known to the public people. Vocaloids generate human-like vocal melodies by giving lyrics and melodies. If the parameters for expression control are elaborated, Vocaloids yield more natural vocals. However, setting these parameters requires complicated expertise. This paper proposes a system called "Rock Vocal Resonator" that emphasizes Rock vocalist styles for Vocaloids, based on analysis of a Japanese Rock singer, GACKT's singing.
著者
西田 智 浜中 雅俊 平田 圭二 東条 敏
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.23, pp.1-7, 2010-07-21
参考文献数
6

本稿では,曲の雰囲気や特徴を変えずに,楽曲構造に基づきメロディ中に新たな音を追加して,メロディを生成する手法について述べる.本手法の特長は楽曲構造を利用したことであり,その結果,生成されたメロディは元のメロディの雰囲気を忠実に反映することができた.提案手法では,まず,メロディを音楽理論GTTMに基づき分析し,タイムスパン木を獲得する.次に,得られたタイムスパン木に,既存の曲のタイムスパン木を参考にして,新たな枝を追加することで,音数の増加した新たなメロディを生成する.実験の結果,簡約したメロディから楽曲構造に沿って具体的なメロディを生成できることを確認した.This paper presents a melody generation method which adds new notes to a given melody with its flavor and characteristics retained. The main advantage of our method is that musical structures are employed to keep the similar flavor of an original melody in a generated melody. First, we analyze an original melody based on music theory GTTM and acquire a corresponding time-span tree. Next, we add a new branch and a note, referring to the time-span tree of an original melody. As a result, we obtain a new melody in which a new note has been added. We conduct an experiment, which demonstartes that our method can generate an instantiated melody from a simple melody, unchanging its basic musical structure.
著者
阪上 大地
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.2, pp.1-13, 2018-06-09

本稿では音楽情報処理に深層学習を応用する方法を解説する.本稿は二部構成で,ニューラルネットの一般的な設計と学習方法を解説した後,音楽情報処理を含めた各種メディア処理への応用例を紹介する.前半ではパラメータの初期化方法など常識となってしまっている基本的な事柄,Dropout などのよく使われるテクニック,最先端でまだ整理が進んでいない研究成果を順番に解説する.後半では WaveNet や Encoder-Decoder モデルなど各分野の代表的な応用例を紹介し,和音認識 ・ ビートトラッキングなどに深層学習を応用した研究を紹介する.
著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.35, pp.1-8, 2018-06-09

マイクロ波聴覚効果とは矩形波のマイクロ波が聴覚を刺激する現象である.そこで,マイクロ波聴覚効果を応用したマイクロ波通信,即ち,テレパシー通信では,音声信号でパルス変調されたマイクロ波を搬送波として,受信者の頭部にビーム照射することにより,マイクロ波聴覚効果により頭部が音声信号を復調する.テレパシー通信では,ビーム幅が小さく,かつ,ビーム径が小さなマイクロ波ビームを形成することが求められる.そこで,マイクロ波のみを頭部に照射するのでなく,別途,レーザービームを頭部に照射して,大気中の気体分子をイオン化して,微量のプラズマをらせん状のビーム経路に生成する.すると,プラズマが導波管として作用して,マイクロ波がプラズマ導波管の内部をビームとなって直進し,特定の受信者のみが声を聴くことができる.
著者
岩村 宏 安田 彰 岡村 淳一
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-115, no.24, pp.1-6, 2017-06-10

スピーカーの状態空間モデルを用いてボイスコイル電流 ・ ダイアフラム位置 ・ ダイアフラム速度等を推定し,その内部状態を考慮したフィードフォワード制御を行うことにより,スピーカーのインピーダンス,インダクタンス,フォース ・ ファクター,スティフネス,機械抵抗,可動部質量,キャビネット容量等を信号処理により仮想的にリアルタイムで変更できるシステムを開発した.制御はデジタル信号処理で行うため,各パラメータは独立して変更可能で,物理的には実現困難な特性も容易かつ安定に作り出すことができる.
著者
阿部ちひろ 伊藤彰則
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.3, pp.1-6, 2012-08-02

本稿では,Ngram 言語モデルをもとに歌詞候補文を生成する作詞補助システム 「patissier」 への実装を想定した,歌詞テキストの特徴分析結果を報告する.作詞においては,音韻やアクセントなど技巧的な側面の考慮とともに,楽曲のテーマや歌詞のストーリー設定も重要な要素である.より歌詞らしい候補の生成を目的として,コンテンツ投稿サイト 「ピアプロ」 に投稿された歌詞テキストを用い,一般に歌詞らしさと呼ばれる特徴の定量的検討を行った.また,CSJ (日本語話し言葉コーパス) や blog 記事との比較から,主に使用される単語の違いにより,歌詞とその他の文章は統計的に区別可能であることが示唆された.さらに,3 種類のモデルを用いた歌詞生成実験により,それぞれ異なった傾向を持つ文が生成されることが確かめられた.
著者
寺島裕貴 岡田真人
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.43, pp.1-4, 2013-05-04

大脳皮質聴覚野が担う複雑な情報処理の原理解明に向け,皮質の一様性を根拠に視覚系相同領野のモデルが応用されつつある.しかし,既存研究で議論されてきたのは視覚野神経細胞のうち線形応答を示す単純細胞のモデルに限られており,非線形な複雑細胞に相当する概念については未着手だった.本研究で我々は,視覚野複雑細胞の学習モデルであるトポグラフィック独立成分分析を自然画像の代わりに自然音に適応させた.学習結果である聴覚版「複雑細胞」の特性は,近年聴覚野で発見されたピッチ細胞と同様に“missing fundamental”類似の非線形性を示した.聴覚野ピッチ細胞が視覚野複雑細胞と同一のモデルによる自然刺激学習で獲得可能であるという結果は,両者の計算論的相同性を示唆する.
著者
Bonada Jordi Blaauw Merlijn 才野 慶二郎 久湊 裕司
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.24, pp.1-6, 2013-08-24

音声,特に強め表現を伴う歌声においてはしばしば声帯振動に基本周期外の不規則な挙動が見られる.本稿ではこのような声質を持つ音声を再現するためのスペクトルモーフィングに基づいた音声合成手法について述べる.本手法は,ターゲットとなる声質を持った音声サンプルの励振源に相当する成分と,入力音声のスペクトル包絡を用いて合成を行うものである.まず,声質ターゲットサンプルに対し,その基本周波数を入力音声の基本周波数に合わせこむための時間領域リサンプリング処理を行う.その後,声質ターゲットサンプルのスペクトルの元々の包絡構造をなるべく復元するように,調波成分の再配置を行う.最後に,そこに入力音声の調波の振幅と位相を適用することで,入力音声の音色と声質ターゲットサンプルの声質を併せ持つ音声信号を得る.その音声信号と入力音声を任意の比率でモーフィングすることで,声質ターゲットサンプルの声質を任意の分量だけ持つ音声が合成可能となる.本稿では,グロウルの声質を持つ音声を使用した歌声合成および主観評価実験を行った.In this paper we introduce a morph-based approach for generating voice source aperiodicities frequently associated with strong vocal expressions, especially in singing. In our approach the excitation characteristics of one signal are combined with the fundamental frequency and spectral envelope characteristics of another signal. An exemplar sustained sample of the target voice quality is resampled in the time domain in order to generate a continuous signal matching the input voice's fundamental frequency. While we found the temporal scaling to be acceptable in many contexts, the frequency scaling has to be inverted in order to generate appropriate spectral content for the source excitation's entire bandwidth. Finally, the input signal's harmonic amplitudes and phases are applied to the transformed morph sample, allowing for a simple one-dimensional control of morph amount by linear interpolation with the input signal. The proposed system is evaluated and the results are discussed.
著者
才野 慶二郎 大浦 圭一郎 橘 誠 剣持 秀紀 徳田 恵一
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2012, no.7, pp.1-6, 2012-01-27

ラップのような短時間のうちに音高などの特徴が大きく変動するスタイルの歌い方は,それを適切に表現するための記譜法が確立されておらず,従来のように五線譜基づく合成の仕組みではユーザが直観的にそのスタイルの歌声を再現することが難しかった.本稿では,ラップスタイルの歌唱のための記譜法を定義し,それを用いて HMM 歌声合成の枠組みでラップスタイルの歌声合成を行った.その結果得られた合成音声はラップ特有のグリッサンド技法によるピッチ変動の現象を含むものになっていることが確認された.また,合成時に得られる対数基本周波数系列を素片接続型の歌声合成器に与えてラップスタイルの歌声を合成することも試みた.This paper addresses rap-style singing voice synthesis. Since it has not been very clear how to write a musical score for rap-style songs, existing singing voice synthesis systems based on musical scores are not suitable for synthesizing them with an intuitive input. Here a new type of musical score specialized for a rap-style is defined. An HMM-based singing voice synthesis system is used to realize an automatic synthesis of realistic rap-style singing. Glissando phenomenon which is special for the style could be found in synthesis results. It was also tried to apply pitch parameters generated from the HMMs to a sample-concatenation-based singing voice synthesis system.
著者
剣持秀紀
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.26, pp.1-1, 2013-08-24

歌声合成技術は楽曲制作に幅広く用いられるようになってきている.また特に若い層を中心に,そのような楽曲 (いわゆる 「ボカロ曲」 ) を愛聴する人々も多い.なぜ人間の歌声でなく,合成された歌声が使われ,聴かれるのかについて考えてみたい.併せて歌声合成技術 VOCALOID の現在の仕組み (システム) について解説し,その将来の展開について述べる.
著者
森勢 将雅 山下 洋一
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.4, pp.1-6, 2012-08-02
被引用文献数
2

スマートフォン等のマイクロフォンを備えた携帯端末は,携帯電話としての機能だけではなく,音楽再生,音収録等様々な機能をユーザに提供しつつある.本研究では,スマートフォンを用いた音楽試聴スタイルの 1 つとして,タイトルやアーティスト等の情報,および歌詞が音楽に同期して表示される音楽試聴システムの実現に取り組む.本システムを実現するため,音楽に知覚的な影響を与えず情報を埋め込み,埋め込まれた情報をリアルタイムで抽出する技術を提案する.知覚に影響せず情報を埋め込むための技術として電子透かしが一般的に用いられるが,雑音に対する頑健性や通信速度の問題があり,実時間での情報伝達手段に用いることは困難であった.本研究では,モスキート音の考え方に基づくシンプルな方法を提案することで,目的とするシステムへの要求を満たす技術の確立を目指す.本稿では,モスキート音を用いた電子透かしの概要,および情報を埋め込むための仕様について説明する.次いでスマートフォン上に実装されたプロトタイプシステム,およびいくつかの音楽を用いた動作確認テストにより本システムの有効性について議論する.Smartphone that has a microphone has been used as a good tool for dairy life, and we can easily record a sound. In this research, a lyric-synchronized music listening system with smartphone is introduced to provide users with a new music listening style. The system can display the information such as title, lyric, and so on, extracted from the recorded music. The information is hidden in the music signal to avoid deteriorating the sound quality. Digital watermarking is one of the technology to hide the information, and several watermarking technologies for audio signal have been proposed. However, it was difficult for them to realize the good noise tolerance and transmission performance. In this paper, we focus on the mosquito sound to develop the digital watermarking to solve these problems. This paper shows the method to hide the information and the specification about the transmission of the information. The implemented system is introduced and tested in a real environment, and its effectiveness is also discussed.
著者
中野倫靖 吉井和佳 後藤真孝
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.23, pp.1-7, 2013-08-24

本稿では、複数の歌声から得られる音響特徴量をトピックモデルによって分析することで、歌声の特性を説明する新しい手法を提案する。従来、歌手の特性 (性別や声種等)、歌い方の特性 (声区やF0軌跡のモデル化等)、聴取印象 (明るさ等)、楽曲の特性 (楽曲ジャンルや歌詞等) を分析・推定したりする研究はあったが、複数の歌声から分かるような潜在的な意味を分析する研究はなかった。本稿では、伴奏と歌声を含む音楽音響信号から、歌声の線形予測メルケプストラム係数 (LPMCC) と ΔF0 を特徴量として自動推定した後、潜在的ディリクレ配分法 (LDA) で分析を行う。LDA によって得られた潜在意味 (トピック) の混合比が歌手名同定にも適用可能であることを示し、声道長の正規化に相当する処理を導入することで、性別を超えた類似歌手検索を実現することも示す。また、トピックの混合比を用いて、各トピックにおいて支配的な曲の歌手名をタグクラウドのように提示することで、トピックや歌声の意味を可視化する方法を提案する。
著者
濱崎 雅弘 武田 英明 西村 拓一
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.11, pp.1-6, 2009-05-14
参考文献数
10
被引用文献数
1

本研究では,Web を介して多くの人が集い,創発的・協調的に行われる創造活動の分析を行う.ニコニコ動画は国内でもっとも人気の動画共有サイトであるが,投稿された動画の多くに協調的な創作活動が見られる.特に初音ミクという合成音声ソフトウェアを用いた動画は,作詞作曲をする人たちだけでなく,絵を描く人やビデオ編集をする人たちなど,異なるタイプの作者が参加することで新たなコンテンツが作り出されている.本論文では,そのような異なるタイプの作者が互いに影響を受けながら新しいコンテンツを作っていく様子のネットワーク分析を用いて解析する.The Web technology enables numerous people to collaborate in creation. We designate it as massively collaborative creation via the Web. As an example of massively collaborative creation, we particularly examine video development on Nico Nico Douga, which is a video sharing website that is popular in Japan. We specifically examine videos on Hatsune Miku, a version of a singing synthesizer application software that has inspired not only song creation but also songwriting, illustration, and video editing. As described herein, creators of interact to create new contents though their social network. In this paper, we analyzed the process of developing thousands of videos based on creators' social networks.
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.60, pp.1-6, 2015-05-16

本研究では提案法を用いて通常歌唱音声にグロウル系歌唱の特徴を付与した際の印象を評価した.これまでの研究よりグロウル系歌唱音声特有の物理的特徴として 「1k~4kHz の帯域強調」,「基本周波数の振動」 及び,「スペクトル形状の高速な時間変動」 が確認された.従来法である 「スペクトル形状の高速な変動」 を付与したモデルは,観察された現象を表面的に模擬するために 4 個のガウス関数を組み合わせたものであり,声質の表現や発声の機構を考慮したものでは無かった.本研究では 「スペクトル形状の高速な時間変動」 を披裂喉頭蓋の形状変化と声帯音源波形の時間変化の相互作用としてモデル化することで,グロウル系歌唱音声の特徴を付与する手法をこれまでに提案した.本稿では,従来法と提案法を変換後の歌唱音声の一対比較実験により評価した.結果をサーストンの一対比較法により分析した結果,提案法がグロウル系歌唱音声の印象を付与するのに効果的であることが示唆された.
著者
古市 朝美 白木 善尚
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.59, pp.1-6, 2013-05-04

今日,楽曲製作に用いられる音源の多くは,楽器音の波形をサンプリングしたPCM音源が使われている.一方,偏微分方程式を用いて楽器の音響特性を表現し,その偏微分方程式の解に基づく物理モデル音源も実用化されている.物理モデル音源は音高,音色,音程などの操作が容易であり,音の立ちあがりや連続した音の生成等,PCM音源と比べて自然な楽器音作りが可能である.本報告では,代表的な撥弦楽器であるギター音の生成法,特にグリッサンド音の物理モデル音源の生成法を提案する.更に生成した音源の聴取実験を通して,提案した方法の妥当性の検証を行う.
著者
山岸 祐己 斉藤 和巳
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.2, pp.1-6, 2012-08-02

動画共有サービスに投稿されている楽曲動画の評価法を提案する.一般に,楽曲動画は再生数等の絶対数の推移を用いてランキングされるため,上位にランクインするのは楽曲動画集合のうちの僅かな上澄みであることが多い.これに対し,動画情報に統計的な正規化を施してランキングを行うことにより,全ての楽曲動画を平等な評価基準にかけることを試みる.さらに,動画に対して外的に与えられた情報のみで動画同士の歪み距離を計算し,類似した楽曲動画を探索する手法も提案する.提案法は,いずれも動画共有サービスの特性を上手く利用していることを示す.We propose evaluation methods for VOCALOID music videos which are posted in Nico Nico Douga. Generally, music videos are ranked by transition of the absolute numbers of playbacks and comments. However, the top rankers obtained by this conventional ranking method are limited to a part of the music videos with hot topics. In contrast, we tried to apply all the music videos to equal valuation standards by new ranking methods which uses statistical normalization. Furthermore, we also propose a new technique for searching similar music videos by calculating the distortion distance of video information given externally. We show each proposing methods can make use of the characteristics of video hosting service well.
著者
佐々木渉
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.29, pp.1-1, 2013-08-24

Vocaloid3 版リリースと,それ以降も視野に入りつつある 「今の初音ミク」 が目指す方向性を 「初音ミクが増えている」 というテーマで掘り下げていきます.V3 ミクのコンセプトの説明や,歌声データベースが増えるということ,歌う曲が増えるということ,作家が増えること,ネットやメディアでの露出量が増えるということ.それぞれ 「増え続けた事」 に着目し,増えたことにより何が起こったのか?について考える他,その解釈 / 分析や,現場からの反省から今後どういった初音ミクの可能性があるのか考えてみたいと思います.
著者
繁松 佑哉 河瀬 彰宏
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2020-MUS-126, no.2, pp.1-6, 2020-02-10

本研究は,ヒューマンビートボックス世界大会の予選通過者と敗退者の演奏における楽器と楽曲構成を統計的に比較し,通過者の特徴を明らかにした.通過者と敗退者は共にダンス・ミュージックに見られる同一打楽器音の連続パターンを使用しているものの,通過者は楽器音の構成のなかにベースとメロディの両方を含むパターンを多用する傾向があることが分かった.その一方で,敗退者はベースを含んだパターンのみを多用していることが分かった.また,両者には,基礎打楽器音のハイハットとKスネアの使用傾向に特徴的な差異が見られた.楽曲の構成については,通過者も敗退者も近年のEDMに類似した構成をとることが確認できたが,通過者は音楽性を意識したビートを構成し,敗退者は重低音とオリジナルサウンドを多用していることから,スキル重視のビートを構成する傾向があることが明らかになった.
著者
渡辺謙 大石悠貴 柏野牧夫
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.57, pp.1-4, 2013-05-04

これまで、多くの研究で音楽が人間に与える影響が調べられ、自律神経活動や呼吸が計測されてきた.しかし、音楽の各パラメータがどのように影響を与えるかはまだわかっていない.そこで、本研究では音のパラメータの中でもテンポに着目し、音のテンポと呼吸数の組み合わせが自律神経系に与える影響について調べた.本研究では、二つの実験を行い、それぞれ18名の健常者が参加した.実験条件として、音のテンポは60BPM,80BPM、呼吸数は15CPM,20CPMの全組み合わせ4条件で各5分間の実験を行った.音刺激は、単純なドラム音を用いて、呼吸はメトロノームを用いて統制した.実験中に、心電図と呼吸を計測し、自律神経活動の指標として平均心拍数と心拍の変動成分を解析した.結果として、20CPMで呼吸をしながら、80BPMのテンポの音を聴く条件のみで、交感神経活動が増加し、平均心拍数の増加が見られた.他の条件では平均心拍数の変化は見られなかった.本研究から、交感神経活動の顕著な増加には、交感神経中枢であるRVLMの一定以上の発火率と、音と呼吸リズムの同期という二つの条件が必要な可能性が示唆された.結論として、音楽が生体の交感神経活動に影響を与えるには、音楽のテンポと呼吸数の組み合わせが重要な要因になると考えられる.