著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.35, pp.1-7, 2016-05-14

科学界は電波が聞こえないというパラダイムが支配している.しかしながら,マイクロ波は電波の一種であるが,矩形波のときに音として聞こえる現象が繰り返し報告されている.そこで,電波が聞こえないという旧来のパラダイムから電波が聞こえるという新たなパラダイムに転換することが求められる.このような視座に立脚して,パルス波形のマイクロ波が聴覚を刺激する現象について概説するとともに,気導,骨伝導及びマイクロ波聴覚効果を統一する理論的枠組みを提示する.
著者
牧 勝弘
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.13, pp.1-6, 2016-05-14

コンサートホールの例からも分かるように,空間内で音がどう響くかということは,音色を決定づける重要な一要因である.しかし,身近な発音体である楽器からそもそもどのように音が空間的に放射されるかということは,未だに解明が進んでいない.本研究では,球状マイクロホンアレイシステムを用いて 「演奏者」 の周囲の音を収録し,その特徴解析を行った.その結果,弦楽器の種類,演奏者の技術レベル,モダンバイオリンと 「ストラディバリウス」 の違いなど,空間音響放射特性にその特徴が現れることが明らかとなった.また,「まるでそこで演奏しているかのような」 音を再現可能な球形マルチチャネルスピーカの製作を通して,「生」 を感じさせるためには放射方向の時間変化が重要であることが分かってきた.これらの結果を通して音の空間放射特性と音色の関係について考察する.
著者
辰巳 直也 森勢 将雅 片寄 晴弘
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-6, 2010-10-07

Vocaloid 「初音ミク」 の発売以来,歌唱合成に対する注目が高まりつつある.Vocaloid では,メロディと歌詞を入力することにより,サンプリングされた人の声を元にした歌声を合成することができる.また,表情パラメタを調整することにより,様々な表情を付与することができる.しかし,より人間らしい表情豊かな歌声にするには,表情パラメタの調整を細かく設定することが必要なため,非常に煩雑で時間がかかる.本研究では,ロック歌手の一人 「GACKT」 の歌い方に見られるビブラートやポルタメントといった音高・(音量) 等の歌唱技法を低次のモデルパラメタで近似し,混合ガウス分布を用いた手法でモデルパラメタを決定する.それらの値を Vocaloid の出力に付加することで,ロック歌手らしい歌い方を実現する 「ロックボーカルレゾネータ」 を提案する.Since the release of Vocaloid "Hatsune Miku", voice synthesizing applications have been known to the public people. Vocaloids generate human-like vocal melodies by giving lyrics and melodies. If the parameters for expression control are elaborated, Vocaloids yield more natural vocals. However, setting these parameters requires complicated expertise. This paper proposes a system called "Rock Vocal Resonator" that emphasizes Rock vocalist styles for Vocaloids, based on analysis of a Japanese Rock singer, GACKT's singing.
著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.35, pp.1-8, 2018-06-09

マイクロ波聴覚効果とは矩形波のマイクロ波が聴覚を刺激する現象である.そこで,マイクロ波聴覚効果を応用したマイクロ波通信,即ち,テレパシー通信では,音声信号でパルス変調されたマイクロ波を搬送波として,受信者の頭部にビーム照射することにより,マイクロ波聴覚効果により頭部が音声信号を復調する.テレパシー通信では,ビーム幅が小さく,かつ,ビーム径が小さなマイクロ波ビームを形成することが求められる.そこで,マイクロ波のみを頭部に照射するのでなく,別途,レーザービームを頭部に照射して,大気中の気体分子をイオン化して,微量のプラズマをらせん状のビーム経路に生成する.すると,プラズマが導波管として作用して,マイクロ波がプラズマ導波管の内部をビームとなって直進し,特定の受信者のみが声を聴くことができる.
著者
西田 智 浜中 雅俊 平田 圭二 東条 敏
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.23, pp.1-7, 2010-07-21
参考文献数
6

本稿では,曲の雰囲気や特徴を変えずに,楽曲構造に基づきメロディ中に新たな音を追加して,メロディを生成する手法について述べる.本手法の特長は楽曲構造を利用したことであり,その結果,生成されたメロディは元のメロディの雰囲気を忠実に反映することができた.提案手法では,まず,メロディを音楽理論GTTMに基づき分析し,タイムスパン木を獲得する.次に,得られたタイムスパン木に,既存の曲のタイムスパン木を参考にして,新たな枝を追加することで,音数の増加した新たなメロディを生成する.実験の結果,簡約したメロディから楽曲構造に沿って具体的なメロディを生成できることを確認した.This paper presents a melody generation method which adds new notes to a given melody with its flavor and characteristics retained. The main advantage of our method is that musical structures are employed to keep the similar flavor of an original melody in a generated melody. First, we analyze an original melody based on music theory GTTM and acquire a corresponding time-span tree. Next, we add a new branch and a note, referring to the time-span tree of an original melody. As a result, we obtain a new melody in which a new note has been added. We conduct an experiment, which demonstartes that our method can generate an instantiated melody from a simple melody, unchanging its basic musical structure.
著者
岩村 宏 安田 彰 岡村 淳一
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-115, no.24, pp.1-6, 2017-06-10

スピーカーの状態空間モデルを用いてボイスコイル電流 ・ ダイアフラム位置 ・ ダイアフラム速度等を推定し,その内部状態を考慮したフィードフォワード制御を行うことにより,スピーカーのインピーダンス,インダクタンス,フォース ・ ファクター,スティフネス,機械抵抗,可動部質量,キャビネット容量等を信号処理により仮想的にリアルタイムで変更できるシステムを開発した.制御はデジタル信号処理で行うため,各パラメータは独立して変更可能で,物理的には実現困難な特性も容易かつ安定に作り出すことができる.
著者
阪上 大地
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.2, pp.1-13, 2018-06-09

本稿では音楽情報処理に深層学習を応用する方法を解説する.本稿は二部構成で,ニューラルネットの一般的な設計と学習方法を解説した後,音楽情報処理を含めた各種メディア処理への応用例を紹介する.前半ではパラメータの初期化方法など常識となってしまっている基本的な事柄,Dropout などのよく使われるテクニック,最先端でまだ整理が進んでいない研究成果を順番に解説する.後半では WaveNet や Encoder-Decoder モデルなど各分野の代表的な応用例を紹介し,和音認識 ・ ビートトラッキングなどに深層学習を応用した研究を紹介する.
著者
阿部ちひろ 伊藤彰則
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.3, pp.1-6, 2012-08-02

本稿では,Ngram 言語モデルをもとに歌詞候補文を生成する作詞補助システム 「patissier」 への実装を想定した,歌詞テキストの特徴分析結果を報告する.作詞においては,音韻やアクセントなど技巧的な側面の考慮とともに,楽曲のテーマや歌詞のストーリー設定も重要な要素である.より歌詞らしい候補の生成を目的として,コンテンツ投稿サイト 「ピアプロ」 に投稿された歌詞テキストを用い,一般に歌詞らしさと呼ばれる特徴の定量的検討を行った.また,CSJ (日本語話し言葉コーパス) や blog 記事との比較から,主に使用される単語の違いにより,歌詞とその他の文章は統計的に区別可能であることが示唆された.さらに,3 種類のモデルを用いた歌詞生成実験により,それぞれ異なった傾向を持つ文が生成されることが確かめられた.
著者
繁松 佑哉 河瀬 彰宏
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2020-MUS-126, no.2, pp.1-6, 2020-02-10

本研究は,ヒューマンビートボックス世界大会の予選通過者と敗退者の演奏における楽器と楽曲構成を統計的に比較し,通過者の特徴を明らかにした.通過者と敗退者は共にダンス・ミュージックに見られる同一打楽器音の連続パターンを使用しているものの,通過者は楽器音の構成のなかにベースとメロディの両方を含むパターンを多用する傾向があることが分かった.その一方で,敗退者はベースを含んだパターンのみを多用していることが分かった.また,両者には,基礎打楽器音のハイハットとKスネアの使用傾向に特徴的な差異が見られた.楽曲の構成については,通過者も敗退者も近年のEDMに類似した構成をとることが確認できたが,通過者は音楽性を意識したビートを構成し,敗退者は重低音とオリジナルサウンドを多用していることから,スキル重視のビートを構成する傾向があることが明らかになった.
著者
寺島裕貴 岡田真人
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.43, pp.1-4, 2013-05-04

大脳皮質聴覚野が担う複雑な情報処理の原理解明に向け,皮質の一様性を根拠に視覚系相同領野のモデルが応用されつつある.しかし,既存研究で議論されてきたのは視覚野神経細胞のうち線形応答を示す単純細胞のモデルに限られており,非線形な複雑細胞に相当する概念については未着手だった.本研究で我々は,視覚野複雑細胞の学習モデルであるトポグラフィック独立成分分析を自然画像の代わりに自然音に適応させた.学習結果である聴覚版「複雑細胞」の特性は,近年聴覚野で発見されたピッチ細胞と同様に“missing fundamental”類似の非線形性を示した.聴覚野ピッチ細胞が視覚野複雑細胞と同一のモデルによる自然刺激学習で獲得可能であるという結果は,両者の計算論的相同性を示唆する.
著者
Bonada Jordi Blaauw Merlijn 才野 慶二郎 久湊 裕司
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.24, pp.1-6, 2013-08-24

音声,特に強め表現を伴う歌声においてはしばしば声帯振動に基本周期外の不規則な挙動が見られる.本稿ではこのような声質を持つ音声を再現するためのスペクトルモーフィングに基づいた音声合成手法について述べる.本手法は,ターゲットとなる声質を持った音声サンプルの励振源に相当する成分と,入力音声のスペクトル包絡を用いて合成を行うものである.まず,声質ターゲットサンプルに対し,その基本周波数を入力音声の基本周波数に合わせこむための時間領域リサンプリング処理を行う.その後,声質ターゲットサンプルのスペクトルの元々の包絡構造をなるべく復元するように,調波成分の再配置を行う.最後に,そこに入力音声の調波の振幅と位相を適用することで,入力音声の音色と声質ターゲットサンプルの声質を併せ持つ音声信号を得る.その音声信号と入力音声を任意の比率でモーフィングすることで,声質ターゲットサンプルの声質を任意の分量だけ持つ音声が合成可能となる.本稿では,グロウルの声質を持つ音声を使用した歌声合成および主観評価実験を行った.In this paper we introduce a morph-based approach for generating voice source aperiodicities frequently associated with strong vocal expressions, especially in singing. In our approach the excitation characteristics of one signal are combined with the fundamental frequency and spectral envelope characteristics of another signal. An exemplar sustained sample of the target voice quality is resampled in the time domain in order to generate a continuous signal matching the input voice's fundamental frequency. While we found the temporal scaling to be acceptable in many contexts, the frequency scaling has to be inverted in order to generate appropriate spectral content for the source excitation's entire bandwidth. Finally, the input signal's harmonic amplitudes and phases are applied to the transformed morph sample, allowing for a simple one-dimensional control of morph amount by linear interpolation with the input signal. The proposed system is evaluated and the results are discussed.
著者
加藤 淳 後藤 真孝
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2023-MUS-138, no.7, pp.1-21, 2023-08-20

音楽に合わせてタイミングよく歌詞が動くリリックビデオは楽曲のプロモーション手段として一般化したが,いつ再生されても同じ内容を提示するため,視聴者は受動的に楽しむしかない.そこで我々は,ユーザとのインタラクションにより歌詞のテキストを再生のたびに異なる方法で提示でき,静的メディアの制約を取り払える歌詞駆動型のインタラクティブな視覚表現を「リリックアプリ」と定義する.そして,この表現形式をプログラマやミュージシャンに開放するため,リリックアプリを開発・配信できる Web ベースのフレームワーク「Lyric App Framework」を提案する.当該フレームワークは,我々が研究・開発・運営してきたリリックビデオ制作支援サービス「TextAlive」の Web インタフェースと,歌詞駆動の表現を開発できる機能をプログラマ向けに開放する「TextAlive App API」で構成される.当 API は,既存の,プログラマが使い慣れたクリエイティブコーディングのためのライブラリと相補的な役割を果たし,インタラクティブなリリックアプリをすぐに開発可能である.我々は,2020 年に当 API を一般公開し,新たな表現形式の可能性を探ってきた.とくに,創作文化に関するイベント「マジカルミライ」ではプログラミング・コンテストが毎年開催され,最初の 2 回で 52 作品が集まった.これらの作品を分析して得られたリリックアプリのカテゴリ 8 種類と,音楽とプログラミングの未来に関する示唆を報告する.
著者
加藤淳 中野倫靖 後藤真孝
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014-MUS-104, no.15, pp.1-7, 2014-08-18

本稿では、歌詞を歌声と同期してアニメーションさせる Kinetic Typography と呼ばれる動画表現の制作環境 TextAlive を提案する。既存の制作ツールでは、歌詞と歌声の同期を手作業で取り、文字や単語、複数単語から成るフレーズに対して個別に望みの動きを設計する必要があった。その際は、動きを規定するアルゴリズムのパラメタを、スライダーなどの汎用 GUI で調整して試行錯誤を重ねていた。一方、本制作環境では、歌詞と音楽の時間的対応付けを自動で推定し、動きのアルゴリズムに対する初期パラメタを自動生成する。さらに、動きのアルゴリズムを編集できるコードエディタを備え、プログラマがパラメタ調整に適した専用 GUI を容易に提供できるフレームワークを提供する。これにより、TextAlive のユーザは Kinetic Typography を一から作る必要がなくなり、初めに時間合わせなどを行う手間をかけずに済む。また、歌詞の動きをインタラクティブかつグラフィカルに設計できるようになる。
著者
渡辺謙 大石悠貴 柏野牧夫
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.57, pp.1-4, 2013-05-04

これまで、多くの研究で音楽が人間に与える影響が調べられ、自律神経活動や呼吸が計測されてきた.しかし、音楽の各パラメータがどのように影響を与えるかはまだわかっていない.そこで、本研究では音のパラメータの中でもテンポに着目し、音のテンポと呼吸数の組み合わせが自律神経系に与える影響について調べた.本研究では、二つの実験を行い、それぞれ18名の健常者が参加した.実験条件として、音のテンポは60BPM,80BPM、呼吸数は15CPM,20CPMの全組み合わせ4条件で各5分間の実験を行った.音刺激は、単純なドラム音を用いて、呼吸はメトロノームを用いて統制した.実験中に、心電図と呼吸を計測し、自律神経活動の指標として平均心拍数と心拍の変動成分を解析した.結果として、20CPMで呼吸をしながら、80BPMのテンポの音を聴く条件のみで、交感神経活動が増加し、平均心拍数の増加が見られた.他の条件では平均心拍数の変化は見られなかった.本研究から、交感神経活動の顕著な増加には、交感神経中枢であるRVLMの一定以上の発火率と、音と呼吸リズムの同期という二つの条件が必要な可能性が示唆された.結論として、音楽が生体の交感神経活動に影響を与えるには、音楽のテンポと呼吸数の組み合わせが重要な要因になると考えられる.
著者
才野 慶二郎 大浦 圭一郎 橘 誠 剣持 秀紀 徳田 恵一
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2012, no.7, pp.1-6, 2012-01-27

ラップのような短時間のうちに音高などの特徴が大きく変動するスタイルの歌い方は,それを適切に表現するための記譜法が確立されておらず,従来のように五線譜基づく合成の仕組みではユーザが直観的にそのスタイルの歌声を再現することが難しかった.本稿では,ラップスタイルの歌唱のための記譜法を定義し,それを用いて HMM 歌声合成の枠組みでラップスタイルの歌声合成を行った.その結果得られた合成音声はラップ特有のグリッサンド技法によるピッチ変動の現象を含むものになっていることが確認された.また,合成時に得られる対数基本周波数系列を素片接続型の歌声合成器に与えてラップスタイルの歌声を合成することも試みた.This paper addresses rap-style singing voice synthesis. Since it has not been very clear how to write a musical score for rap-style songs, existing singing voice synthesis systems based on musical scores are not suitable for synthesizing them with an intuitive input. Here a new type of musical score specialized for a rap-style is defined. An HMM-based singing voice synthesis system is used to realize an automatic synthesis of realistic rap-style singing. Glissando phenomenon which is special for the style could be found in synthesis results. It was also tried to apply pitch parameters generated from the HMMs to a sample-concatenation-based singing voice synthesis system.
著者
剣持秀紀
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.26, pp.1-1, 2013-08-24

歌声合成技術は楽曲制作に幅広く用いられるようになってきている.また特に若い層を中心に,そのような楽曲 (いわゆる 「ボカロ曲」 ) を愛聴する人々も多い.なぜ人間の歌声でなく,合成された歌声が使われ,聴かれるのかについて考えてみたい.併せて歌声合成技術 VOCALOID の現在の仕組み (システム) について解説し,その将来の展開について述べる.
著者
森勢 将雅 山下 洋一
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.4, pp.1-6, 2012-08-02
被引用文献数
2

スマートフォン等のマイクロフォンを備えた携帯端末は,携帯電話としての機能だけではなく,音楽再生,音収録等様々な機能をユーザに提供しつつある.本研究では,スマートフォンを用いた音楽試聴スタイルの 1 つとして,タイトルやアーティスト等の情報,および歌詞が音楽に同期して表示される音楽試聴システムの実現に取り組む.本システムを実現するため,音楽に知覚的な影響を与えず情報を埋め込み,埋め込まれた情報をリアルタイムで抽出する技術を提案する.知覚に影響せず情報を埋め込むための技術として電子透かしが一般的に用いられるが,雑音に対する頑健性や通信速度の問題があり,実時間での情報伝達手段に用いることは困難であった.本研究では,モスキート音の考え方に基づくシンプルな方法を提案することで,目的とするシステムへの要求を満たす技術の確立を目指す.本稿では,モスキート音を用いた電子透かしの概要,および情報を埋め込むための仕様について説明する.次いでスマートフォン上に実装されたプロトタイプシステム,およびいくつかの音楽を用いた動作確認テストにより本システムの有効性について議論する.Smartphone that has a microphone has been used as a good tool for dairy life, and we can easily record a sound. In this research, a lyric-synchronized music listening system with smartphone is introduced to provide users with a new music listening style. The system can display the information such as title, lyric, and so on, extracted from the recorded music. The information is hidden in the music signal to avoid deteriorating the sound quality. Digital watermarking is one of the technology to hide the information, and several watermarking technologies for audio signal have been proposed. However, it was difficult for them to realize the good noise tolerance and transmission performance. In this paper, we focus on the mosquito sound to develop the digital watermarking to solve these problems. This paper shows the method to hide the information and the specification about the transmission of the information. The implemented system is introduced and tested in a real environment, and its effectiveness is also discussed.
著者
中野倫靖 吉井和佳 後藤真孝
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.23, pp.1-7, 2013-08-24

本稿では、複数の歌声から得られる音響特徴量をトピックモデルによって分析することで、歌声の特性を説明する新しい手法を提案する。従来、歌手の特性 (性別や声種等)、歌い方の特性 (声区やF0軌跡のモデル化等)、聴取印象 (明るさ等)、楽曲の特性 (楽曲ジャンルや歌詞等) を分析・推定したりする研究はあったが、複数の歌声から分かるような潜在的な意味を分析する研究はなかった。本稿では、伴奏と歌声を含む音楽音響信号から、歌声の線形予測メルケプストラム係数 (LPMCC) と ΔF0 を特徴量として自動推定した後、潜在的ディリクレ配分法 (LDA) で分析を行う。LDA によって得られた潜在意味 (トピック) の混合比が歌手名同定にも適用可能であることを示し、声道長の正規化に相当する処理を導入することで、性別を超えた類似歌手検索を実現することも示す。また、トピックの混合比を用いて、各トピックにおいて支配的な曲の歌手名をタグクラウドのように提示することで、トピックや歌声の意味を可視化する方法を提案する。
著者
濱崎 雅弘 武田 英明 西村 拓一
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.11, pp.1-6, 2009-05-14
参考文献数
10
被引用文献数
1

本研究では,Web を介して多くの人が集い,創発的・協調的に行われる創造活動の分析を行う.ニコニコ動画は国内でもっとも人気の動画共有サイトであるが,投稿された動画の多くに協調的な創作活動が見られる.特に初音ミクという合成音声ソフトウェアを用いた動画は,作詞作曲をする人たちだけでなく,絵を描く人やビデオ編集をする人たちなど,異なるタイプの作者が参加することで新たなコンテンツが作り出されている.本論文では,そのような異なるタイプの作者が互いに影響を受けながら新しいコンテンツを作っていく様子のネットワーク分析を用いて解析する.The Web technology enables numerous people to collaborate in creation. We designate it as massively collaborative creation via the Web. As an example of massively collaborative creation, we particularly examine video development on Nico Nico Douga, which is a video sharing website that is popular in Japan. We specifically examine videos on Hatsune Miku, a version of a singing synthesizer application software that has inspired not only song creation but also songwriting, illustration, and video editing. As described herein, creators of interact to create new contents though their social network. In this paper, we analyzed the process of developing thousands of videos based on creators' social networks.
著者
佐々木 星太朗 白木 善尚
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.36, pp.1-6, 2013-05-04

歌唱合成音声とは,音声合成・デスクトップミュージック(DTM)ソフトウェア等を用いて,コンピュータ上で生成された歌唱音声である.本研究では,歌唱合成音声のハスキーボイス化の方法を提案する.ハスキーボイス化の基本的な手法は,音声信号の声帯情報である残差信号に処理を加える「残差変換」である.この「残差変換」について本研究では二種類の方法を提案している.さらに「残差変換」処理後の音質向上を図るためイコライザーの応用を試みる.また残差信号の振幅情報から「残差変換」処理のレヴェルを決定することによって,ハスキーボイスの自動生成を行なう.提案した二種類の「残差変換」法,イコライザ一応用法,自動生成法,の4つの手法を用いて合成した音声の聴取実験を行い,魅力的なハスキーボイス化のためにはどのような手法や指標に有用性があるのかについて,検証する.