著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.35, pp.1-7, 2016-05-14

科学界は電波が聞こえないというパラダイムが支配している.しかしながら,マイクロ波は電波の一種であるが,矩形波のときに音として聞こえる現象が繰り返し報告されている.そこで,電波が聞こえないという旧来のパラダイムから電波が聞こえるという新たなパラダイムに転換することが求められる.このような視座に立脚して,パルス波形のマイクロ波が聴覚を刺激する現象について概説するとともに,気導,骨伝導及びマイクロ波聴覚効果を統一する理論的枠組みを提示する.
著者
牧 勝弘
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.13, pp.1-6, 2016-05-14

コンサートホールの例からも分かるように,空間内で音がどう響くかということは,音色を決定づける重要な一要因である.しかし,身近な発音体である楽器からそもそもどのように音が空間的に放射されるかということは,未だに解明が進んでいない.本研究では,球状マイクロホンアレイシステムを用いて 「演奏者」 の周囲の音を収録し,その特徴解析を行った.その結果,弦楽器の種類,演奏者の技術レベル,モダンバイオリンと 「ストラディバリウス」 の違いなど,空間音響放射特性にその特徴が現れることが明らかとなった.また,「まるでそこで演奏しているかのような」 音を再現可能な球形マルチチャネルスピーカの製作を通して,「生」 を感じさせるためには放射方向の時間変化が重要であることが分かってきた.これらの結果を通して音の空間放射特性と音色の関係について考察する.
著者
小池 誠
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.35, pp.1-8, 2018-06-09

マイクロ波聴覚効果とは矩形波のマイクロ波が聴覚を刺激する現象である.そこで,マイクロ波聴覚効果を応用したマイクロ波通信,即ち,テレパシー通信では,音声信号でパルス変調されたマイクロ波を搬送波として,受信者の頭部にビーム照射することにより,マイクロ波聴覚効果により頭部が音声信号を復調する.テレパシー通信では,ビーム幅が小さく,かつ,ビーム径が小さなマイクロ波ビームを形成することが求められる.そこで,マイクロ波のみを頭部に照射するのでなく,別途,レーザービームを頭部に照射して,大気中の気体分子をイオン化して,微量のプラズマをらせん状のビーム経路に生成する.すると,プラズマが導波管として作用して,マイクロ波がプラズマ導波管の内部をビームとなって直進し,特定の受信者のみが声を聴くことができる.
著者
阪上 大地
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-119, no.2, pp.1-13, 2018-06-09

本稿では音楽情報処理に深層学習を応用する方法を解説する.本稿は二部構成で,ニューラルネットの一般的な設計と学習方法を解説した後,音楽情報処理を含めた各種メディア処理への応用例を紹介する.前半ではパラメータの初期化方法など常識となってしまっている基本的な事柄,Dropout などのよく使われるテクニック,最先端でまだ整理が進んでいない研究成果を順番に解説する.後半では WaveNet や Encoder-Decoder モデルなど各分野の代表的な応用例を紹介し,和音認識 ・ ビートトラッキングなどに深層学習を応用した研究を紹介する.
著者
岩村 宏 安田 彰 岡村 淳一
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-115, no.24, pp.1-6, 2017-06-10

スピーカーの状態空間モデルを用いてボイスコイル電流 ・ ダイアフラム位置 ・ ダイアフラム速度等を推定し,その内部状態を考慮したフィードフォワード制御を行うことにより,スピーカーのインピーダンス,インダクタンス,フォース ・ ファクター,スティフネス,機械抵抗,可動部質量,キャビネット容量等を信号処理により仮想的にリアルタイムで変更できるシステムを開発した.制御はデジタル信号処理で行うため,各パラメータは独立して変更可能で,物理的には実現困難な特性も容易かつ安定に作り出すことができる.
著者
繁松 佑哉 河瀬 彰宏
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2020-MUS-126, no.2, pp.1-6, 2020-02-10

本研究は,ヒューマンビートボックス世界大会の予選通過者と敗退者の演奏における楽器と楽曲構成を統計的に比較し,通過者の特徴を明らかにした.通過者と敗退者は共にダンス・ミュージックに見られる同一打楽器音の連続パターンを使用しているものの,通過者は楽器音の構成のなかにベースとメロディの両方を含むパターンを多用する傾向があることが分かった.その一方で,敗退者はベースを含んだパターンのみを多用していることが分かった.また,両者には,基礎打楽器音のハイハットとKスネアの使用傾向に特徴的な差異が見られた.楽曲の構成については,通過者も敗退者も近年のEDMに類似した構成をとることが確認できたが,通過者は音楽性を意識したビートを構成し,敗退者は重低音とオリジナルサウンドを多用していることから,スキル重視のビートを構成する傾向があることが明らかになった.
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.60, pp.1-6, 2015-05-16

本研究では提案法を用いて通常歌唱音声にグロウル系歌唱の特徴を付与した際の印象を評価した.これまでの研究よりグロウル系歌唱音声特有の物理的特徴として 「1k~4kHz の帯域強調」,「基本周波数の振動」 及び,「スペクトル形状の高速な時間変動」 が確認された.従来法である 「スペクトル形状の高速な変動」 を付与したモデルは,観察された現象を表面的に模擬するために 4 個のガウス関数を組み合わせたものであり,声質の表現や発声の機構を考慮したものでは無かった.本研究では 「スペクトル形状の高速な時間変動」 を披裂喉頭蓋の形状変化と声帯音源波形の時間変化の相互作用としてモデル化することで,グロウル系歌唱音声の特徴を付与する手法をこれまでに提案した.本稿では,従来法と提案法を変換後の歌唱音声の一対比較実験により評価した.結果をサーストンの一対比較法により分析した結果,提案法がグロウル系歌唱音声の印象を付与するのに効果的であることが示唆された.
著者
原 健太 加藤 淳 後藤 真孝
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-112, no.8, pp.1-7, 2016-07-23

本稿では,DJ 機器および DJ システムをプログラミングで制御可能にすることで,コンピュータと人間が共同でミックスを行う DJ プレイ手法を提案する.ユーザは,事前にプログラミングしておくことで,つまみを 6 つ高速かつ正確に同時に動かすなど,人間には難しい制御を披露できる.さらに,即興でプログラミングすることも可能で,その場の雰囲気に合わせた選曲変更に対応したり,プログラムのパラメタを調整したりして,コンピュータとの B2B プレイ (Back-to-back; 2 人の DJ が交互に選曲する協力プレイ) ができる.
著者
矢倉 大夢 中野 倫靖 後藤 真孝
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-112, no.3, pp.1-10, 2016-07-23

本稿では,作業時に集中度を高めることを目的として聴取する楽曲,「作業用 BGM」 に特化した楽曲推薦システムを提案する.従来,ユーザが好むであろう楽曲を推薦する手法が研究されてきたが,「とても好き」 な楽曲は作業者の集中を阻害することが知られており,作業用 BGM として推薦する楽曲に適していない.提案システムは,「とても好き」 や 「とても嫌い」 ではなく、「好き」 もしくは 「どちらともいえない」 楽曲を,BGM 聴取時のユーザからのフィードバックに基づいて推薦する.具体的には,楽曲のサビ区間までをダイジェスト的に聴取する (部分的にしか再生されない) システムとして設計することで,楽曲を 「スキップ」 するフィードバックによって 「嫌い」 な楽曲を推定する従来手法に加え,「もっと聴く」 フィードバックを導入して 「好き」 な楽曲を推定する.さらに,「好き」 として推定された楽曲は,ユーザの集中度を行動ログから推定して 「とても好き」 か 「好き」 かを識別する.これは集中度が高い時のフィードバックは,低い時より嗜好度を強く表しているという仮説に基づく.そして,楽曲間類似度に基づく Label Spreading により,頑健にかつ再生履歴が少ない状況でも適切に楽曲を推薦することを可能にした.
著者
二宮 洸太 中村 聡史
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2021-MUS-130, no.33, pp.1-8, 2021-03-09

音楽ライブに参加する観客は演奏に合わせてサイリウムを振る,ヘッドバンギングをするなど,アーティストや他の観客との一体感や非日常感を楽しんでいる.また,ライブの模様を,インターネットを通じて配信する配信ライブも多く行われているが,自宅でひとりで鑑賞することが多く,アーティストや他のファンとのかかわりや一体感が希薄化する問題がある.そこで,配信ライブ中の視聴者間の一体感を向上させることを目的に,ライブ中に行われるヘッドバンギングを媒介として,その動作を検知し,タイミングを視聴者間で共有するシステムを提案する.本研究ではポケットに入れたスマートフォンのセンサデータを使い,ヘッドバンギングの予備動作からヘッドバンギングの推定に関する検討を行った.具体的には,ヘッドバンギング中のセンサデータに関するデータセット構築を行い,機械学習により,予備動作からヘッドバンギングの推定を行った.その結果,93.5% の精度で推定を行うことができた.
著者
横山 真男
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.14, pp.1-6, 2015-05-16

西洋クラシック音楽では純正律や平均律で楽器を調弦して演奏を行い,また,作曲家もこのルールで音楽を提供してきた.しかし,現代音楽においては既存の半音 12 音による音階にあてはまらない新しい音を模索してきており,たとえば半音をさらに細かくした 1/4 音や 1/6 音といった微分音や,平均律とは異なる民族的な音律を導入したりする試みがなされてきた.本発表では,黄金比により計算された音律と,その手法で調弦したヴァイオリン属による音楽の作曲手法を提案する.
著者
大串 健吾
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.2, pp.1-4, 2015-05-16

音のピッチ知覚については長い間実験と議論が行われてきた.時代の変遷と共に,聴覚理論は変化してきた.この報告では,聴覚理論の変遷を簡単に紹介する.また複合音のピッチがその基本周波数に対応する純音のピッチとはわずかに異なることを示す実験データを取り上げ,この現象をどのように説明すべきかについて新しい観点から述べる.
著者
松崎 裕佑 梅村 祥之
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-110, no.14, pp.1-6, 2016-02-22

人間が作曲する場合,最初にコード進行を想定し,そのコード進行に基づいてメロディを生成するコード作曲法が用いられる.これをコンピュータアルゴリズムに置き換え,あらかじめコード進行を与え,その根音となる音高を骨格となる音符とし,骨格と骨格の間に非和声音などを用いて肉付けとなる音符を数個補い曲を生成するシステムを開発した.この手法で生成した曲を,心地よさとバラエティの豊富さの 2 つの面で楽曲コーパス中の実存曲と比較する主観評価実験を行った.その結果,バラエティについては,実存曲の方が富んでいるものの,心地よさについては,生成曲の方が心地よい曲が多いという結果を得た.
著者
増田 聡
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-110, no.12, pp.1-5, 2016-02-22

文化的表現の類似が見出されたとき,われわれはしばしば 「パクリ」 という語でそのことを指し示す.2015 年に話題となった五輪エンブレムの 「パクリ」 疑惑は記憶に新しい.現代の日本では 「パクリ」 は剽窃とほぼ同義の言葉として用いられる.だがこのような 「パクリ」 概念,表現の類似を所有権の侵害たる 「盗み」 として把握する考え方の出現はさほど古いものではない.「パクリ」 概念は 80 年代に現在の意味を獲得し,それまでの 「剽窃」 「盗作」 と異なったコノテーションをともなって表現の類似を指し示すようになる.本講演では 「パクリ」 概念の来歴とその背景を辿りつつ,いくつかの 「剽窃」 事例を音例に基づいて検討し,「表現の所有と盗み」 がどのような文脈のもとで捉えられているかを探る.
著者
武田 一哉
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.3, pp.1, 2016-05-14

机の前の本棚の目に着く場所に 2 つの学位論文を置いている.一つは学生時代の指導教官であった池谷和夫先生の論文 「形成振動板に関する研究」 もう一つは,若手教員時代の上司であった板倉文忠先生の論文 「統計的手法による音声分析合成系に関する研究」 だ.共に電電公社の研究所で執筆された 2 つの論文である.物理数学の集大成のような前者と,確率数理を駆使した後者.おなじ 「音学」 の論文でありながら,この 2 つの論文のアプローチには,12 年間という出版年の違い以上に本質的な違いがある.物理学としての音学から,情報学としての音学へ,我々はそんな変化の中で音学を研究して来たのだ.そして思い返せば,この音学の変化こそ,データサイエンスという巨大なパラダイムシフトの前兆であったのだ.
著者
津島 啓晃 中村 栄太 糸山 克寿 吉井 和佳
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-116, no.14, pp.1-7, 2017-08-17

本稿では,音楽コーパスから和音系列とメロディに関する生成規則を統計的に学習し,それに基づいてメロディへの和声付けを行う手法を示す.従来の和声付け手法には,一拍ごとのコードの遷移を表現した隠れマルコフモデル(HMM)に基づく手法がある.しかしこの手法では,音楽理論において重要とされているコードのリズム,コードの機能(tonic, dominant, subdominant),コードの階層構造を明示的に表現できない.この問題を解決するため,確率的文脈自由文法による和音系列生成モデル,拍節マルコフモデルによるコードのリズム生成モデル,コードの条件付きマルコフモデルによる音高系列生成モデルからなる階層的生成モデルを提案する.さらに,提案モデルを用いてメロディに対する和音系列の推定を行うため,潜在変数であるコード記号とそのオンセット位置のそれぞれをsplit-mergeサンプリングという新しいサンプリング手法を含むメトロポリス・ヘイスティングス法に基づいて更新する手法を提案する.評価実験よりHMMに基づく手法に対して提案手法の和声付けタスクにおける精度が向上したことを示せた.
著者
前澤 陽
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-112, no.19, pp.1-8, 2016-07-23

本稿では,人間の演奏に合わせて機械が伴奏するような合奏システムにおける,伴奏パートの発音タイミングについて述べる.合奏中の演奏者は,(1) 自分自身のパートに対して,目標となる演奏タイミングを持ち,(2) 相手の演奏を予測しながら聴き,(3) 互いの主従関係を踏まえながら演奏タイミングを補正すると考えられる.また,これらの三要素は,楽曲中のコンテキストやリハーサルや対話を通じて,独立して学習もしくは制御されると考えられる.そこで本研究では,演奏者の演奏タイミング予測,伴奏パート自体の生成過程,演奏者・伴奏パート間の主従関係の 3 要素を,独立に学習もしくは制御が可能な,発音タイミングの数理モデルを提案する.
著者
尾関 日向 酒向 慎司
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2021-MUS-132, no.23, pp.1-5, 2021-09-09

ポピュラー音楽の制作では,マスタリングの際に曲の音量レベルを過剰に高めようとする傾向がみられる.しかし,このようにして作られたダイナミクスの小さな曲は,近年のリスニングスタイルに適していないことが多いと考えられる.そこで本研究では,ラウドなポピュラー楽曲のスペクトログラムからマスタリング前のラウドネスを推定することで,ダイナミクスの復元を目的とする.
著者
吉田 祥 香山 瑞恵 池田 京子 山下 泰樹 伊東 一典 浅沼 和志
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-114, no.12, pp.1-6, 2017-02-20

本研究では,歌声の響きに関連する周波数特性の強度や割合の定量化を検討し,歌声評価指標として提案することを目的としている.これまでの研究で,心理的印象に影響を与える音響特徴量が歌唱指導により変化することが確認されている.また,この音響特徴量を評価するための声楽初学者に特化した歌唱評価指標を検討してきた.本稿では,これらの成果をふまえ,既提案指標の妥当性を再度検討した上で,声楽を専門に学ぶ特定個人の長期間での歌声変化解析への適用を試みる.その結果と声楽指導者の主観的評価との相違を考察した結果,声楽指導者の主観的評価と定量化した指標との相関が確認されたことから,歌声の習熟を評価する指標としての可能性を見出した成果について述べる.
著者
森勢 将雅
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2022-MUS-134, no.6, pp.1-6, 2022-06-10

現在の音声合成研究者が論文に Vocoder と記載するとき,その多くは Deep neural network (DNN) を用いて何らかのパラメータから高品質な音声波形を生成する Neural vocoder を指すのではないだろうか.もしそうであれば,音声符号化という役割ではなく,高品質な音声を合成したいという高品質 Vocoder が持つ『黄金の精神』が,Neural vocoder 世代に受け継がれたことを意味する.本稿では,恐らく今後失われていくであろう伝統的な Vocoder の波形生成部のアルゴリズム,および一連の知識がまだ音声研究において役立つかという将来展望について紹介する.