著者
矢澤一樹 糸山克寿 奥乃博
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.17, pp.1-6, 2013-08-24

本稿では,ギター演奏者の演奏支援をするために実際のギター演奏音から演奏者の習熟度に応じたタブ譜を自動生成する手法について述べる.具体的には,初級者向けには音符の欠落などを許容してでも演奏が容易なタブ譜を,上級者向けには音高を正確に再現するタブ譜を,それぞれ生成する.推定される運指の難易度は,音響再現度と運指容易度の相対的な重みをユーザー側で調整することによって変更可能である.本手法によって得られたタブ譜について音響再現度と運指容易度の両面から評価を行った結果,パラメータを変更することによって音高推定の適合率を保ったまま運指を簡略化できることが確認された.
著者
阿部ちひろ 伊藤彰則
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-96, no.3, pp.1-6, 2012-08-02

本稿では,Ngram 言語モデルをもとに歌詞候補文を生成する作詞補助システム 「patissier」 への実装を想定した,歌詞テキストの特徴分析結果を報告する.作詞においては,音韻やアクセントなど技巧的な側面の考慮とともに,楽曲のテーマや歌詞のストーリー設定も重要な要素である.より歌詞らしい候補の生成を目的として,コンテンツ投稿サイト 「ピアプロ」 に投稿された歌詞テキストを用い,一般に歌詞らしさと呼ばれる特徴の定量的検討を行った.また,CSJ (日本語話し言葉コーパス) や blog 記事との比較から,主に使用される単語の違いにより,歌詞とその他の文章は統計的に区別可能であることが示唆された.さらに,3 種類のモデルを用いた歌詞生成実験により,それぞれ異なった傾向を持つ文が生成されることが確かめられた.
著者
金子 仁美 川上 大輔 嵯峨山 茂樹
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-8, 2010-05-20

我々は,楽曲の和声解析の記述仕様 ("KS notation") を策定し,機能和声解析を行ってデータを作成し,その統計解析を行った.和声推定は自動採譜や楽曲検索など多数の目的に有用で,その和声進行の確率モデルの作成と統計学習のために有用である.また,音楽学的な見地からは,和声学の規則や傾向などが計量的に検証でき,時代や作曲者や楽曲スタイルを和声学的に解明する基礎となろう.機能和声記述のために,和音,転回,借用和音,省略,変位,転調,付加音などの記述を可能とし,さらに楽譜なしで演奏が可能なように音価も表現した.また,人間とコンピュータ双方の可読性の両立させコンパクトに表現できるようにした.データ作成には,RWC 音楽データベース所収のクラシック曲 50 曲について,人手により機能和声解析してデータを作成した.そのデータを統計解析し,音楽的な知見から説明を試み,機能和声モデルが従来のモデルより工学的和声モデルとして優位であることを示す.We designed a new notation (called "KS notation") for harmony analysis, built a functional harmony analysis dataset and made statistical analyses on the data. Harmony (chord sequence) estimation is useful in many purposes including automatic music transcription and music information retrieval, while, from musicological viewpoint, harmony theory and rules are verified quantitatively using the data across periods, composers and styles may be investigated. For description of functional harmony analysis, the notation include chord, inversion, borrowed chord, omission, alteration, key modulation, additional notes, etc. and enables playing chords from the notation without the score by representing the note value. Readability was emphasized both for human and computer. The KS-notation dataset was built from 50 titles included in the RWC classical music database. New findings are discussed based on statistical analysis of the data and functional harmony model is shown to be advantageous over the conventional chord sequence model from the engineering point of view.
著者
吉井 和佳 後藤 真孝
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.20, pp.1-6, 2009-07-22
被引用文献数
1

本稿では,楽曲のライムライン上の適切な時刻に適切なコメントを自動付与するシステム MusicCommentator について述べる.近年,ユーザが動画全体に対してではなく,動画中のある時刻に対してコメントできるオンライン動画共有サービスが人気を博している.本研究では,音楽演奏の動画に含まれる音楽音響信号を対象とし,音響的特徴量とコメント特徴量との確率的同時生成モデルを提案する.システムはまず,多くの楽曲とそれに付与されたコメントから確率モデルを学習する.その後,別の楽曲が入力として与えられた場合に,どの時刻に対して,どのような単語を用いてどのくらいの長さのコメントを新たに付与できるかを確率モデルを用いて推定する.このとき,言語的制約として単語間の連接を考慮し,文の合成をおこなう.実験の結果,入力楽曲の音響的特徴量だけを用いてコメント生成した時に比べ,すでに付与されたコメントを参考にしてコメント生成を行うと精度が向上することがわかった.This paper presents a system called MusicCommentator that suggests suitable comments for appropriate temporal positions in a music clip. Recently, an online video sharing service in which users can provide comments for temporal events occurring in video clips not for entire clips has gained a lot of popularity. We focus on musical audio signals included in video clips of music performances and propose a probabilistic model that jointly generates acoustic features and comment features. The model can be trained by using many music clips and their corresponding comments. Given a new clip as input, the system then determines appropriate temporal positions of comments and estimates their content and length. Finally, comment sentences are generated by taking word concatenations into account as language constraints. Our experimental results showed that comment accuracy was improved when the system used not only acoustic features of an input clip but also users' comments in the clip.
著者
長谷川 裕記 前島 謙宣 森島 繁生
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.20, pp.1-6, 2011-07-20

本研究では動画に付随するアノテーション情報とユーザーが指定した情報に基き、画像に描写されているターゲット要素の特徴を機械学習することによって、データベース内の動画選択を行い音楽にマッチしたダンス動画を自動生成するシステムを構築した。画像内の輪郭特徴を表す特徴量、アノテーション情報を表す動画コンテンツに割り振られたタグ情報を用いて画像内容推定を行っており、先行研究より画像内の構図を考慮したダンス動画生成ができ、ユーザーがシステムを利用する際の自由度を上げる事が可能となった。This paper presents a system that automatically generates a dance video clip appropriate to music by segmenting and concatenating existing dance video clips. This system is based on machine learning for annotation and features of image. We create system can consider what object draw in the image, so user can control system more flexible than prior study. Because we use features express shape of object in image, and annotation attended videos in internet to guess what draw in the image.
著者
茂出木 敏雄
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.8, pp.1-6, 2009-10-26

既開発の音響信号から MIDI 符号に自動変換するツール 「オート符」 では、音声信号を与えると、標準的な MIDI 音源で近似的に音声を再現可能な MIDI データを生成できる。本ツールを応用して、日本語約 70 音節が単独に録音された音響信号を準備し、各々を MIDI コードに変換した音節 MIDI コードのデータベースを構築し、更に、各音節を子音部と母音部の MIDI コードに分離した 20 種の音素 MIDI コードのデータベースを構築した。本稿では、先ツールに対して時間分解能を改善する手法について提案し、カナテキスト入力により MIDI 楽器音を基本とした音声合成機能を実現するための音素 MIDI コードのデータベース設計ツールについての開発事例を報告する。Using our previously developed audio to MIDI code converter tool "Auto-F", from given vocal acoustic signals we can create MIDI data, which enable to playback the voice-like signals with a standard MIDI synthesizer. Applying this tool, we are constructing a MIDI database, which consists of previously converted simple structured MIDI codes for a set of Japanese syllable signals and also separated consonant and vowel phoneme signals. In this paper, we propose an improved MIDI converter tool which can produce temporally higher-resolution MIDI codes. And we propose a design tool of a set of phoneme MIDI-code database in order to realize a novel voice synthesizing system based on harmonically synthesizing musical sounds, which can generate MIDI data and playback voice signals with a MIDI synthesizer by giving Japanese plain (kana) texts.
著者
吉田 周平 星野 厚 浜中 雅俊
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.19, pp.1-6, 2010-07-21

本論文ではTwitterへの単旋律データの投稿と,これらを素材として再利用することで作曲を行うことのできるシステムについて述べる.素材の再利用によって作られた曲データは再びTwitterに投稿でき,また改編可能にすることで未完成状態での投稿や,作曲の過程を共有することができる.多くの作曲システムは一人で作曲することが前提のシステムとなっており,素材データの作成,共有という概念はなく,プロの作った素材を購入して使用するのが一般的となっていた.そこで我々はTwitterのつぶやきのような気軽さで旋律を投稿でき,ユーザー同士のつながりを生かした多人数参加型の作曲システムを設計することを考えた.具体的にはデータ形式としてMML(Music Macro Language)を採用することで,テキストで音楽を表現することを可能とした.そして素材の作成からTwitterへの投稿,投稿された素材を利用した作曲とその曲のTwitterへの投稿,さらに投稿された曲の改変までを統合的に行えるシステムを実装した.This paper describes a composing system, which can post a monophonic melody to Twitter and can create a song by the placement of the posted melodies as materials to Twitter. The post of an unfinished song and sharing the compositional process by allowing modifying. Most previous composing system were for single user and there were no concept of creating and sharing materials, and generally used to purchase a materials produced by professional. So we thought to design a composing system for remote people which can post a melody as simple as tweet at Twitter and use connections between users. We implemented a system using MML (Music Macro Language) data format which enables write a music in text format. We implemented the system which record a melody, post the melody to Twitter, create a music by using posted melodies, post the music to Twitter, and modify the posted music.
著者
平野 剛 木下 博
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.46, pp.1, 2015-05-16

12 名のプロ奏者を対象に,フレンチホルン演奏時のマウスピースを唇に押し付ける力を計測した.演奏する音が高いほど,マウスピースを唇に押し付ける力は強くなった.特に高い音を演奏した時のマウスピースを唇に押し付ける力は,個人間で 20N 以上の差が生じていた.これらの結果からマウスピースを唇に押し付ける力は,音の高さの制御に重要であることが示唆された.
著者
鈴木 久晴
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-115, no.6, pp.1-2, 2017-06-10

初学者の方向けに,音圧,粒子速度とインテンシティについて定義に触れ,測定方法について解説を行う.
著者
寺島 凌 阿部 由吾
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2022-MUS-134, no.44, pp.1-8, 2022-06-10

深層学習技術の発展により,機械によって自動生成される音楽の品質は日々向上している.特にシンボリック音楽生成の領域では,Transformer を活用することで長期の依存関係を考慮したメロディの生成が可能になっている.一方で,これらの音楽生成モデルを現実の用途や創作に活用するためには,生成される音楽の操作可能性と多様性が両立される必要がある.本研究では,指定されたコード進行に沿ったメロディを生成できる深層学習モデルを提案する.具体的には,Transformer を利用したメロディの自己回帰タスクにおいて,コード進行の情報を条件づけるような定式化を行う.加えて,生成結果の多様性を向上させるために VAE を導入し,潜在空間での操作を行う.実験では,指定されたコード進行と生成されたメロディの親和度を評価する.
著者
佃 洸摂 石田 啓介 濱崎 雅弘 後藤 真孝
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2021-MUS-132, no.15, pp.1-10, 2021-09-09

本稿では,人々が Web 上で集まって同じ瞬間に同じ楽曲を聴きながら,リアルタイムにコミュニケーションが取れる音楽発掘カフェ「Kiite Cafe」を提案する.この Web サービスでユーザが楽曲を聴取する体験は,(i)各ユーザの楽曲に対する「好き」という反応が可視化される,(ii)Kiite Cafe で再生される楽曲はユーザの好みの楽曲から選択される,という 2 つのアーキテクチャによって特徴づけられる.これらのアーキテクチャによって,ユーザは対面で一緒に楽曲を聴いているかのように,他のユーザとの社会的繋がりを感じたり,自分の好きな楽曲を他者に紹介する喜びを感じたりできる.さらに,Kiite Cafe のアーキテクチャによって(1)再生中の楽曲に対して「好き」を伝えることの動機づけ,(2)多様な楽曲を好きになる機会の獲得,(3)キュレータとしての貢献,という 3 つの体験がユーザにもたらされる.1,760 名の Kiite Cafe ユーザによる約 5 ヶ月間の行動を分析することで,これらの体験を通して生まれる,ユーザにとってポジティブな影響を定量的に示す.
著者
大谷 真
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2016-MUS-111, no.14, pp.1-4, 2016-05-14

音場の支配方程式である波動方程式から導かれる積分方程式に基づいて,ある空間における音場を異なる空間内で再現する音場再現が可能となる.本稿では,音場再現の理論的基盤について,初学者向けに解説する.
著者
呉 益明 Tristan Carsault 中村 栄太 吉井 和佳
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2019-MUS-124, no.5, pp.1-6, 2019-08-20

本稿では,正解コードラベル付きの音楽音響信号 (教師ありデータ) に加えて,ラベルが付与されていない音響信号 (教師なしデータ) を同時に利用するための,深層ニューラルネットワーク (DNN) に基づくコード推定法について述べる.従来の DNN に基づく識別的アプローチは,大量の教師ありデータを用いることで優れた推定精度を達成できるが,コードラベルの付与には多大な労力が必要であり,精度向上には限界があった.一方,隠れマルコフモデルなどの確率モデルに基づく生成的アプローチは,原理的に半教師あり学習が可能であるものの,モデルの表現力の貧弱さから,推定精度の面で劣っていた.これらの問題を解決するため,本研究では,高い表現力を持つ DNN に基づく深層生成モデルと,償却型変分推論法に基づく半教師あり学習法を提案する.具体的には,まず,コードラベル系列と音響テクスチャ系列を潜在変数とし,音響的特徴量を観測変数とする生成モデルを定式化する.観測変数が与えられた際に,潜在変数の事後分布を推定するため,音響的特徴量からコードラベル系列を推定する識別モデルと,音響的特徴量とコードラベル系列から音響テクスチャ系列を抽出する推論モデルを導入する.与えられた音楽音響信号に対して,教師ラベルの有無に関わらず,変分自己符号化器の枠組みでこれら三つの深層モデルを同時最適化することができる.実験の結果,教師なしデータに対しても,コードラベル情報と音響テクスチャ情報が適切に分離された表現学習を行うことができること,半教師あり学習を行った識別モデルが,教師ありデータのみで学習した識別モデルよりも高い認識精度を実現できることを確認した.
著者
尾関 日向 酒向 慎司
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2021-MUS-132, no.23, pp.1-5, 2021-09-09

ポピュラー音楽の制作では,マスタリングの際に曲の音量レベルを過剰に高めようとする傾向がみられる.しかし,このようにして作られたダイナミクスの小さな曲は,近年のリスニングスタイルに適していないことが多いと考えられる.そこで本研究では,ラウドなポピュラー楽曲のスペクトログラムからマスタリング前のラウドネスを推定することで,ダイナミクスの復元を目的とする.
著者
堤 彩香 平賀 譲
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014-MUS-105, no.5, pp.1-6, 2014-11-13

日本語には高低のアクセントが存在し,各単語はそれぞれのアクセント型を持つ.楽曲の歌詞を日本語という点から見たとき,日本語の持つ音や響きがメロディへ影響をもたらす可能性があると考え,その関係性について調べることにした.本研究では唱歌・童謡について歌詞を文節に区切りアクセント型別に分類し,詞のアクセントとメロディの関係を調査した.その結果,童謡・唱歌どちらにおいてもアクセントとメロディ上下の高い一致が見られた.
著者
吉田 祥 香山 瑞恵 池田 京子 山下 泰樹 伊東 一典 浅沼 和志
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-114, no.12, pp.1-6, 2017-02-20

本研究では,歌声の響きに関連する周波数特性の強度や割合の定量化を検討し,歌声評価指標として提案することを目的としている.これまでの研究で,心理的印象に影響を与える音響特徴量が歌唱指導により変化することが確認されている.また,この音響特徴量を評価するための声楽初学者に特化した歌唱評価指標を検討してきた.本稿では,これらの成果をふまえ,既提案指標の妥当性を再度検討した上で,声楽を専門に学ぶ特定個人の長期間での歌声変化解析への適用を試みる.その結果と声楽指導者の主観的評価との相違を考察した結果,声楽指導者の主観的評価と定量化した指標との相関が確認されたことから,歌声の習熟を評価する指標としての可能性を見出した成果について述べる.
著者
森勢 将雅
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2022-MUS-134, no.6, pp.1-6, 2022-06-10

現在の音声合成研究者が論文に Vocoder と記載するとき,その多くは Deep neural network (DNN) を用いて何らかのパラメータから高品質な音声波形を生成する Neural vocoder を指すのではないだろうか.もしそうであれば,音声符号化という役割ではなく,高品質な音声を合成したいという高品質 Vocoder が持つ『黄金の精神』が,Neural vocoder 世代に受け継がれたことを意味する.本稿では,恐らく今後失われていくであろう伝統的な Vocoder の波形生成部のアルゴリズム,および一連の知識がまだ音声研究において役立つかという将来展望について紹介する.
著者
寺尾 健太郎 川勝 真喜
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2022-MUS-134, no.40, pp.1-4, 2022-06-10

高周波音が豊富に含まれる音源がヒトにポジティブな影響を与えるハイパーソニック・エフェクトの発現する機構を調べるために,耳元以外に到達する高周波音の音圧レベルを変化させた場合の生理的影響を脳波 (α波) の測定から検討した.また,可聴音を知覚できない状態で音源を呈示した際の生理的影響を脳波 (α波) の増加の有無によって検討した.その結果,耳元の音圧レベルは変えずに耳元以外の音圧レベルを変化させることでα波パワーに違いが有意に見られた.また,ノイズキャンセリングイヤホンと音のマスキング効果を用いて,音を知覚できない状態で実験を行ったところ,α波パワーの増加が見られた.
著者
竹村 響 石田 真子 米澤 朋子
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2022-MUS-134, no.56, pp.1-9, 2022-06-10

音楽要素の一つである和音には「明るい-暗い」,「安定-不安定」などの感覚を催させる効果があるとされる.本研究では,ユーザと一緒に音楽を聴くエージェントの表情やしぐさによる共感的表現により,音楽を聴く楽しみとして他者との音楽感情の共感やそれによる音楽自体への没入などの効果を狙う.具体的には,和音から推定される,明るさと興奮の 2 軸の感情強度に基づき,顔表情が変化するエージェントシステムを実装した.今回はユーザの音楽経験の有無により,エージェントの表情表出強度,エージェントの溜め息表現がもたらすユーザのエージェントに対する共感度や印象,音楽の印象にどのような影響がみられるかを検証した.その結果,音楽経験者の方が非経験者と比較してエージェントの表情に共感しエージェントの喜怒哀楽を知覚する傾向や,溜め息表現により音楽を豊かに感じる傾向があることが確認された.
著者
池田 友和 大脇 渉 高橋 弘太
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-109, no.2, pp.1-6, 2015-10-31

スマートミキサーは,複数の入力信号を時間周波数平面に展開し,平面上の局所領域において非線形な混合処理を行うことで,使用者の優先させたい音を目立たせた混合出力を得ることのできる新しい音信号混合法である.従来のスマートミキサーは,音声と BGM の混合を対象とした局所的な処理であり,楽音同士の混合については検討されていなかった.本研究では,楽音同士の混合を対象として,スペクトルの全体構造に基づいた処理を行い,協和性理論を規範とし,調和の取れた混合出力を得るミキシング手法を提案する.提案手法でのミキシング結果を聴取実験と不協和度によって評価し,楽音同士の混合における,スペクトルの全体構造に基づいた処理の不協和感の緩和への有効性を確認した.その結果,440Hz 以下の半音音程の不協和な定常音について,不協和感の緩和効果があることが確認できた.