著者
宮本 賢一 亀岡 弘和 西本 卓也 小野 順貴 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.81, pp.155-160, 2007-08-03
参考文献数
11
被引用文献数
1

本稿では、調波構造・時間包絡の連続性・音色の類似性に基づいた音響エネルギーのクラスタリングによって、複数楽器音楽信号から、単音のクラスタリングと単音の教師なし音色クラスタリングを同時に実現する統合的な楽音分析手法HTTC(Harmonic-Temporal-Timbral Clustering)を提案し、問題の数理的な解法を論じる。また実際の楽曲を用いての実装実験を行ない、その性能について議論・考察する。In this article, we propose an algorithm to analyze multi-instrument polyphonic music signal named Harmonic-Temporal-Timbral Clustering (HTTC) via unified clustering of acoustic spectral energies based on similarities in harmonic, temporal and timbral characteristics. We also discuss the performance of the present algorithm tested in some experiments using a multi-instrument music consisting of two instruments.
著者
西本 卓也 渡辺 隆行
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.1, pp.209-220, 2011-01-01

視覚障害者のコンピュータ利用に適した超早口音声の音質を改善することが望まれている.しかし超早口音声の評価のためには,聞き手の慣れの効果の考慮が重要である.本研究では親密度を統制した超早口音声の聴取において(1)実験の途中での親密度条件の変化,(2)親密度に関する教示の有無,の要因が聞き手の課題への慣れに与える影響を検証した.約21モーラ/秒という超早口音声の聴取における了解度と心的負荷に着目した実験から,「慣れによって親密度が高いという自覚が促された場合に,特にトップダウン情報としての心的辞書へのアクセスが促進され,その結果として了解度が高くなり心的負荷が少なくなる」という仮説を支持する結果が得られた.
著者
諸岡 孟 西本 卓也 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.12, pp.77-82, 2008-02-09
被引用文献数
1

我々は,自動作編曲に向けた音楽の生成モデルの構築を目的とし,人間が和声学を習得して作曲編曲を行うのと同様に,「コンピュータのための和声学」の確立を目指して,確率文脈自由文法に基づく手法を検討中である.本稿では,前挿入音と後挿入音の組み合わせで非和声音を表現した手法の改良の一つとして,非和声音を和音と和声内音との関係性によって分類した結果を利用し,より音楽的な非和声音の扱いが可能となるような確率文脈自由文法に基づく音楽生成モデルおよびその解析手法を考案したので,報告する.今回は音楽生成モデルを自動和声解析問題に適用し,音楽生成モデルから和声と楽譜が同時に生成され,楽譜のみが観測される場合に,隠れている和声を求める逆問題を解く.We are investigating the harmony theory for computers based on PCFG (Probabilistic Context Free Grammar) to model the music generation process toward automatic music composition and arrangement, simulating humans composing and arranging music using knowledge of harmony theory. We pay special attention on non-harmonic notes, and propose a PCFG-based method for musicological treatment of various non-harmonic notes by classifying relations between the chord and non-harmonic notes to improve the former approach to represent non-harmonic notes as inserted notes before and after harmonic tones. We apply the music generation model to automatic harmony analysis by solving the inverse problem to find the hidden chord sequence that has generated the given music score through the music generation model.
著者
西本 卓也 西田 昌史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会誌 (ISSN:09135693)
巻号頁・発行日
vol.91, no.12, pp.1030-1035, 2008-12-01
被引用文献数
1

視覚障害者がインターネットを利用するための技術の現状,視覚障害者のための早口音声合成に関する研究,Webページを音声化する技術,漢字を見たことがない方のための仮名漢字変換技術などを紹介する.
著者
米田 隆一 西本 卓也 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.129, pp.31-36, 2005-12-23

本研究では、Standard MIDI File 楽譜等のシンボリックな音楽情報を入力として対旋律、和音、調等のラベルを付与する汎用的な手法を提案する。このような音楽のラベル付与問題は、音声認識における言語モデルとの類似性から、マルコフモデル、および生成モデルとしての HMM (hidden Markov models) を適用することが多かった。本研究でも確率モデルを踏襲するが、MIDI、楽譜などは、縦の和音、横の声部進行等、2次元的な情報であり、マルコフ連鎖のような一次元的なモデリングでは不十分である。このような背景のもと、より広いコンテキストを重視すべきであるという考えが生まれる。マルコフ確率場(Markov random field)モデルは、ノード間の関連をエッジであらわす一種の無向グラフモデルであり、エッジを設計することにより広いコンテキストを柔軟に設定できる。また、マルコフ確率場では我々の持つ音楽的知識を素性関数の設計(エッジの設計)という操作に還元することが可能、という利点を持つ。さらに、識別モデルであるという点でHMMとは異なり、可能なすべての出力系列を入力系列の条件付き確率として求めることができるという点で、条件付き確率場(conditional random fields)とも呼ばれる。本研究ではマルコフ確率場モデルに基いたさまざまな音楽情報処理に対するアプローチを論じる。本手法は汎用であり、応用範囲は多岐にわたるが、本稿では対旋律付け、和声付け、ドミナント定型句の同定、和声解析、調認識に対するアプローチを述べる。考えられる他の応用としては、リズム認識、楽曲のパージング、音楽情報検索など広範囲にわたる。This paper describes a Markov random field approach for labeling tasks such as key finding, automatic harmonization, and automatic counterpoint. Most of our previous work deal with these labeling problems using Markov models, and hidden Markov models as a generative model, analogous to language models of automatic speech recognition. This work follows our previous probabilistic approach. 1-dimensional Markov chain, however, cat not model large musical context like scores and SMFs(standard MIDI files) which have rich information in that chords and melodies spread 2-dimesionally. Thus the ability of dealing with large context is crutial in music modeling. Markov random field is a kind of undirected graphical models in which edges are regarded as relevances between nodes. The design of edges (feature functions) corresponds to our music knowledge in which nodes (symbols) have relevances with each other. Markov random field is also called as conditional random fields(CRFs) in that all possible output sequences have conditional probabilites given an input sequence. In other words, CRFs is a discriminative model. Although the proposed model can be applied to many purposes, this paper describes the approaches to five tasks: counterpoint, harmonization, dominant chunk detection, harmony analysis, and key finding. Other possible applications include rhythm recognition, musical parsing, and music information retrieval.