中村 勲 長沼 大介
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2002, no.14, pp.7-12, 2002-02-15

低音部のおよそ2 オクターブを除いて,一つの音符に3 本の弦が使われているので,弦の間のエネルギーの交換が響板を通して生じ,弦振動は非常に複雑になる.3 本弦の一本は一つの音符に正確に調律されているが,他は少し低めと少し高めに調律されている.3 本弦と響板の結合システムの振動特性を説明するために,一つのモデルを採用する.各弦は各部分振動に対応する共振回路で構成され,同様に響板も一定のインピーダンスを持つものと仮定する.ただ一つの部分振動についての最も単純化したバージョンは,響板抵抗で結合された3 つの共振回路によって表される.このモデルの計算は理論とコンピュータ実験で行われる.この結果は二段減衰の現象が観測され,更に余韻の包絡線は緩やかに振動することを示す.外側の2 本の弦は同相で振動するが,中央の弦とは逆相で振動する.響板に対する駆動力は音圧を表し,外側の弦と殆ど同相である.これらの結果は測定値と一致している.Since three strings are used for one note, except about two octave low notes, an exchange of energy among strings occurs through the soundboard, making the string vibration very complex. One of the three strings is in tune exactly to one note, and others are tuned a little lower and higher. A model is employed to explain the vibration characteristics of a coupling system of three strings and the soundboard. Each string is comprised of resonance circuits that correspond to each partial, and likewise, the soundboard is assumed to have a finite impedance. When the most simplified version of only one partial is considered, the equivalent circuit is expressed by the three resonant circuits coupled with the soundboard resistance. The computation of this model is performed theoretically as well as computer experimentally. The results show that a double decay phenomenon is observed and furthermore that the envelope of the after sound vibrates slowly. The outer two strings vibrate almost inphase, while the middle string vibrates anti-phase. The driving force for the soundboard as well as the sound pressure are almost in the same phase with the outer strings. These results agree with the measured values.
岡野真 一 青野 裕司 片寄 晴弘 井口 征士
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.1998, no.74, pp.67-73, 1998-08-07

本研究では,物理モデルに基づいた雨音の生成を目指している.以前より,一粒の雨滴が落下した際に発する音のサンプルを利用した,雨音全体を生成するためのモデル制作に取り組んできた.今回は,一粒の雨滴の音自身,特に傘の上に落下したときの音を物理モデルによって生成することを試みている.雨滴および傘といった個々の物体のモデルは質点・バネ・ダンパ系で構築している.特に,発音課程で雨滴に見られるような過渡的な崩壊を,バネ・ダンパの切断モデルによって表現することを試みている.雨滴の挙動・振動を特徴づける要素としては,雨滴の大きさ,落下速度,表面張力,空気抵抗があり,また傘は,傘の布地部分を2次元膜モデルとして近似を行っている.最終的な音情報は単一の質点の座標の連続的なシーケンスとして抽出することにより出力している.The aim of this research is the produce of the rain sound using the thechniques of physics based modelling. We have experimentally developed the framework model that prodeces rain sounds, though it uses sampling sounds of water drops. In this paper, we try to produce the sound of single rain drop falling on an umbrella by use of its physical model. A physical object, which is modelling rain drops and an umbrella, is assemblies of masses linked to others by springs and dampers. The modelling techniques we proposed can express transitional disintegration. The disintegration is caused by the breaks of the spring-damper links. Factors that fix the motion and vibration of the rain drops are size, speed, surface tension, and air resistance. The umbrella is an approximation to a membrance model. The sound finally aquired is received as a sequence of sucessives positions of sigle mass.
吉井 和佳 後藤 真孝 奥乃 博
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2003, no.127, pp.55-60, 2003-12-21

本稿では,実世界の音楽音響信号を対象としたドラムスの音源同定について述べる.このような音響信号に対してドラムスの音源同定を行う上での問題点は,曲ごとにドラムスの音色が大きく異なり,対象曲に使用されているドラムスの正確なテンプレートが事前に用意できないことである.我々は,この問題を解決するために,新しいテンプレート適応手法とテンプレートマッチング手法を提案する.まず,テンプレート適応手法を用いて,各ドラムごとに1つの基本テンプレートを,対象曲中に使用されているドラム音に適応させる.次に,距離尺度を改良したテンプレートマッチング手法を用いて,ドラムスの音源同定を行う.ポピュラー音楽を対象にした音源同定実験の結果,テンプレート適応により,バスドラムとスネアドラムの平均認識率が68%から85%まで改善された.This paper describes drum sound identification for real-world polyphonic musical audio signals. The most critical problem with drum sound identification is that acoustic features of drum sounds vary with each musical piece, and thus we cannot prepare their precise templates in advance. To solve this problem, we propose new template-adaptation and template-matching methods. The former method adapts a single base template model prepared for each drum sound to the corresponding drum sound appeared in the target musical piece. The latter method uses the distance measure that enables the adapted templates to be matched with the corresponding sounds in a mixture of them and other instruments. Experimental results showed that the average accuracy of identifying bass and snare drums in popular music is improved from around 68% to around 85% by the template adaptation.
片岡 靖景 伊東 一典 池田 操 中澤 達夫 米沢 義道 今関 義弘 橋本 昌己
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.1998, no.74, pp.23-30, 1998-08-07

近年、カラオケの普及により、一般の人が人前で歌う機会が増加しており、上手に歌いたいと練習に励む姿を見かける。また声楽を学ぶ人も自分の習熟度を客観的に評価したいと考えている。そこで本研究では、声楽経験の異なる被験者の歌声を分析して、音高と音長の精度、音量に着目した強弱記号の表現など、種々の歌唱情報を抽出して、習熟度の程度を伝える歌唱支援について検討したので報告する。In recent years, many average people have begun studying how to sing because, with the surge in popularity of Karaoke, they have many chances to sing in front of an audience. On the other hand, people who professionally study vocal music want to receive an objective evaluation of their singing. The instrumental assessment of singing development requires musically relevant stimuli which give accurate information about musical pitch, length of tone, loudness control and other vocal skills. In this paper, we propose a support system for singing evaluation based on the vocal analysis of subjects whose musical experience is markedly different.
佐藤孝三 小松 実 小山 善文 松崎 悟 神田 一伸
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2000, no.76, pp.37-42, 2000-08-05

このところ社会における高齢者福祉が強く叫ばれている。それと共に、障害者に対する福祉の意識も高まりを見せている。急成長を遂げてきたコンピュータを用いた情報化技術を福祉の分野に応用しようとする試みも多く見られるようになってきた。障害者に対する情報提供に情報機器は不可欠であるが、中でも視覚障害者の社会参加を支援するシステムは、点字を応用した技術が基礎となっている。ここでは、開発中の視覚障害者への音楽情報の提供、音楽情報の発信を指向した点字楽譜作成システム「Braille MUSIC Sheet System」の概要について述べる。In recent years, the vitalization of a getting aged welfare is strongly expected as a social problem. Simultaneously, consciousness of welfare against a handicapped person also has been increased. Applications of information technology to welfare fields have been developed rapidly. The information processing devices are indispensable for an information supply against a vision handicapped person. For a system to support a social participation of a vision handicapped parson, the technology to deal Braille becomes the main theme of this fields. In this article, we describe about the Braille score making system (Braille MUSIC Sheet System) that can dispatch a supply and transmit the information of music to a vision handicapped person. We can get Braille output by Braille printer with this system, as converting a score into Braille code.
村瀬 邦子
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.1998, no.14, pp.85-92, 1998-02-13

聴覚訓練機器電子耳を使って、英語、仏語、独語、米語、日本語を母国語とする被験者たちに同5つの言語パラメータをそれぞれに与え、英語を発声する時の知覚や印象、また英語の5通りの聴き取り方による受聴知覚および好みを調べ、母国語がどのように影響を与えるかを調べた。その結果、英語の発声に関しては、イギリス人、アメリカ人、ドイツ人など、高周波成分を含む言語を母国語とする在日外国人は日本語または仏語の言語パラメータでの発声が楽で、中・低周波音域の言語を母国語とするフランス人および日本人は英・米語のパラメータが容易であった。英語の受聴に関しては、在日年数の少ない外国人を除いてすべての被験者が仏語と日本語のパラメータを好んだ。With the Electronic Ear (listening training machine), we tested sound perception and the feelings of subjects from five different nationalities during English reading, then English listening, giving them parameters of English, French, Dutch, American, and Japanese languages. Given the results, English, American and Dutch subjects (residents in Japan), high pass band languages, preferred when reading, French and Japanese parameters, low pass band languages. French and Japanese subjects preferred English and American parameters; they claimed it was easier to read. For English listening, all resident subjects preferred low pass band parameters (French and Japanese languages).
中村 勲 井戸川 徹 田口 友康 永井 洋平 永井 啓之亮 足立 整治
vol.1998, no.14, pp.1-12, 1998-02-13

音楽音響国際シンポジウム97(SMA'9)は1997年8月19日から22日まで、エジンバラ大学(エジンバラ、スコットランド)で開催された。会議は英国音響学会、Catgut音響学会とヨーロッパ音響学連合が共同して組織した。8月22日には古楽器に関する音響と技術について、Galpin学会と合同の幾つかのセッションが開催された。音楽音響のあらゆる分野にわたって、凡そ100篇の招待論文と投稿論文が発表された。この会議の概要と、大部分の発表論文についての要旨を報告する。The International Symposium on Musical Acoustics 1997 (ISMA'97) took place at The University of Edinburgh, Edinburgh, Scotland on 19-22 August 1997. The meeting was organized in association with the Institution of Acoustics (UK), the Catgut Acoustical Society and the European Acoustical Association. On August 22, several joint sessions were held with the Galpin Society on Historical Musical Instrument Acoustics and Technology. About 100 invited and contributed papers were presented, covering all areas of musical acoustics. An outline of this meeting and each abstract of almodt presented papers are reported.
畝見 達夫 仙田 学
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2002, no.40, pp.133-138, 2002-05-18

模擬育種法に基づく作曲支援システムの設計について述べる.Sbeat2 と名付けられた我々のプロトタイプシステムでは,育種の単位である個体をソロ楽器5パート,ピアノ,ドラムス,パーカッションの計8パートからなる16拍の小節に対応させる.遺伝情報からある種の再帰アルゴリズムを用いて旋律を生成する.画面に譜面の形式で表示された個体の中から気にいったものを選択し,音を確認し次世代集団を生成するための親とする.親の遺伝子に突然変異と交叉を加え子孫の遺伝情報を構成する.この世代交代をくり返すことによってユーザは徐々に気に入った音楽を得ることができる.テンポや音色など領域固有の操作機能を埋め込むことによって,初心者が簡単に気にいった音楽を作るための支援ツールを構成することができる.This paper presents a design of support system for musical composition based on Simulated Breeding. In our prototype system named Sbeat2, each individual in the population is a bar of sixteen beats including eight parts, five solos, piano, drums, and percussion. The melody is generated by a type of recursive algorithm from genetic information. By selecting favorite pieces among scores displayed on the screen, the user certifies the sounds and selects them as parents for reproduction. The genetic codes of children are generated through mutation and crossover. Iterating this process, the user obtains better pieces gradually. Embedding some domain specific functions, such as changing tempo and selecting tones, we can build a useful tool to make it easier for a beginner to compose his/her favorite musical pieces.
諸岡 孟 西本 卓也 嵯峨山 茂樹
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2008, no.12, pp.77-82, 2008-02-09

我々は,自動作編曲に向けた音楽の生成モデルの構築を目的とし,人間が和声学を習得して作曲編曲を行うのと同様に,「コンピュータのための和声学」の確立を目指して,確率文脈自由文法に基づく手法を検討中である.本稿では,前挿入音と後挿入音の組み合わせで非和声音を表現した手法の改良の一つとして,非和声音を和音と和声内音との関係性によって分類した結果を利用し,より音楽的な非和声音の扱いが可能となるような確率文脈自由文法に基づく音楽生成モデルおよびその解析手法を考案したので,報告する.今回は音楽生成モデルを自動和声解析問題に適用し,音楽生成モデルから和声と楽譜が同時に生成され,楽譜のみが観測される場合に,隠れている和声を求める逆問題を解く.We are investigating the harmony theory for computers based on PCFG (Probabilistic Context Free Grammar) to model the music generation process toward automatic music composition and arrangement, simulating humans composing and arranging music using knowledge of harmony theory. We pay special attention on non-harmonic notes, and propose a PCFG-based method for musicological treatment of various non-harmonic notes by classifying relations between the chord and non-harmonic notes to improve the former approach to represent non-harmonic notes as inserted notes before and after harmonic tones. We apply the music generation model to automatic harmony analysis by solving the inverse problem to find the hidden chord sequence that has generated the given music score through the music generation model.
浜中 雅俊 李昇姫
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2006, no.19, pp.23-29, 2006-02-23

本研究報告では,初心者が音楽を能動的に楽しめるようにすることを目指し,直感的な換作で複数パートのミキシングが変更できるヘッドフォンを提案する.従来の音楽用ミキサーは煩雑で,音楽初心者が複数パートのボリュームや定位を適切に変更することが困難であった.そこで本研究では,ヘッドフォンに搭載した3種類のセンサで,首を上下左右に振ったり耳を澄ませるポーズをするなど,人間が音を聴くときにする自然な動作を検出し,それをミキサーのコントロールに反映させることで直感的な操作によるミキシングを実現する.In this report, we propose a headphone device which can control an audio mixer by natural behavioral mamipulation, in order to enjoy music for musical novices. A commercial audio mixer is too complicated for musical novices to control multi-channel volumes and panpots properly. Our headphone device can control an audio mixer using three kinds of sensors mounting on the headphone which detect natural movement when he/she listening to a music.
竹井 将紫 中村 俊介
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2007, no.37, pp.105-107, 2007-05-11

本稿では,身体の動きを音楽と映像に変える『神楽-KaGuRa-』を応用した合奏システムを提案する.コンセプトは「ヒトとヒトとの協調性」であり,以下3つの小テーマを持 つものである.(1)体験者同士が互いの存在を直接的に意識できること(2)体験者同士が協調しながら身体を動かすことで音楽が生成されること(3)体験者同士の掛け 合いがコンテンツ内容の展開に反映されることThis paper reports the ensemble system that applies "KaGuRa" that changes a motion of the body into audio and visual. The concept is "The player's cooperation", and the one with three small themes hereafter. (1) The player should be able to consider existence each other immediately mutually. (2) Music must be generated with the movement of the player of his body mutually cooperating. (3) Player's negotiation must be reflected in progressing of content.
中山 一郎 天野 文雄 上畠 力 河内 厚郎 小島 美子 小林 範子 杉藤 美代子 高木 浩志 柳田 益造
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.1998, no.14, pp.93-100, 1998-02-13

本稿は、筆者らが遂行している、日本語の歌唱表現法に関する学際的研究の紹介である。日本語を洋楽的唱法で歌唱する場合、日本語としてのニュアンスや自然さが失われ、"何を言っているのか解らない"という深刻な事態を招いている。その克服には、古来、日本語の扱いに工夫を重ねて発展してきた伝統芸能(広義の邦楽)との歌唱表現法の比較が不可欠であると考えられるが、そのための方法論すら無い現状である。本研究は、共通の歌詞を、多数の人間国宝を含む、各ジャンルにおける最高クラスの演者に"歌い分け"を行わせ、得られた高品質の音声試料を音響分析することにより、邦楽と洋楽における歌唱表現法の普遍的な差異、及び同一性を科学的に明らかにすることを目的とする。本稿では、研究の具体的な方法論、予想される結果、及び研究の展望について述べる。This article is the review of the interdisciplinary study, having been performed, on a comparison of vocal expressions in Japanese traditional and western classical-style singing, using a common verse. When the Japanese language is sung in western classical-style, the natural qualities and nuances are frequently lost and the lyrics may be difficult to comprehend. In order to resolve the problems, an important first step would be to examine Japanese traditional singing, with its rich linguistic historical and cultural base, and then compare it to western-style vocalization. In the present study performed, a common verse is sung by a number of professional artists, through which the acoustic features of vocal expression in various traditional Japanese arts will be elucidated and compared to a western approach.
片寄 晴弘 竹内 好宏
vol.1994, no.71, pp.15-22, 1994-08-06

音楽学,あるいは音楽心理学の分野では,従来,主観的に説明されていた音楽解釈,音楽構造認知を客観的な視点からしようという研究が行われている.これらの取り組みは音楽情報処理,特に自動演奏システムにおいて参考にすべき取り組みであるが,残念ながら良く知られていない.また,客観的な視点といっても,ある意味で人間の主観的な理解を前提にしているため,コンピューテーショナルモデルとして利用する際には,使うための枠組みを立てた上で,主観処理部をモデル化しなければならない.本稿では演奏解釈・音楽構造認知理論を比較し,コンピューテーショナルモデルとして利用する際のメリットと解決すべき課題を整理する.In the field of Musicology and Music Cognition, recent researchers have been trying to make an objective model of music interpretation or structural analysis, which has been historically studied in a subjective manner. Computer scientists in music field, especially who try to construct an automatic performance system, should refer and consider these theories. These theories, however, are not well known. They are not fully computational, because the aim is to give human an understandable view. This paper describes some comparison of proposed theories and discusses merits and demerits to apply them in making computational models.
米田 隆一 西本 卓也 嵯峨山 茂樹
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2005, no.129, pp.31-36, 2005-12-23

本研究では、Standard MIDI File 楽譜等のシンボリックな音楽情報を入力として対旋律、和音、調等のラベルを付与する汎用的な手法を提案する。このような音楽のラベル付与問題は、音声認識における言語モデルとの類似性から、マルコフモデル、および生成モデルとしての HMM (hidden Markov models) を適用することが多かった。本研究でも確率モデルを踏襲するが、MIDI、楽譜などは、縦の和音、横の声部進行等、2次元的な情報であり、マルコフ連鎖のような一次元的なモデリングでは不十分である。このような背景のもと、より広いコンテキストを重視すべきであるという考えが生まれる。マルコフ確率場(Markov random field)モデルは、ノード間の関連をエッジであらわす一種の無向グラフモデルであり、エッジを設計することにより広いコンテキストを柔軟に設定できる。また、マルコフ確率場では我々の持つ音楽的知識を素性関数の設計(エッジの設計)という操作に還元することが可能、という利点を持つ。さらに、識別モデルであるという点でHMMとは異なり、可能なすべての出力系列を入力系列の条件付き確率として求めることができるという点で、条件付き確率場(conditional random fields)とも呼ばれる。本研究ではマルコフ確率場モデルに基いたさまざまな音楽情報処理に対するアプローチを論じる。本手法は汎用であり、応用範囲は多岐にわたるが、本稿では対旋律付け、和声付け、ドミナント定型句の同定、和声解析、調認識に対するアプローチを述べる。考えられる他の応用としては、リズム認識、楽曲のパージング、音楽情報検索など広範囲にわたる。This paper describes a Markov random field approach for labeling tasks such as key finding, automatic harmonization, and automatic counterpoint. Most of our previous work deal with these labeling problems using Markov models, and hidden Markov models as a generative model, analogous to language models of automatic speech recognition. This work follows our previous probabilistic approach. 1-dimensional Markov chain, however, cat not model large musical context like scores and SMFs(standard MIDI files) which have rich information in that chords and melodies spread 2-dimesionally. Thus the ability of dealing with large context is crutial in music modeling. Markov random field is a kind of undirected graphical models in which edges are regarded as relevances between nodes. The design of edges (feature functions) corresponds to our music knowledge in which nodes (symbols) have relevances with each other. Markov random field is also called as conditional random fields(CRFs) in that all possible output sequences have conditional probabilites given an input sequence. In other words, CRFs is a discriminative model. Although the proposed model can be applied to many purposes, this paper describes the approaches to five tasks: counterpoint, harmonization, dominant chunk detection, harmony analysis, and key finding. Other possible applications include rhythm recognition, musical parsing, and music information retrieval.
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2008, no.127, pp.7-9, 2008-12-12

インターネットを利用して作曲者と楽曲の情報を呼び出し、聴覚的な情報 (MIDI) や視覚的な情報 (FFT アナライザ) を表示させ、演奏家の演奏の支援となるデータベースを作成した.HTML と簡単な Java Script だけで実現させている.このデータベースにより演奏者が効率的に情報を得ることが出来,必要な情報の収集が容易となる.又,データベースソフトを用いていないので,データの変更や書き換えは HTML のタグを理解していれば簡単に出来る.I created database the information on a musical piece. It was called with the composer using the Internet, hearing information (MIDI) and visual information (FFT analyzer) were displayed, and the database used as support of a performance of a player was produced. It is made to only by HTML and easy JavaScript. A player can acquire information efficiently with this database, and collection of required information becomes easy. Moreover, since database software is not used, change of data and rewriting can be simply performed, if you understand the HTML tag.
中山 一郎 岡田 稔枝 中川 みかほ
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.1999, no.16, pp.5-8, 1999-02-18

これまで筆者らは、発声時に発声者自身が聴取する音声(自己聴取音)の音色を、自己聴取音に相当する音声を発声者がイコライザとアッテネータを操作して、自己聴取音と出来るだけ似かよった音声(シミュレート音)を作成する方法(遅延音帰還法)を用いて、周波数軸上で定量化してきた。しかしながら、自己聴取音は発声者本人しか聴取できないが故に、シミュレート音との類似性を客観的には評価できなかった。そこで本研究では、男性の話し声の母音/a/を対象に、1)自己聴取音とシミュレート音、及び、2)シミュレート音とその音色を実験者が意図的に変化させて作成した音声(加工音)、との2種類の類似度評価実験を行うことによって、自己聴取音とシミュレート音の類似性が原理的には客観的に評価できること、及びその類似性が十分に高いことを明らかにした。What sort of voice timbre do we perceive in autophonic production, hearing our own voice during phonation, and can we measure the timbre itself quantitatively? The authors have showed that the timbre can be examined quantitatively as a function of frequency using a delayed feedback method created by the author, in which a sound was generated by the subjects themselves so as to simulate the sound through a loud-speaker as accurately as possible in its timbre and loudness to the sound perceived during phonation. However, the judgement of similarity of voice timbre between the perceived and the simulated sounds was left to the subjects themselves, not objectively, because the voice timbre in autophonic production cannot be examined by anyone other than the speaker oneself. The purpose of the present study is to show a method to evaluate the similarity between the simulated and perceived sounds objectively. When male subjects phonated a vowel/a/ in the spoken mode. Two similarity judgement tests were conducted, one (TestA) between the perceived and the simulated ones, and the other (TestB) between the simulated and the processing sounds, with an amplitude of a frequency band of the simulated sound altered, using the same criterion of the judgement of the similarity as in TestA. Through these tests, it was found objectively that the similarity between the simulated and perceived sounds was fairly well.
坪井 邦明 松島 俊明 鈴木 孝 田中 多佳子 志村哲
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.1998, no.47, pp.29-36, 1998-05-27

音楽学分野での研究を目的としたコンピュータの応用例として,次の4例を紹介する.(1)尺八譜の処理システム(尺八譜の入力・編集などを行なうシステム),(2)楽器データベース(東京藝大音楽学部小泉文夫記念資料室所蔵楽器のデータベース),(3)インド採録曲データベース(インドの宗教歌謡研究のためのフィールドワーク資料のデータベース),(4)尺八研究史料データベース(尺八関係フィールドワーク資料のマルチメディア・データベース).Four experimenting with computers as tools for musicological studies are demonstrated; (1) Information Processing System for Shakuhachi Tablature, (2) Musical Instrument Database, (3) Sound Recording Database of Indian Music, (4) Constructing Multi-media Database of the Research Data Collected in the Field work for the Syakuhati Studies.
村上 恭子 伊豫 美由紀 白石 有佳
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2000, no.76, pp.43-48, 2000-08-05

楽譜専用の点字エディタ"B'Score(びーすこあ)"の開発を行ってきた。ユーザは点字を、キーボードで6点入力、またはツールバー上のボタンで楽譜の記号を選んで入力し、編集することができる。またこのソフトは点字楽譜の規則に則して入力エラーを検出し、エラー箇所とその理由を指摘することができる。点字の知識がないユーザに点字楽譜について解説するチュートリアルもついている。今後は、ユーザに適切なエラーメッセージを抽出する機能、辞書や点字→五線譜変換規則の拡充を行っていく必要がある。We have developed a Braille editor for music score called "B'Score". Two Braille input methods are supported. One is 6-points input on keyboard, another is music symbols on tool-bar buttons. This software detects the input errors and notifies the users of the error column and the reason why it is incorrect. By reading the tutorial in this software, the users who have no knowledge of Braille music score can learn about it. In future, we will find the methods to pick up the most suitable error messages for the situations so that the users can correct the errors quickly.
多田 幸生 西本 一志 前川 督雌 間瀬 健二 中津 良平
vol.2000, no.94, pp.1-8, 2000-10-12

本稿では、無線通信機能を持ち、かつ身につけて移動しながら演奏できるような装着型の楽器を提案する。これは、複数の楽器を通信機能を用いて接続することで、場所や相手に囚われない自由なセッションを可能にし、新しい楽器演奏のシチュエーションを生成するものである。また、装着した楽器から自分の音楽の嗜好や気に入ったフレーズを発信する事で、セッション相手を自動的に探すことはもちろん、音楽による自分自身の演出をも行うことができる。さらに、本楽器から発信されるフレーズを蓄積するサーバーを町中に設置し、その町に訪れる人が無意識のうちにその町の音楽を創造することで、その町自体を演出することも可能とする。In this paper, we propose a novel wearable and mobile musical instrument that is equipped with communication facility. This instrument allows people to perform a session anywhere and with anyone. This instrument also can scatter information of the performer's taste of music as well as his/her favorite phrases within the restricetd area around her/him. Thus, this instrument automatically looks for performers with whom s/he can perform a session on street. Additionally, the performer can direct himself/herself with the scattering music like dress. Furthermore, a town can be directed by putting a server that collects phrases scattered by the instruments and scatters the collected phrases at a square. We believe that this instrument creates a new musical culture.
藤原弘将 後藤 真孝 緒方 淳 駒谷 和範 尾形 哲也 奥乃 博
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2006, no.90, pp.37-44, 2006-08-07

本稿では,伴奏音を含む音楽音響信号と対応する歌詞の時間的な対応付け手法について述べる.クリーンな音声信号とその発話内容の時間的対応付けを推定をするViterbi アラインメント手法はこれまでも存在したが,歌声と同時に演奏される伴奏音の悪影響で市販 CD 中の歌声には適用できなかった.本稿では,この問題を解決するため,歌声の調波構造を抽出・再合成することで混合音中の歌声を分離する手法,歌声・非歌声状態を行き来する隠れマルコフモデル (HMM)を用いた歌声区間検出手法,音響モデルを分離歌声に適応させることで Viterbi アラインメントを適用する手法を提案する.日本語のポピュラー音楽を用いた評価実験を行い,本手法により10曲中8曲について十分な精度で音楽と歌詞の対応付けが出来ることを確かめた.This paper describes a method that can automatically synchronize between polyphonic musical audio signals and corresponding lyrics. Although there were methods that can synchronize between monophonic speech signals and corresponding text transcriptions by using Viterbi alignment techniques, they cannot be applied to vocals in CD recordings because accompaniment sounds often overlap with vocals. To align lyrics with such vocals, we therefore developed three methods: a method for segregating vocals from polyphonic sound mixtures by extracting and resynthesizing the vocal melody, a method for detecting vocal sections using a Hidden Markov Model (HMM) that transitions back and forth between vocal and non-vocal state, and a method for adapting a speech-recognizer phone model to segregated vocal signals. Experimental results for 10 Japanese popular-music songs showed that our system can synchronize between music and lyrics with satisfactory accuracy for 8 songs.