著者
新美 康永 小林 豊 浅見 俊幸 三木 豊
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.18, no.5, pp.p453-459, 1977-05-15
被引用文献数
2

This paper describes a highly predictive speech recognition system, developed as a voiceinput ptogramming system, in which a modified version of 'BASIC', named 'SPOKEN BASIC 1', is used. The system consists of four major components; acoustic processor, lexical matching procedure, syntactic processor and semantic processor. The acoustic processor transforms incoming speech signals into a sequence of labeled segments. The syntactic processor makes grammatical predictions using a left-to-right parsing scheme and a depth-first or a breadth-first tree search. The semantic processor refines those grammatical predictions and sends predicted words to the lexical matching procedure, which correlates them with the sequence of labeled segments. 142 sentences uttered by four male speakers were processed through the present system. It responded as follows: 116 sentences (81.7%) were correctly recognized, 19 (13.4%) incorrectly recognized and the others rejected.
著者
金森 務 片寄 晴弘 新美 康永 平井 宏 井口征士
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.36, no.1, pp.139-152, 1995-01-15
参考文献数
17
被引用文献数
13

本稿ではジャズセッションシステムのための音楽認識処理について述べる。ジャズセッションは、演奏者および聴取者がライブ演奏を楽しむために行われる音楽形態である。メロディー、ハーモニー、リズムなどを通じて、演奏者の意図の交換が行われている。我々はリアルタイムのノンバーバル・コミュニケーションの研究対象として、音楽セッションのモデル化とそのシステム化を行っている。音楽セッションにおける奏者間の伝達要素を機能的に、1)論理的制約:事前の打ち合わせや音楽理論によって全体の進行を方向づけるメッセージ、2)感性惰報:奏者の心理的な状態を示すメッセージでそれ自体は強い制約ではなく、応答については相手の性格に大きく委ねられるもの、に分類し、これらのメッセージの抽出機構と反応機構に墓づいたセッションシステムの構築を行っている。音楽近知覚という問題を一般性を特っていると思われる部分と個性による部分に分けることで、セッションシステムのユーザ・インタフェースという観点から扱いやすい形に整理した。また、音楽の情動を扱うための枠組みとして、音楽の期待感を扱う認識、分かった時点での喜ぴを扱う認識、マクロ的に情動を扱う認識の機構について述べる。システムはリアルタイムで動いており、音楽聴取部では筆者の一人である音楽家の実践的経験則をインプリメントしている。ここでは、昔楽聴取部についての実験結果を示した。