著者
魏 回 北村 正 岩田 彰 鈴村 宣夫
出版者
電子情報通信学会情報・システムソサイエティ
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers (ISSN:09151923)
巻号頁・発行日
vol.75, no.4, pp.689-696, 1992-04-25
被引用文献数
4

多数のカテゴリーを分類する一つの手法として,我々は大規模ニューラルネット(CombNET-II)を提案した.これは,前段に入力ベクトルを大分類するためのベクトル量子化型ニューラルネットを配置し,後段にグループ内のデータを細分類するための階層ニューラルネットを配置した.くし型の構成をしている.本論文では,CombNET-IIを用いる大語いの音声認識手法を提案し,この方法を中国語の単語音声認識に適用し,その有用性について検討する.音声信号から2次元メルケプストラム法によって求められる特徴量をCombNET-IIの入力に用いる.2次元メルケプストラムは音声の静的特徴と動的特徴を同時に分析でき,音声認識には有効なパラメータである.今回の音声認識実験では,特定話者が中国語で発声した世界の国名と都市名1000単語を用いた,各単語を5回ずつ発声し,この中の4回分のデータで学習を行い,残りの1回分のデータを認識させたところ,99.0%の認識率が得られ,本方法の有効性が示された.
著者
酒向慎司 才野 慶二郎 南角 吉彦 徳田 恵一 北村 正
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.12, pp.39-44, 2008-02-08
被引用文献数
2

声質や歌唱法など歌い手の特徴を歌声データと楽譜から自動学習し,それらを再現するような歌声合成システムについて述べる.本システムでは,歌い手の声質とピッチに関する特徴を確率モデルによる統一的な枠組みでモデル化している.特に,リズムやメロディといった音楽特有の表現要素が,音声信号のスペクトルや基本周波数パターンの変動に大きく関係していることから,楽譜から得られる音階や音長などを考慮したモデル化を行い,楽譜と歌詞を入力として,個人性を備えた歌声を合成するシステムを構築してきた.本手法の特徴は,このような歌声合成モデルを楽譜と歌声データから自動学習できることにある.本報告では,音楽固有のコンテキストの導入,実際の歌声データと楽譜の音符列の間のずれに着目した時間構造モデルについて検討する.実験では,童謡60曲の男性1名の歌声データを用いた歌声合成システムを構成し,ずれモデルの導入による自然性の向上が確認できた.We describe a trainable singing voice synthesis system, that can automatically learns the model parameters from singing voice waveform and musical scores by applying HMM-based speech synthesis technique. In this system, a sequence of spectrum and fundamental freqency (F0) are modeled simultaneously in a unified framework of HMM, and context dependent HMMs are constructed by taking account of contextual factors that affects singing voice. In addition, the distributions for spectral and F0 parameter are clustered independently by using a decision-tree based context clustering technique. Synthetic singing voice is generated from HMMs themselves by using parameter generation algorithm. We introduced an additional "time-lag" model to control start timing of each musical note. In the experiments, we confirmed that smooth and natural-sounding singing voice is synthesized. It is also maintains the characteristics and personality of the donor of the singing voice data for HMM training.
著者
山本 龍一 酒向 慎司 北村 正
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-96, no.13, pp.1-6, 2012-08-02

本稿では,楽譜に基づく音楽音響信号から,演奏位置とテンポを推定する問題について論じる.隠れセミマルコフモデル (HSMM) に基づく演奏位置推定と,線形動的システム (LDS) に基づくテンポ推定を組み合わせることで,入力信号の未来の情報が使えない制約の元で効果を発揮する実時間拍予測アルゴリズムを提案する.具体的には,遅延を許容して信頼性のある演奏位置を推定し,テンポを用いて現在位置を予測する.クラシック音楽およびジャズ音楽データベースを用いてオンセット検出に関する評価実験を行った結果,提案する実時間拍予測アルゴリズムを用いることで,許容誤差 300ms において約 15% 精度が向上することが確認された.
著者
河合彬弘 酒向慎司 北村正
雑誌
研究報告エンタテインメントコンピューティング(EC)
巻号頁・発行日
vol.2013-EC-27, no.14, pp.1-6, 2013-03-08

本研究では,合唱を構成する複数の歌声パートを対象とした多重音高推定を扱う.合唱には歌声パートが調和を保ちながら進行していく特有の性質があり,その性質を利用した手法を提案する.本研究では,調和の要素として歌声パート間の音高の調和と,拍位置における音高変化の有無の同期の 2 つを考える.提案法は,フレームごとのピッチ候補からパート別音高軌跡候補を構成するステップと,候補から考えられる組み合わせの中から歌声パート間の調和を考慮した最良なものを選出するステップに分けられる.実験結果から,比較的推定の困難な部分では,パート間の調和を考慮することで若干の推定精度改善が見られた.
著者
吉村 貴克 徳田 恵一 益子 貴史 小林 隆夫 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2099-2107, 2000-11-25
被引用文献数
92

本論文では, HMMに基づく音声合成において, スペクトル, ピッチ, 継続長をHMMの枠組みで統一的にモデル化する手法について述べる.本システムでは, スペクトル・ピッチ継続長モデルとして, それぞれ連続分布HMM, 多空間確率分布HMM(MSD-HMM), 多次元ガウス分布を用い, 音素環境, アクセント, 品調などのコンテクストを考慮したコンテクスト依存モデルを構築する.コンテクスト依存モデルは, 決定木に基づくコンテクストクラスタリング手法によりクラスタリングされる.決定木構築の際, 節分割はMDL基準により行う.このこめ, 新たにMSD-HMMに対するMDL基準によるコンテクストクラスタリング手法を導出している.音声合成実験において, 自然性の高い合成音声が得られること, 更に自動学習によりシステムを構築可能であることを認識した.
著者
香川 敬生 野口 竜也 赤澤 隆士 小林 明夫 北村 正志
出版者
鳥取大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

2007年10月より緊急地震速報が運用され,他にもP波センサーが機器の緊急停止に用いられ,計測震度計で得られた各地の震度が速報されている。しかし,これらは独立に設置・運用されており,有機的かつ総合的な活用には至っていない。そこで,市販の計測震度計に緊急地震速報受信およびP波センサーの機能を付加することでP波センサーによる推定震度,緊急地震速報を用いたその場所の予測震度,実際の揺れによる計測震度を出力する「三段階震度計」を試作し,その活用方法の検討をおこなった。
著者
村戸 ドール 樋口 明弘 北村 正敬
出版者
慶應義塾大学
雑誌
基盤研究(C)
巻号頁・発行日
2009

喫煙は多くの疾患や健康被害の原因や増悪因子として考えられており、特に肺における閉塞性肺疾患や肺癌などの影響がよく知られている。眼表面は肺と同じくタバコの煙を含め外界からの影響を受けている。シトクロムP450(CYP)酵素系は眼表面に存在し、外因子に伴う障害を防ぐ作用も知られているがCYP1A1およびCYP2A6系は肺癌発症に関係することも報告されている。我々は6週齢雄SDラットをチャンバー内に入れ、シリンジを用いてチャンバー内に主流煙を添加することにより曝露した。暴露後、フルオレセイン染色液を用いて蛍光染色法により角膜障害を、綿糸法により涙液量を測定した。次に角膜および涙腺を摘出し、シトクロムP450(P450) 1A1, P4501B1および2B2のmRNA発現変動をリアルタイムPCR法により測定した。タバコ煙暴露ラットは角膜上皮障害が生じ、涙液量の著名な低下が認められた。角膜の免疫染色において角膜上皮障害を示すCYP1A1および8-hydroxy-2'-deoxyguanosineの酸化ストレスにより発現が上昇することが認められた。これらの結果は喫煙が角膜だけでなく涙腺にも影響したことを示唆する。
著者
全 炳河 徳田 恵一 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.8, pp.1593-1602, 2004-08-01
被引用文献数
1

近年,連続音声認識システムにおける音響モデルとして,前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている.音素コンテクスト依存隠れマルコフモデルを利用する場合,総モデル数が増加し,システムが非常に多くの自由パラメータを含むことになるため,統計的に信頼できるパラメータを推定することが困難になる.このため,様々なパラメータ共有手法が提案されており,中でも音素決定木に基づく状態共有法は,優れた解決法の一つである.しかし,状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため,各特徴量に対し,異なる共有構造を構築できない,適切なパラメータ数を割当てることができない,といった問題点がある.本論文では,記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した,音素・次元決定木を提案する.更に,状態位置に関する分割条件を加え,音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する.不特定話者連続音声認識実験の結果,提案法は従来の音素決定木に基づく状態共有法と比較して13〜15%誤り率を削減することが示された.
著者
北村 正樹
出版者
耳鼻咽喉科展望会
雑誌
耳鼻咽喉科展望 (ISSN:03869687)
巻号頁・発行日
vol.40, no.1, pp.109-112, 1997-02-15 (Released:2011-08-16)
参考文献数
7
被引用文献数
1
著者
酒向慎司 宮島千代美;徳田恵一 北村正
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.3, pp.719-727, 2004-03-15

隠れマルコフモデルに基づく音声合成方式を歌声合成に拡張することにより構築した歌声合成システムについて述べる.本システムでは,歌い手の声の質と基本周波数パターンに関する特徴をモデル化するため,スペクトルと基本周波数パターンをHMMにより同時にモデル化している.特に,自然な歌声を合成するうえで重要な要素となる音符の音階や音長の基本周波数パターンへの影響を精度良くモデル化するため,楽譜から得られる音階と音長を考慮したコンテキスト依存モデルを構築している.これらのモデルに対して決定木によるコンテキストクラスタリングを行うことで,未知の楽曲からの歌声合成が可能となっている.実験から,歌い手の特徴を再現し歌声の合成が可能であることを示す.
著者
北村 正樹 景山 茂
出版者
耳鼻咽喉科展望会
雑誌
耳鼻咽喉科展望 (ISSN:03869687)
巻号頁・発行日
vol.39, no.6, pp.688-692, 1996-12-15 (Released:2011-08-10)
参考文献数
4
著者
髙島 愼助 北村 正幸
出版者
四日市大学
雑誌
四日市大学論集 (ISSN:13405543)
巻号頁・発行日
vol.21, no.2, pp.99-115, 2009 (Released:2019-08-30)
参考文献数
42
著者
北村 正樹
出版者
耳鼻咽喉科展望会
雑誌
耳鼻咽喉科展望 (ISSN:03869687)
巻号頁・発行日
vol.58, no.4, pp.229-232, 2015-08-15 (Released:2016-08-15)
参考文献数
4
著者
長田 若奈 酒向 慎司 北村 正
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. EC, エンタテインメントコンピューティング (ISSN:09196072)
巻号頁・発行日
vol.2015, no.8, pp.1-6, 2015-02-23

我々は条件付き確率場を用いた習熟度に対応したバイオリン運指推定手法を提案してきた.しかし,推定運指は運指の自然さや演奏表現の適切さが不十分である問題があった.本論文では,従来よりも多くの楽譜情報を用いて素性の設計を行う.運指に関連する素性には様々なものが考えられるが,素性重みの学習に L1 正則化を用いることで,運指推定に寄与する重要な素性を判別する.実験では,基本的な素性だけを用いた従来法に対して教本運指との一致率が向上することを確認し,また,推定された運指の自然さに関してバイオリン経験者による主観評価を実施したところ提案法による有効性が確認できた.