著者
河原 達也 李 晃伸 小林 哲則 武田 一哉 峯松 信明 伊藤 克亘 伊藤 彰則 山本 幹雄 山田 篤 宇津呂 武仁 鹿野 清宏
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.55, no.3, pp.175-180, 1999-03-01
被引用文献数
39

「日本語ディクテーション基本ソフトウェア」は, 大語彙連続音声認識(LVCSR)研究・開発の共通プラットフォームとして設計・作成された。このプラットフォームは, 標準的な認識エンジン・日本語音響モデル・日本語言語モデルから構成される。音響モデルは, 日本音響学会の音声データベースを用いて学習し, monophoneから数千状態のtriphoneまで用意した。語彙と単語N-gram(2-gramと3-gram)は, 毎日新聞記事データベースを用いて構築した。認識エンジンJULIUSは, 音響モデル・言語モデルとのインタフェースを考慮して開発された。これらのモジュールを統合して, 5,000語彙の日本語ディクテーションシステムを作成し, 種々の要素技術の評価を行った。本ツールキットは, 無償で一般に公開されている。
著者
栗山 直人 鈴木 基之 伊藤 彰則 牧野 正三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.12, pp.37-42, 2006-02-04
被引用文献数
3

PLSAは,文章の特徴「話題」を反映した言語モデルを構築する手法である.このPLSA言語モデルの拡張を提案する.前半ではPLSA言語モデルの学習について,既存の複数の方法を比較し,EMアルゴリズムのアニーリングスケジュール最適化についての検討を行う.後半ではPLSA言語モデルを内容語モデルと機能語モデルに分割し,話題(トピック)と話し方(スタイル)を,別々に学習・適応することで従来のPLSA言語モデルよりもより柔軟な言語モデル適応を試みる.その結果学習最適化についてはβを1.0 から特定の値に向けて減少させるアニーリングスケジュールが最適という結果が得られた.内容語・機能語に分割したモデルについてはtrigramに対するPerplexityが従来のPLSA言語モデルの83.90% から82.23% へ改善した.PLSA is a method of composing language model which can reflect the global charactetistics of linguistic context as "topic". We propose more extention of PLSA language model. First, we compare the conventional learning methods of PLSA language model, and examine the optimization of EM annealing schedule. As a result, we found that the best method is to reduce β from 1.0 to some special value. Next, we compose a PLSA language model whose vocabulary set is divided, into content words and function words. Then training and adaptation to topic or style are performed separately. In the experiment, we acheived 82.23% perplexity reduction against conventional way 83.90%.
著者
伊藤 彰浩
出版者
広島大学
雑誌
大学論集 (ISSN:03020142)
巻号頁・発行日
vol.36, pp.149-168, 2006-03
著者
田代 勝文 東口 高志 武田 悠子 冨塚 利枝 藤瀬 暢彰 中村 強 升永 博明 伊藤 彰博
出版者
日本静脈経腸栄養学会
雑誌
静脈経腸栄養 (ISSN:13444980)
巻号頁・発行日
vol.21, no.2, pp.2_115-2_125, 2006 (Released:2007-04-26)
参考文献数
27
被引用文献数
6

ペクチンにて固形化した栄養剤について、人工消化液による溶解性を検討するとともに、固形化栄養剤をラットの胃内に強制投与した場合の消化管内での形状変化とその移行、特に臨床上問題視されることが多い胃食道逆流や便性状に及ぼす影響に関して、基礎的研究を行った。溶解試験において、ペクチンを用いた固形化栄養剤は、寒天やゼラチンによる固形化栄養剤に比べ、人工胃液中では形状が維持され、人工腸液中ではゼラチンと同様に速やかに溶解することが認められた。また、ラットに胃内投与した場合、固形化栄養剤は液状栄養剤に比べ、胃内滞留時間を30分間程延長させたが、小腸内への移行後には投与栄養剤の物性の違いによる明らかな差は認められなかった。さらに、固形化栄養剤は液状栄養剤に比べ、口腔内逆流や食道内逆流を有意に抑制するとともに、下痢や軟便の発生頻度を有意に軽減することが認められた。以上の結果から、固形化栄養剤は液状栄養剤に比べ、胃内滞留時間を延長させるものの小腸内移行には影響を与えず、また胃内強制投与に伴って発生する胃食道逆流や下痢をいずれも抑制することが示唆された。
著者
伊藤 彰英 岩田 浩介 紀 杉 薮谷 智規 木全 千泉 猿渡 英之 原口 紘〓
出版者
公益社団法人日本分析化学会
雑誌
分析化学 (ISSN:05251931)
巻号頁・発行日
vol.47, no.2, pp.109-117, 1998-02-05
被引用文献数
21 28

誘導結合プラズマ質量分析法(ICP-MS)及び誘導結合プラズマ発光分析法(ICP-AES)を, 日本分析化学会より頒布されている河川水標準物質(JAC 0031, JAC 0032)中の微量元素の多元素定量に適用した. ICP-MS及びICP-AESによる多元素分析においては, 河川水試料の直接導入法とともに微量元素に対してキレート樹脂濃縮法を併用することにより, 河川水標準物質中の37元素の定量を行うことができた. Caの12300からTmの0.00012μgl^<-1>まで9けたに及ぶ広い濃度範囲の定量値が得られた. 認証値が求められている元素については, おおむね認証値と一致した結果であった. 又, 希土類元素についても, すべて定量することができ, 頁岩中濃度で規格化した希土パターンでは重希土類元素の相対存在度が高く, Ceの負の異常がある天然水特有のパターンが得られた.
著者
伊藤 彰則 王 欽悦 鈴木 基之 牧野 正三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.50, pp.41-46, 2005-05-26
参考文献数
9

自然な対話の映像の中から笑いを検出するための手法について述べる。笑いは対話中の表情としてもっとも多く見られるものであり、これを検出することはユーザの心的状態の推定にとって有用であると考えられる。また、笑い声を高精度に検出できれば、対話音声の認識誤り削減に有効である。本稿では、カメラで撮影したユーザの顔から表情を認識する手法と、マイクで収録したユーザの音声から笑い声を検出する手法を組み合わせることで、笑いの検出精度を向上させる方法を検討する。顔画像による表情認識では、顔の特徴点検出に基づく特徴量を用い、特定話者の場合で再現率・適合率とも80%以上の精度で自然な対話映像から笑いの表情を認識することが可能になった。また、GMMによる音声の識別と画像情報を組み合わせた笑い声の検出手法を提案した。実験結果より、音声と画像の統合により適合率が向上することが示され、最終的には再現率・適合率とも70%以上の値が得られた。This paper describes a method to detect smiles and laughters from the video of natural dialogue. A smile is the most common facial expression observed in a dialogue. Detecting a user's smiles and laughters can be useful for estimating the mental state of the user of a spoken-dialogue-based user interface. In addition, detecting laughter sound can be utilized to prevent the speech recognizer from wrongly recognizing the laughter sound as meaningful words. In this paper, a method to detect smile facial expression and laughter sound robustly by combining a image-based facial expression recognition method and an audio-based laughter sound recognition method. The image-based method uses a feature vector based on feature point detection from face images. The method could detect smile faces by more than 80% recall and precision rate. A method to combine a GMM-based laughter sound recognizer and the image-based method could improve the accuracy of detection of laghter sounds compared with methods that use image or s und only. As a result, more than 70% recall and precision rate of laughter sound detection was obtained from the natural conversation videos.