著者
嵯峨山 茂樹 川本 真一 下平 博 新田 恒雄 西本 卓也 中村 哲 伊藤 克亘 森島 繁生 四倉 達夫 甲斐 充彦 李晃伸 山下 洋一 小林 隆夫 徳田 恵一 広瀬 啓吉 峯松 信明 山田 篤 伝 康晴 宇津呂 武仁
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.14, pp.57-64, 2003-02-07
参考文献数
24
被引用文献数
42

筆者らが開発した擬人化音声対話エージェントのツールキット``Galatea''についてその概要を述べる。主要な機能は音声認識、音声合成、顔画像合成であり、これらの機能を統合して、対話制御の下で動作させるものである。研究のプラットフォームとして利用されることを想定してカスタマイズ可能性を重視した結果、顔画像が容易に交換可能で、音声合成が話者適応可能で、対話制御の記述変更が容易で、更にこれらの機能モジュール自体を別のモジュールに差し替えることが容易であり、かつ処理ハードウェアの個数に柔軟に対処できるなどの特徴を持つシステムとなった。この成果はソース公開し、一般に無償使用許諾する予定である。This paper describes the outline of "Galatea," a software toolkit of anthropomorphic spoken dialog agent developed by the authors. Major functions such as speech recognition, speech synthesis and face animation generation are integrated and controlled under a dialog control. To emphasize customizability as the dialog research platform, this system features easily replaceable face, speaker-adaptive speech synthesis, easily modification of dialog control script, exchangeable function modules, and multi-processor capability. This toolkit is to be released shortly to prospective users with an open-source and license-free policy.
著者
森勢 将雅 山下 洋一
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.4, pp.1-6, 2012-08-02
被引用文献数
2

スマートフォン等のマイクロフォンを備えた携帯端末は,携帯電話としての機能だけではなく,音楽再生,音収録等様々な機能をユーザに提供しつつある.本研究では,スマートフォンを用いた音楽試聴スタイルの 1 つとして,タイトルやアーティスト等の情報,および歌詞が音楽に同期して表示される音楽試聴システムの実現に取り組む.本システムを実現するため,音楽に知覚的な影響を与えず情報を埋め込み,埋め込まれた情報をリアルタイムで抽出する技術を提案する.知覚に影響せず情報を埋め込むための技術として電子透かしが一般的に用いられるが,雑音に対する頑健性や通信速度の問題があり,実時間での情報伝達手段に用いることは困難であった.本研究では,モスキート音の考え方に基づくシンプルな方法を提案することで,目的とするシステムへの要求を満たす技術の確立を目指す.本稿では,モスキート音を用いた電子透かしの概要,および情報を埋め込むための仕様について説明する.次いでスマートフォン上に実装されたプロトタイプシステム,およびいくつかの音楽を用いた動作確認テストにより本システムの有効性について議論する.Smartphone that has a microphone has been used as a good tool for dairy life, and we can easily record a sound. In this research, a lyric-synchronized music listening system with smartphone is introduced to provide users with a new music listening style. The system can display the information such as title, lyric, and so on, extracted from the recorded music. The information is hidden in the music signal to avoid deteriorating the sound quality. Digital watermarking is one of the technology to hide the information, and several watermarking technologies for audio signal have been proposed. However, it was difficult for them to realize the good noise tolerance and transmission performance. In this paper, we focus on the mosquito sound to develop the digital watermarking to solve these problems. This paper shows the method to hide the information and the specification about the transmission of the information. The implemented system is introduced and tested in a real environment, and its effectiveness is also discussed.
著者
辻野 雄大 山西 良典 山下 洋一 井本 桂右
雑誌
エンタテインメントコンピューティングシンポジウム2019論文集
巻号頁・発行日
vol.2019, pp.96-103, 2019-09-13

ダンスゲーム譜面は,操作を要求される頻度,リズム構成の複雑さなど,複数の要素によって特徴づけられる.これらの要素によって,ダンスゲーム譜面の難しさおよび「面白さ」に影響する特性が形成される.この特性を客観的かつ多次元で表現する特徴量を提案する.提案した特徴量に基づいてk-means法によるクラスタリングを実施し,特性が類似した譜面のクラスタを得る.クラスタ毎に楽曲と譜面の関係を深層学習させることによって,クラスタの特性を備えた譜面の自動生成が可能となり,多様な「面白さ」に対応した特徴的な譜面の提供を実現した.
著者
加藤 圭介 野沢 和典 山下 洋一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.124, pp.223-228, 2003-12-18

本報告では、日本人英語学習者の英文発話における韻律を自動評定する手法について述べる。学習者と英語母語話者の発話を比較し、基本周波数、パワー、発話長の類似度を算出して韻律パラメータとする。2つの発話を比較する際には単語や単語境界部などさまざまな比較単位ごとに比較し、比較単位による結果の違いを考察した。また、基本周波数とパワーに関してはパターン距離などの従来手法に加え、回帰曲線近似誤差を用いた評定手法を提案し、評定結果の妥当性を検証した。さらに、複数の韻律パラメータを組合せ、学習者発話の韻律を評定するモデルを作成した。In this paper, we describe techniques to score prosody of sentence speech uttered by English learners. Based on the comparison between learners' speech and native speaker's speech, we make prosodic parameters by calculating the similarity of learners' speech and native speaker's speech about F0, power and duration. The comparison is carried out every comparison unit, such as a word, a word boundary, and so on. We try a new scoring measure in terms of approximate error of regression fitting, as well as pattern distance, for F0 and power. Moreover, we make a multiple regression model for scoring prosody of English learners' speech by combining two or more prosodic parameters.
著者
砺波 紀之 井本 桂右 岡本 悠希 福森 隆寛 山下 洋一
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.78, no.5, pp.217-226, 2022-05-01 (Released:2022-06-01)
参考文献数
42

本論文では,音響イベント検出のための新たな評価指標を提案する。環境音分析のタスクの一つである音響イベント検出の従来の性能評価指標では,イベントの種類によらずすべての誤検出が等しく重み付けされる。提案指標では,音響イベントの種類を考慮しながら深刻な音響イベントの誤検出がより大きく罰則される。また,深刻な誤検出が発生し易いあるいは発生しにくい音響イベント検出モデルを用いて,複数の性能評価指標に対する深刻な誤検出の影響を詳細に分析する。実験結果より,従来指標と比較して,提案指標を用いることで,深刻な誤検出の多いイベント検出モデルの性能がより劣化して評価されることを確認した。
著者
恒川 俊克 山下 洋一 溝口 理一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.12, pp.61-68, 1998-02-05
参考文献数
13
被引用文献数
12

大量のニュース音声データベースからある特定の話題に関するニュースのみを検索しその情報を得るようにするにはニュース音声に対する話題インデキシングの技術が必要になると考えられる。そこで本研究ではニュース音声に対しキーワードスポッティングに基づいた話題のインデキシングを行う。まず話題との相互情報量、単語長を選出基準として、話題の同定に貢献する名詞3000単語をキーワードとして選出した。このキーワードの話題に関する条件付き確率を基にテキストベース上で記事ごとに話題同定の実験を行ったところ約76%の記事を正しく同定することができた。さらにニュース音声に対しスポッティングを行い、抽出されたキーワードの音韻スコアと条件付き確率を基にして話題ごとに「話題の確からしさ」の計算を行い、話題同定を行った。正しい話題が話題同定結果の上位3位以内に含まれていれば正解分類とした場合、約66.5%を正しく同定することができた。For retrieving news data related to a specific topic from a great amount of news data base, we need a technique of indexing speech data with topics. In this report, we try the topic identification for news speech based on keyword spotting. To begin with we selected three thousands of nouns as keywords which contribute to topic identification, based on criterion of mutual information and a length of word. This set of keywords identified correct topics of 76 percent of text article data from newspaper database, Further, we performed keyword spotting for TV news speech and identified a topic by computing possibilities of all topics based on phonetic scores of spotted words and topic probability of the words. Topic identification rate is 66.5 percent assuming that identification is correct if the correct topic is included in the first three places of the result of topic identification.
著者
福森隆寛 堀井圭祐 中山雅人 西浦敬信 山下洋一
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2013-SLP-96, no.6, pp.1-8, 2013-05-16

実環境下での音収録において,周囲の雑音が目的信号に混入し音質が大きく劣化するという問題がある.そのため,収録した音を受聴する場合,混入雑音を抑圧し目的音のみを強調することが重要である.単一マイクロホンでの音収録における雑音抑圧手法としては,SS (Spectral Subtraction) が一般的に利用されている.SS は低演算コストで雑音を抑圧できるが,ミュージカルノイズと呼ばれる聴感上不快な雑音が発生する.そこで,SS を用いて雑音抑圧後の信号を受聴する場合,ミュージカルノイズを発生させずに混入雑音を抑圧する必要がある.これまで,ミュージカルノイズ低減のために SS を反復する手法が提案されており,その有効性が確認されている.しかし,これらの手法では全周波数で一様に雑音を抑圧しており,周波数毎に雑音抑圧量を制御することで更なるミュージカルノイズの低減が期待される.そこで,本研究ではミュージカルノイズが発生しない雑音抑圧手法の構築を目指して,聴覚特性に基づく反復 SS を提案する.提案法の有効性を確認するために,客観・主観評価実験を実施した.各評価実験の結果,提案法は従来法と比較して高い雑音抑圧性能を達成しつつ,主観的にミュージカルノイズを低減できた.
著者
辻野 雄大 山西 良典 山下 洋一
雑誌
エンタテインメントコンピューティングシンポジウム論文集
巻号頁・発行日
vol.2021, pp.160-168, 2021-08-23

ダンスゲーム譜面は,プレイヤが行うべき入力デバイスの操作を指示するものである.操作に用いる体の部位や,操作時の姿勢は指定されておらず,あるゲーム譜面に対して行うプレイヤの身体動作は一意に定まらない. 本稿では,隠れマルコフモデルを用い,入力ゲーム譜面に対してプレイヤ動作を推定する手法を提案する.プレイヤのゲーム習熟度や動作の好みを表現するパラメータを導入し,1つの譜面に対して異なる動作を推定する複数のエージェントを生成した.
著者
福森 隆寛 吉元 直輝 中野 皓太 中山 雅人 西浦 敬信 山下 洋一
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.71, no.11, pp.590-598, 2015

近年急速に発展するディジタル技術を用いて日本の文化資源を保存・再現するディジタルアーカイブが注目視されており,これまでに有形文化財に対するディジタルアーカイブの研究が精力的に進められてきた。一方,無形文化財(特に歴史的文化財の音空間)のディジタルアーカイブの研究は,まだ創世期の段階で手がつけられておらず,日本の歴史的文化財の保存・伝承という観点から無形文化財のディジタルアーカイブは急務である。そこで本研究では日本無形文化財の一つである京都祇園祭に着目し,ActionScriptを用いて日本無形文化財の音場体験システムを開発した。はじめに日本無形文化財の京都祇園祭のディジタルアーカイブを目指して,京都祇園祭の山鉾巡行(約4kmにも及ぶ経路を山鉾が4〜5時間かけて巡行)の音響素片を収集した。そして,祇園祭の巡行経路を体験者が指定することで,その経路上のお囃子が体験できるインタラクティブWebシステムを開発した。
著者
生藤 大典 中山 雅人 西浦 敬信 山下 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.114, no.112, pp.13-18, 2014-06-27

我々は,これまでに高い臨場感を容易に与えることのできる3次元音場再生技術として,パラメトリックスピーカの超指向性を利用する静止音像構築手法を提案してきた.この手法はパラメトリックスピーカからの再生音を部屋の壁や床,天井に反射させることで,あらゆる方向からの音の到来を表現できる.しかしながら,パラメトリックスピーカの放射方向を連続的に制御できないため,移動音像の表現が困難であった.そこで本稿では,パラメトリックスピーカによる移動音像の実現に向けて,曲面状に超音波素子を配置した曲面型パラメトリックスピーカによる移動音像構築手法を提案する.人は音像の方向を知覚する際,両耳間の音圧差を手掛かりとし,その音圧差が連続的に変化するとき音像の移動を知覚する.そこで提案手法では,信号が入力される超音波素子を隣接順に切り替えることで,パラメトリックスピーカ本体を動かすことなく放射方向を制御し,受聴者周辺の音圧分布の制御を行う.評価実験の結果,提案手法により連続的に移動する音像を構築可能であることを確認した.
著者
山下 洋一 井上 弘一 中村 昇一 二川原 淳志 森 保 中尾 亮 伊坪 徳宏
出版者
日本LCA学会
雑誌
日本LCA学会研究発表会講演要旨集
巻号頁・発行日
vol.2008, pp.29-29, 2008

建築内装材料「壁紙」のうち塩ビ系壁紙(製品シェア96%)のインベントリ分析を実施中。原材料、製造、流通・施工、使用(居住環境)、廃棄(リサイクル等)の各段階での構成要素の確認と原単位の確認および調査を実施。この範囲でインベントリ分析に取組むのは初の試み。21年度末までに第一段階の統合化を図る予定。20年度内はカーボンフットプリントに注目、二酸化炭素排出量に絞り研究した経過報告を行う。
著者
松井 隆博 井上 弘一 中村 昇一 二川原 淳志 森 保 坂井 広志 鳥海 臣吾 山下 洋一 中尾 亮 松村 年郎 山口 博司 伊坪 徳宏
出版者
日本LCA学会
雑誌
日本LCA学会研究発表会講演要旨集
巻号頁・発行日
vol.2011, pp.51-51, 2011

塩ビ壁紙が環境へどのような影響があるのかをLIME2によって評価を行った。影響カテゴリーとして地球温暖化と室内空気質汚染等を対象とした。温暖化については1次データにもとづく業界代表値インベントリーを作成し評価した。室内空気質汚染については、パッシブサンプラー法による壁紙の放散量試験を行い、ホルムアルデヒドの放散量からLIME2により人間健康への影響を試算した。
著者
嵯峨山 茂樹 伊藤 克亘 宇津呂 武仁 甲斐 充彦 小林 隆夫 下平 博 伝 康晴 徳田 恵一 中村 哲 西本 卓也 新田 恒雄 広瀬 啓吉 峯松 信明 森島 繁生 山下 洋一 山田 篤 李 晃伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.103, no.518, pp.73-78, 2003-12-12

擬人化音声対話エージェントのツールキット"Galatea"の開発プロジェクトについて報告する.Galateaの主要な機能は音声認識,音声合成,顔画像合成であり,これらの機能を統合して,対話制御の下で動作させるものである.研究のプラットフォームとして利用されることを想定してカスタマイズ可能性を重視した結果,顔画像が容易に交換可能で,音声合成が話者適応可能で,対話制御の記述変更が容易で,更にこれらの機能モジュール自体を別のモジュールに差し替えることが容易であり,かつ処理ハードウェアの個数に柔軟に対処できるなどの特徴を持つシステムとなった.この成果はダウンロード可能となっており,一般に無償使用許諾している.
著者
小川 純平 林田 亘平 中山 雅人 森勢 将雅 西浦 敬信 山下 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.112, no.47, pp.167-172, 2012-05-17
参考文献数
10

近年,高齢者を狙う悪質犯罪の増加に伴い,家族が遠隔地から高齢者の危機的状況を確認するために環境音を利用した異常検出システムが注目されている.従来,環境音識別において,環境音を音の種類ごとに分類して音響モデルを構築し,その音響モデルにより環境音を識別する手法が用いられてきた.従来法では,非日常音に対しても日常音と同様に個々に音響モデルを構築している.しかしながら,非日常音は,観測可能なサンプル数が少ないため,音響モデルの学習が不十分だという問題と類似音の識別が困難であるという問題が存在する.また,従来法では残響の存在しない音(ドライソース)を学習環境音として用いていたため,残響下の環境音を頑健に識別することが困難であった.そこで本研究では,非日常音を高精度に識別するためにマルチステージ非日常音識別法を,残響下の環境音を高精度に識別するために模擬インパルス応答を用いた残響マルチコンディションモデルを提案する.
著者
福森 隆寛 森勢 将雅 西浦 敬信 山下 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.94, no.4, pp.712-720, 2011-04-01
参考文献数
19
被引用文献数
6

近年,雑音及び残響下における音声認識手法に関する研究が盛んに行われている.それに伴い雑音環境下で音声認識性能を頑健に予測可能な指標も多数提案されている.一方,残響環境下における音声認識性能の有力な予測指標は提案されておらず,残響下音声認識性能の頑健な予測指標の策定は急務である.これまでに残響下音声認識性能の優劣を判別する残響指標として同一室内で固有の値となる残響時間が提案されているが,仮定する拡散音場と実環境との差異から他の残響特性が変化することにより同一環境でも計測箇所によって音声認識性能が変動する.そのため残響時間は音声認識の難しさを表す指標として不十分であることが問題視されている.そこで本論文では,ISO3382 Annex Aで提案されている室内音響指標を用いた残響下における頑健な音声認識性能の予測法を提案する.提案法では初期反射音と後続残響音の関係を表す室内音響指標の中でも特にDefinition(D値)に着目し,事前に様々な環境で複数箇所計測したインパルス応答をもとに算出したD値と音声認識性能の関係を一次直線や二次曲線で近似することで残響指標RSR-D_nを策定する.策定した残響指標RSR-D_nと性能予測を行う残響環境の発話位置におけるインパルス応答をもとに残響下音声認識性能の予測を試みる.評価実験の結果,従来の残響時間に基づく手法と比較して残響指標RSR-D_nは,より頑健に残響下音声認識性能を予測できることを確認した.
著者
土岐 哲 鹿島 央 中西 久実子 山下 洋一 江崎 哲也 岡田 祥平
出版者
大阪大学
雑誌
基盤研究(B)
巻号頁・発行日
2007

本課題は、『非母語話者による日本語話し言葉コーパス(CSJ-NNS)』に収録するデータをさらに充実させ、構築されたコーパスを広く一般に公開する目的で行われた。音声データの収録や各種アノテーションの付与のみならず、個人情報を消去するなどして公開に向けて作業を行い、コーパスを頒布した。また、本コーパスと『日本語話し言葉コーパス(CSJ)』とを比較することにより、従来の日本語非母語話者音声研究に新たな視座を提示した。
著者
加藤 圭介 野沢 和典 山下 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.103, no.519, pp.223-228, 2003-12-11
被引用文献数
1

本報告では、日本人英語学習者の英文発話における韻律を自動評定する手法について述べる。学習者と英語母語話者の発話を比較し、基本周波数、パワー、発話長の類似度を算出して韻律パラメータとする。2つの発話を比較する際には単語や単語境界部など様々な比較単位ごとに比較し、比較単位による結果の違いを考察した。また、基本周波数とパワーに関してはパターン距離などの従来手法に加え、回帰曲線近似誤差を用いた評定手法を提案し、評定結果の妥当性を検証した。さらに、複数の韻律パラメータを組み合わせ、学習者発話の韻律を評定するモデルを作成した。