文献一覧: 伊藤彰則 (著者)

14 0 0 0 OA 環境音から異常を検知する統計的手法

著者: 伊藤彰則
出版者: 一般社団法人日本音響学会
雑誌: 日本音響学会誌 (ISSN:03694232)
巻号頁・発行日: vol.75, no.9, pp.538-543, 2019-09-01 (Released:2020-03-01)
参考文献数: 38

2020-07-11 19:00:15
14 + 41 Twitter

12 0 0 0 OA グロウル及びスクリーム歌唱の合成に向けた音響的特徴の分析

著者: 加藤圭造伊藤彰則
雑誌: 研究報告音声言語情報処理(SLP)
巻号頁・発行日: vol.2012-SLP-90, no.14, pp.1-6, 2012-01-27

2023-02-09 23:20:00
12 + 10 Twitter

http://id.nii.ac.jp/1001/00080370/

8 0 0 0 OA 2020年は International Year of Sound です

著者: 伊藤彰則
出版者: 一般社団法人日本音響学会
雑誌: 日本音響学会誌 (ISSN:03694232)
巻号頁・発行日: vol.76, no.1, pp.22, 2019-12-25 (Released:2020-07-01)
参考文献数: 5

2020-09-07 13:10:08
8 + 3 Twitter

8 0 0 0 統計的言語モデルを用いた作詞補助システムのための歌詞特徴に関する検討

著者: 阿部ちひろ伊藤彰則
雑誌: 研究報告音楽情報科学(MUS)
巻号頁・発行日: vol.2012, no.3, pp.1-6, 2012-08-02

本稿では,Ngram 言語モデルをもとに歌詞候補文を生成する作詞補助システム「patissier」への実装を想定した,歌詞テキストの特徴分析結果を報告する.作詞においては,音韻やアクセントなど技巧的な側面の考慮とともに,楽曲のテーマや歌詞のストーリー設定も重要な要素である.より歌詞らしい候補の生成を目的として,コンテンツ投稿サイト「ピアプロ」に投稿された歌詞テキストを用い,一般に歌詞らしさと呼ばれる特徴の定量的検討を行った.また,CSJ (日本語話し言葉コーパス) や blog 記事との比較から,主に使用される単語の違いにより,歌詞とその他の文章は統計的に区別可能であることが示唆された.さらに,3 種類のモデルを用いた歌詞生成実験により,それぞれ異なった傾向を持つ文が生成されることが確かめられた.

https://ci.nii.ac.jp/naid/110009432470

5 0 0 0 OA 謎の古文書Voynich Manuscriptの統計的解析の試み

著者: 伊藤彰則
出版者: 電気関係学会東北支部連合大会実行委員会
雑誌: 電気関係学会東北支部連合大会講演論文集平成19年度電気関係学会東北支部連合大会講演論文集
巻号頁・発行日: pp.174, 2007 (Released:2008-03-14)

2022-10-07 20:47:43
5 + 13 Twitter

5 0 0 0 グロウル及びスクリーム歌唱の合成に向けた音響的特徴の分析

著者: 加藤圭造伊藤彰則
出版者: 一般社団法人情報処理学会
雑誌: 研究報告音声言語情報処理(SLP)
巻号頁・発行日: vol.2012, no.14, pp.1-6, 2012-01-27

本研究ではデスメタル,メタルコアなどエクストリームメタルと言われるジャンルで頻繁に用いられる,グロウル及びスクリーム歌唱について音響的特徴の分析を行った.先行研究で特殊な発声の音響的な特徴として示されたサブハーモニクスの存在や macro pulse 構造の調査,病的音声の分析になどに使われる jitter,shimmer,HNR の値について測定を行った.In this study, we analized acoustic feauture of growl and scream singing voices used in extream metal music, such as death metal, metal core, and so on. We observed sub-harmonics and macro pulse structures those are reported as accoustic features of rough voice. We also measured jitter, shimmer, and HNR values.

2019-04-14 14:07:13
5 + 0 Twitter

https://ci.nii.ac.jp/naid/110009753266

4 0 0 0 OA 日本人のための音声対話による英会話学習システム

著者: 伊藤彰則
雑誌: 研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日: vol.2015-NL-221, no.12, pp.1-6, 2015-05-18

筆者のグループがこれまで研究してきた,音声対話を利用した英会話のための CALL システムに関する技術について述べる.音声認識技術を利用した現状の CALL システムは,発音やイントネーションなど,1 つの発話に含まれる要素を採点するものが多い.それも重要ではあるが,英会話学習には「実際に使われる表現を何度も繰り返して練習する」ということも必要である.この考えに基づき,筆者のグループではこれまで「対話に基づく CALL システム」について研究してきた.本稿では,対話音声からの韻律評価,文法誤り検出および応答タイミング制御練習のためのシステムについて述べる.

2023-05-07 21:59:57
4 + 3 Twitter

http://id.nii.ac.jp/1001/00144419/

4 0 0 0 OA 人間と機械は友達になれるか

著者: 伊藤彰則
出版者: 一般社団法人電子情報通信学会
雑誌: 情報・システムソサイエティ誌 (ISSN:21899797)
巻号頁・発行日: vol.24, no.1, pp.11-12, 2019-05-01 (Released:2019-05-01)
参考文献数: 9

2022-02-19 09:35:49
4 + 6 Twitter

4 0 0 0 拡張現実感を用いたロボットデザインの評価

著者: 廣井富伊藤彰則
出版者: 特定非営利活動法人日本バーチャルリアリティ学会
雑誌: 日本バーチャルリアリティ学会論文誌 (ISSN:1344011X)
巻号頁・発行日: vol.18, no.2, pp.161-170, 2013

We can make a robot suitable for users' preference by designing its appearance and interaction through subjective evaluation. However, for evaluating users' impressions using real robots, it is necessary to build many robots with various specifications such as height, which is time-consuming and costly. In this paper, we propose a robot design methodology based on augmented reality (AR). We conducted experiments to evaluate a robot's head size using both AR and real robots, and similar results were obtained from both evaluation experiments in an environment with simple background. Next, we conducted experiments to evaluate a robot's head size using both AR and real robots in a real environment, and similar results were obtained from both evaluation experiments. From these experiments, we can conclude that the CG-based robot evaluation is as effective as that using real robots. In addition, the AR technology enables us to evaluate the robot in a real environment, which realizes more realistic evaluation of robot design without building real robots.

2016-03-15 14:18:17
4 + 0 Twitter

4 0 0 0 OA タスクに依存しない日本語文音声の認識に関する研究

著者: 伊藤彰則 [著]
巻号頁・発行日: 1991

2014-03-18 19:49:45
4 + 0 Twitter

3 0 0 0 発話状態推定に基づく協調的感情音声合成による音声対話システムの評価

著者: 加瀬嵩人能勢隆千葉祐弥伊藤彰則
出版者: The Institute of Electronics, Information and Communication Engineers
雑誌: 電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日: vol.J99-A, no.1, pp.25-35, 2016-01-01

近年,非タスク指向型の音声対話システムへの需要が拡大しており,様々な研究がされている.それらほとんどの研究は言語的な観点から適切な応答の生成を目指したものである.一方で人間同士の会話においては,感情表現や発話様式などのパラ言語情報を効果的に利用することにより,対話を円滑に進めることができると考えられる.そこで我々はシステムの応答の内容ではなく,応答の仕方に着目し,感情音声合成を対話システムに用いることを試みる.本研究ではまず,適切な感情付与を人手により与えた場合に実際に対話システムの質が向上するかを複数のシナリオを作成して主観基準により評価する.次に,感情付与を自動化するために,システム発話に応じた付与とユーザ発話に協調した付与の二つの手法について検討を行う.評価結果から,感情を自動付与することで対話におけるユーザの主観評価スコアが向上すること,またユーザ発話に協調した感情付与がより効果的であることを示す.

2017-12-10 23:37:05
3 + 0 Twitter

http://search.ieice.org/bin/summary.php?id=j99-a_1_25&category=A&year=2016&lang=J&abst=

2 0 0 0 OA 音声認識におけるフレームシフト再考

著者: 伊藤彰則
雑誌: 研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日: vol.2016-SLP-112, no.10, pp.1-6, 2016-07-21

音声認識の特徴量抽出では,まず入力音声に時間窓をかけて局所的な信号を切り出し,音声信号の局所的な周波数情報を取り出す.この時間窓の位置を少しずつずらしながら分析を行うことで,音声の持つ周波数成分の時間変化を捉えることができる.このとき時間窓をずらす時間間隔がフレームシフトであり,典型的には 5ms~10ms に設定される.本稿では,このフレームシフトを 2 つの点から再考する.一つ目の視点は「フレームシフトは 10ms で十分なのか?」という点である.フレームに基づく処理は,音声信号が短い時間で大きく変化しないことを前提としているが,破裂子音などではこの前提がそもそも成立していない.そこで,10ms ごとのフレームの先頭位置のずれによって,抽出される特徴量が大きく変化することを実験的に示す.また,偶然によるフレーム位置の変動に起因する特徴量変動に対応するため,フレーム位置をずらした学習サンプルを学習に用いる方法を提案する.二つ目の視点は,「フレーム位置のずれが学習によって吸収できるのであれば,フレームシフトはもっと長くてもよいのではないか?」という点である.フレームシフトを実験的に 60ms 程度まで長くして実験を行ったところ,フレームシフト 40ms ではフレームシフト 10ms を越える認識性能が得られ,50ms でも 10ms と同程度の認識性能が得られた.これらの条件では 1 状態 HMM (すなわち GMM) が使われており,認識のための計算量の大幅な削減が期待できる.

2020-05-16 22:33:00
1 知恵袋
1 + 0 Twitter

http://id.nii.ac.jp/1001/00169847/

2 0 0 0 OA 応答タイミングを考慮した英会話練習のための音声対話型英語学習システム

著者: 鈴木直人廣井富千葉祐弥能勢隆伊藤彰則
雑誌: 情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日: vol.56, no.11, pp.2177-2189, 2015-11-15

本研究では,音声を用いた英会話の学習が可能なコンピュータ利用言語学習(Computer-Assisted Language Learning, CALL)システムを提案する.特に,英会話学習における学習者の応答タイミングに着目する.一般的に学習段階において応答タイミングは適切なものに比べ遅くなりがちであるが,システムとの英会話では応答タイミングを意識しにくい.そこで対話相手としてCGキャラクタを導入し,応答を要求する表現であるタイムプレッシャー表現を付加する練習方法を提案する.CGキャラクタの有無,タイムプレッシャー表現の有無のほかに,短期間での繰返し練習,および期間をおいた練習を通じて,提案手法の有効性について論じる.

2018-12-25 09:50:44
2 + 1 Twitter

http://id.nii.ac.jp/1001/00145918/

2 0 0 0 ロボットの主観評価における身体と拡張現実感(一般,『コミュニケーションの身体を捉える』及び一般)

著者: 廣井富伊藤彰則
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎
巻号頁・発行日: vol.110, no.459, pp.27-28, 2011-02-28

ロボットの外観やインタラクションを主観評価によってデザインすることで,ロボットをよりユーザの嗜好に合わせることができる.その際に,評価軸に対応するすべての実ロボットを製作して評価することは現実的ではない.本稿では,「ロボットを主観評価する際にロボットの体はどこまで必要なのか」について,外観やインタラクションなどの評価軸との関係を議論する.

2017-01-20 18:47:05
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110008690019

2 0 0 0 OA 統計的言語モデルを用いた作詞補助システムのための歌詞特徴に関する検討

著者: 阿部ちひろ伊藤彰則
雑誌: 研究報告音楽情報科学(MUS)
巻号頁・発行日: vol.2012-MUS-96, no.3, pp.1-6, 2012-08-02

http://id.nii.ac.jp/1001/00083395/

2 0 0 0 文節間文法を用いた未知語検出

著者: 石川永和伊藤彰則牧野正三
雑誌: 全国大会講演論文集
巻号頁・発行日: vol.46, pp.55-56, 1993-03-01

近年の自然言語処理システムでは文法をはじめとする各種言語情報は各単語ごとに分散記述,データベース化し,維持・管理することが多い.しかしこのデータベース化にはコストがかかること,タスクごとに変更を迫られるなどの点から作成の自動化が望まれている.これに当たっては大量のテキストを解析しなければならないが,辞書未登録語(未知語)については検出を行い,言語情報を付与する必要がある.本稿ではこの未知語検出に関する一方法を提案する.この方法は文節間の依存関係を表現した文節間文法を基礎とするもので,前報告で述べた疑似文節を用いた未知語検出法に採り入れることにより検出率が向上した.

https://ci.nii.ac.jp/naid/110002882213

1 0 0 0 OA 言語・韻律情報の同時モデル化に基づく音声応答生成の検討

著者: 山崎善啓千葉祐弥能勢隆伊藤彰則
出版者: 一般社団法人人工知能学会
雑誌: 人工知能学会研究会資料言語・音声理解と対話処理研究会 90回 (2020/11) (ISSN:09185682)
巻号頁・発行日: pp.17, 2020-11-24 (Released:2021-06-12)

2023-11-08 12:24:04
1 + 1 Twitter

1 0 0 0 歌唱の「熱唱度」評価の検討

著者: 大道竜之介伊藤仁伊藤彰則牧野正三
出版者: 情報処理学会
雑誌: 情報処理学会研究報告. [音楽情報科学] (ISSN:09196072)
巻号頁・発行日: vol.85, pp.J1-J6, 2010-05-27
参考文献数: 10

歌唱音声の新たな評価指標として「熱唱度」の導入を提案する.聴取実験の結果から,歌唱音声中のビブラートおよび呼吸音が,熱唱の知覚に関与することがわかった.本稿では, 歌唱音声におけるビブラート,有声呼吸音,声門破裂の 3 つの特徴を挙げ,これらを定量化する音響特徴量について検討する.34 名の歌唱音声に対する聴取実験から得た,熱唱度の聴取実験スコアと,複数の音響特徴量との重回帰分析を行い,それらの間に重相関係数 0.45 を得た.We propose introducing "enthusiasm" as a novel index of singing voice. The result of the listening experiment by human subjects suggests that both vibrato and breath sounds in singing voice concern human perception of enthusiasm. This paper describes our experiments to quantify 3 features in singing voice; vibrato, voiced breath sounds and glottal plosion. As a result of the multiple linear regression analysis between perceived enthusiasm score evaluated by the listening experiment with singing voice recordings of 34 people and some quantified acoustic features, we reached multiple correlation coefficient of 0.45.

2021-06-19 11:34:12
1 + 2 Twitter

https://ci.nii.ac.jp/naid/110007997411

1 0 0 0 音声認識のための確率文脈自由文法に基づく言語モデルの構築と評価

著者: 堀智織加藤正治伊藤彰則好田正紀
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日: vol.83, no.11, pp.2407-2417, 2000-11-25
参考文献数: 9
被引用文献数: 9

本論文では, 確率文脈自由文法(Stochastic Context Free Grammar:SCFG)を大語彙連続音声認識に適用する手法として, 文節単位の係り受け制約をもつSCFGを提供する.SCFGは, N-gramのような局所的な制約だけでなく, 文全体にわたる大局的な制約をも記述できることから, 非常に表現力の高い言語モデルとして知られている.しかし, SCFGのパラメータ推定にはInside-Outsideアルゴリズムを用いる必要があり, 非終端記号数の3乗, かつ入力系列長の3乗に比例する莫大な計算量を要する.そのため, SCFGは大量のテキストコーパスから推定することが難しく, これまで大語彙連続音声認識用の言語モデルとして利用されることはほとんどなかった.提案する文節単位の係り受けSCFGは, Inside-Outsideアルゴリズムの計算量を係り受けの制約により非終端記号数の2乗に, 文節単位の導入により更にその約1/8に削減できる有効なモデルである.EDRコーパスを用いた実験では, 提案法を含む各種SCFGの性能とパラメータ推定に要する処理量を比較し, 提案法が計算量を大幅に削減しつつ, パープレキシティがほとんど増加しいことを示す.毎日新聞コーパスを用いた実験では, 大規模な文節単位の係り受けSCFGを構築し, 大語彙連続音声認識システムに実装する.そして, 語彙サイズ5000の音声認識実験を行い, SCFGによる認識性能はTrigramには及ばないものの, Trigramと併用した場合にはTrigram単独の場合に比べて約14%の単語誤りを削減できることを示す.

2020-07-18 21:31:38
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003183852

1 0 0 0 OA 統計的言語モデルを用いた作詞補助システム

著者: 阿部ちひろ伊藤彰則
雑誌: 研究報告音楽情報科学(MUS)
巻号頁・発行日: vol.2011-MUS-91, no.9, pp.1-6, 2011-07-20

本稿では,音節数と韻に着目した作詞支援システムを提案する.システムは Ngram 言語モデルをもとに,ユーザの指定した音節数と韻の条件を満たす歌詞候補文を生成し,提示する.ユーザはシステムを辞書のように用い,提示文から主体的に言葉を選び作詞を進めることができる.我々は GUI を備えた作詞補助システムを実装し,提示文とシステムの主観評価実験を行った.

2020-06-21 10:19:42
1 + 0 Twitter

http://id.nii.ac.jp/1001/00075411/

««
«
1
2
3
»
»»