著者
齋藤 大輔
雑誌
情報処理
巻号頁・発行日
vol.57, no.6, pp.513-515, 2016-05-15

本稿では音声言語情報処理における主要な研究課題を切り口として,音楽情報処理における研究課題との類似点や相違点,ならびに両分野において独自性のある研究課題について俯瞰し解説する.
著者
嵯峨山 茂樹 小野 順貴 西本 卓也 齋藤 大輔 堀 玄 中村 和幸 金子 仁美
出版者
国立情報学研究所
雑誌
基盤研究(A)
巻号頁・発行日
2011-04-01

統計的信号処理と音楽理論の数理モデルを融合して、音楽(および音響・音声)の信号処理と情報処理に多面的に取り組んだ。音声認識分野では音響処理と言語処理の融合がキー技術であったように、音楽においては信号処理と音楽理論の融合が必須である。具体的には、A: 数理モデルと統計学習を軸にした音楽信号の解析・変換・加工・分離・検出、B: 音楽理論の数理的定式化を軸にした音楽信号の和音認識・リズム解析・セグメンテーション・構造解析・ジャンル認識、C: 機械学習と最適化を軸にした自動演奏・自動作曲・自動伴奏・自動編曲などを研究・開発した。
著者
齋藤 大輔 田中 雅人 齋藤 恵一 納富 一宏 東 吉彦 犬井 正男 斎藤 正男
出版者
バイオメディカル・ファジィ・システム学会
雑誌
バイオメディカル・ファジィ・システム学会大会講演論文集 (ISSN:13451510)
巻号頁・発行日
vol.25, pp.175-178, 2012

The approach of the accessibility is necessary for all the people to be able to use the Internet. As the visual elements are very important factors in the Internet, in our previous study, the visibilities of young adults, the elderly and dichromatic vision persons were evaluated on white background using the simulation filters. In this report, we evaluated the visibilities between black background and 21 foreground colors, and developed the expression for visibility prediction by the multiple regression analysis using color brightness difference and color difference which was derived from RGB value. As the results, as is the case in the white background, the visibility was correlated with color difference. Moreover, it was shown that all group's visibility is judged high when the range for color brightness difference is 120.3 or more.
著者
峯松 信明 櫻庭 京子 西村 多寿子 喬 宇 朝川 智 鈴木 雅之 齋藤 大輔
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.1, pp.12-26, 2011-01-01

近年の計算機性能の飛躍的な向上により,大規模語彙を対象とした音声認識は実用段階を迎えている.音声合成においても話者性や発話スタイルを制御できる合成方式など,種々の応用場面を念頭においた技術開発が行われている.その一方で,音声工学研究の目的を「人間に匹敵するような」音声言語情報処理能力の計算機実装と考えた場合,人間と機械との間には,今なお,大きな溝があることも指摘されている.本研究ではまず,現在の音声認識・音声合成相当の情報処理を行う人間が現に存在した場合,その人間の挙動は,音声言語の獲得に困難を示す重度自閉症者の挙動と類似するであろうことを指摘する.その上で,(定型発達を遂げた)人間らしい音声情報処理の実現に向けて,現在の音声技術に欠けている基礎技術は何であるのかを幅広い視点から考え,欠損技術の一つとして「音声に含まれる言語的情報を,非言語的情報から音響的に分離して抽出する技術」を主張する.と同時に,その実現に向けて一つの技術的提案を行い,いくつかの実験結果を述べる.