著者
羽石 英里 河原 英紀 岸本 宏子 竹本 浩典 細川 久美子 榊原 健一 新美 成二 萩原 かおり 齋藤 毅 藤村 靖 本多 清志 城本 修 北村 達也 八尋 久仁代 中巻 寛子 エリクソン ドナ
出版者
昭和音楽大学
雑誌
基盤研究(C)
巻号頁・発行日
2013-04-01

歌手は自らの身体が楽器であるため、歌唱にかかわる諸器官の動きを視認することができない。本研究では、歌手の身体感覚と実際の現象との対応関係を検証することを目的として、歌手へのインタビューを行い、歌唱技術の要とされる横隔膜の動きを実時間での磁気共鳴画像法(MRI動画)を用いて可視化した。その結果、プロ歌手の制御された横隔膜の動きが観察され、その現象が歌手の主観的な身体感覚の説明とも一致することが明らかになった。また、声道や舌の形状、ヴィブラートにも歌唱技術を反映すると思われる特性がみられた。本研究で提案されたMRIによる撮像法と分析法は、歌唱技術を解明する上で有用な手段のひとつとなりうるであろう。
著者
大竹 稔 齋藤 毅 三好 正人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.113, no.349, pp.79-83, 2013-12-13

本稿では,愛知県三河地方から石川県への転居者,三河弁話者,石川方言話者を対象に,転居による方言の音響的変化を調査した.話者による意図的な制御が困難とされる母音(母音ホルマント周波数F1,F2とMFCC),鼻濁音(鼻音ホルマント周波数)の音響特徴を調査した.分析の結果,転居者の三河弁の母音ホルマント周波数F1,F2,MFCC,鼻音ホルマント周波数は,石川方言に近い傾向がみられた.これらは,転居者の三河弁の調音が石川方言の影響を受けて変化している可能性があることを示唆している.
著者
齋藤 毅
出版者
金沢大学
雑誌
若手研究(B)
巻号頁・発行日
2011

本研究では,多様で表情豊かな歌声を合成可能にする歌声合成技術の構築を目指し,以下に示すの4つの成果を達成した.(1)オペラ・ポピュラー歌唱者25名による歌声500トラックから構成される歌声データベースの構築.(2)歌声の裏声・地声(声区)の生理的・音響的特徴の操作に基づく声区識別・変換手法の構築(3)オペラ歌唱固有の音響特徴の制御に基づくオペラ歌唱合成手法の構築.(4)歌手の個性を規定する音響特徴量の検討.これらの成果は,従来の歌声合成で実現できなかった豊かな声質,高度な歌唱技量に基づく歌唱スタイルを表現可能にするものである.
著者
榊原 健一 林 良子 後藤 多嘉緒 河原 英紀 牧 勝弘 齋藤 毅 山川 仁子 天野 成昭 山内 彰人
出版者
北海道医療大学
雑誌
基盤研究(B)
巻号頁・発行日
2015-04-01

喉頭音源に関連する声質の客観的表記に関し、生理学的、物理学的視点から、音源となる振動体の分類により(i) 声帯発声 ; (ii) 声帯-仮声帯発声; (iii) 声帯-披裂部発声; の3種類の有声音と,無声音である声門乱流雑音発声と分類が可能であり、有声音源に関しては、物理的・音響的特徴から周期的、準周期的、非周期的の3つの振動への分類を提案した。また、声質表現として緊張-弛緩と声門開放時間率との関係を明らかにし、声質の客観的な表現語として適切であることを明らかにした。声門開放時間率の分析方法として、余弦級数包絡の複素wavelet分析に基づく簡易なGCI, GOIの検出方法を考案した。
著者
齋藤 毅 辻 直也 鵜木 祐史 赤木 正人
出版者
Acoustical Society of Japan(日本音響学会)
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.64, no.5, pp.267-277, 2008-05-01

歌声特有の音響特徴量と歌声知覚の関係を検討するために,歌声らしさの知覚モデルを提案する。このモデルは,「歌声らしさという聴覚印象が複数の基本的な心理的特徴の知覚に起因する」という仮説のもと,歌声らしさと音響特徴量の対応関係の間に基本的な心理的特徴を介した3層で構成される階層構造モデルである。第1層(歌声らしさ)と第2層(基本的な心理的特徴)の関係については,多次元尺度構成法と重回帰分析によって調査した。第2層と第3層(音響特徴量)の関係については, STRAIGHTを用いた音響分析・合成と心理物理実験によって調査した。その結果, "揺れ," "響き"といった基本的な心理的特徴が歌声らしさの聴覚印象に大きく寄与しており,両者の聴覚印象には基本周波数の準周期的な振動成分であるヴィブラートとそれに同期したホルマントの振幅変調成分,及び3kHz付近の顕著なスペクトルピーク成分と同帯域の強い高調波成分がそれぞれ寄与していることが明らかとなった。更に,これらの音響特徴量を話声に付与することで歌声らしさの聴覚印象が向上する結果を得た。以上から,歌声らしさの知覚モデルを構築することで,歌声知覚における歌声特有の音響特徴量の役割について詳細に検討することが可能であることを示した。
著者
齋藤 毅 後藤 真孝
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.109, no.100, pp.1-6, 2009-06-18
被引用文献数
2

歌唱指導による歌声中の音響特徴の変化を分析し,その変化が歌唱力評価与える影響を調査した.3名の男性アマチュア歌唱者が歌唱指導を受ける前,及び後に収録した歌声(歌謡曲歌唱)を対象に,歌声特有の各種音響特徴を分析した結果,歌唱ホルマントに類似した3kHz付近のスペクトルピークの生起,及びF0変動成分であるオーバーシュートとヴィブラートにおける特性の変化を確認した.聴取実験によってF0情報及びスペクトル情報の変化に対する歌唱力変化を調査した結果,F0変化を指導前から指導後のパターンに変化させた場合の方がスペクトルを変化させた場合に比べて歌唱力の向上が大きい結果となった.また,個々の音響特徴の歌唱力評価への寄与度を比較した結果,ヴィブラート,歌唱ホルマント,オーバーシュート,プレパレーションの順で大きいことが明らかとなった.
著者
北村 達也 伊藤 仁 蒔苗 久則 齋藤 毅 網野 加苗 竹本 浩典
出版者
甲南大学
雑誌
基盤研究(B)
巻号頁・発行日
2013-04-01

本研究では,話者の声質の多様性を生み出す身体的な基盤について,生体観測技術と数値音響解析技術を用いて検討を行い,以下の成果を得た.(1) 発話運動の形態と動態を3次元MRI同期撮像法により計測し,対応する音声と組み合わせ,データベースを構築した.(2) このデータベースに基づいて発話器官のモデルを開発した.(3) 声質への寄与が大きい鼻腔・副鼻腔の音響特性を解析した.(4) プロの物真似タレントの物真似発話時,および声優の発話時の声道形状を観測し,声質の多様性を生み出す原理を調査した.(5) 磁気センサシステムのセンサを改良し発話への影響を軽減するセンサを開発した.このセンサは市販されている.
著者
齋藤 毅 後藤 真孝 鵜木 祐史 赤木 正人
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.12, pp.25-32, 2008-02-08
被引用文献数
7

本稿では,歌詞の朗読音声(話声)を歌声に変換する歌声合成システムSingBySpeakingについて述べる.このシステムは,音声分析合成系STRAIGHTによる分析/合成処理過程において,基本周波数(F0),スペクトル,音韻長を制御するモデルによって歌声特有の音響特徴を操作することで話声を歌声に変換する.F0 制御モデルは,楽譜情報から得られるメロディの遷移の概形に対して,4種類の動的変動成分(オーバーシュート,ヴィブラート,プレパレーション,微細変動)を付与することで歌声のF0変化パターンを生成する.スペクトル制御モデルは,話声のスペクトルに対して,歌唱ホルマントとヴィブラートに同期したホルマントの振幅変調を付与することで歌声のスペクトル形状を生成する.音韻長制御モデルは,楽曲のテンポに基づいて,話声中の各音韻長を歌声の音韻長に伸長する.システムで合成された音声を聴取実験によって評価した結果,各種音響特徴を制御することで話声から歌声に変換され,すべての特徴を制御した合成音の音質は原音声と同程度であることを示した.This paper describes a novel singing voice synthesis system SingBySpeaking that can synthesize a singing voice, given a speaking voice reading the lyrics of a song and its musical score. The system is based on the speech manipulation system STRAIGHT and comprises three models controlling three acoustic features unique to singing voices: the fundamental frequency (F0), phoneme duration, and spectrum. Given the musical score and its tempo, the F0 control model generates the F0 contour of the singing voice by controlling four types of F0 fluctuations: overshoot, vibrato, preparation, and fine fluctuation. The duration control model lengthens the duration of each phoneme in the speaking voice by considering the duration of its musical note. The spectral control model converts the spectral envelope of the speaking voice into that of the singing voice by controlling both the singing formant and the amplitude modulation of formants in synchronization with vibrato. Experimental results show that the proposed system can convert speaking voices into singing voices whose naturalness is almost the same as actual singing voices.
著者
遠城 秀和 齋藤 毅 角谷 恭一 塚本 真里子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. KBSE, 知能ソフトウェア工学 (ISSN:09135685)
巻号頁・発行日
vol.102, no.602, pp.49-54, 2003-01-20

現代社会において、企業活動を安定、さらにはより発展させていくためには、従来の企業活動の枠を越え、企業内、または企業間における単なる情報共有から、戦略、目標の共有=コラボレーションヘの発展が不可欠と考えている。また、このようなコラボレーションを促進、定着させるためのITソリューションとして、「コラボレーションウエア」の開発を進めている。