著者
才野 慶二郎 大浦 圭一郎 橘 誠 剣持 秀紀 徳田 恵一
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2012, no.7, pp.1-6, 2012-01-27

ラップのような短時間のうちに音高などの特徴が大きく変動するスタイルの歌い方は,それを適切に表現するための記譜法が確立されておらず,従来のように五線譜基づく合成の仕組みではユーザが直観的にそのスタイルの歌声を再現することが難しかった.本稿では,ラップスタイルの歌唱のための記譜法を定義し,それを用いて HMM 歌声合成の枠組みでラップスタイルの歌声合成を行った.その結果得られた合成音声はラップ特有のグリッサンド技法によるピッチ変動の現象を含むものになっていることが確認された.また,合成時に得られる対数基本周波数系列を素片接続型の歌声合成器に与えてラップスタイルの歌声を合成することも試みた.This paper addresses rap-style singing voice synthesis. Since it has not been very clear how to write a musical score for rap-style songs, existing singing voice synthesis systems based on musical scores are not suitable for synthesizing them with an intuitive input. Here a new type of musical score specialized for a rap-style is defined. An HMM-based singing voice synthesis system is used to realize an automatic synthesis of realistic rap-style singing. Glissando phenomenon which is special for the style could be found in synthesis results. It was also tried to apply pitch parameters generated from the HMMs to a sample-concatenation-based singing voice synthesis system.
著者
橘 誠
出版者
東京大学
雑誌
特別研究員奨励費
巻号頁・発行日
2009

本年度は、アメリカのインディアナ大学・中央ユーラシア学部において在外研究を行い、主にこれまでの研究成果を国外に発信することに努めた。在外研究中、The Association for Asian Studies、The Mongolia Society、Annual Central Eurasian Studies Conferenceなどのアメリカの学会において、それぞれ"Mongolian Independence and International Law","Bogd Khaan Government and Qinghai Mongols","The Birth of the National History of Mongolia : On 'gangmu bicig ba nebterkei toli'"と題する報告を行い、またインディアナ大学内の東アジア研究センター、中央ユーラシア学部のコロキアムにおいても報告の機会を得、"Translationsin Early 20th century Mongolia"、"The Forgotten History of Mongolia : Bogd Khaan Govemment 1911-1921"という報告を行った。また、モンゴル国では、第10回世界モンゴル学者会議、第4回ウランバートル国際シンポジウム「20世紀におけるモンゴルの歴史と文化」、国際会議「モンゴルの主権とモンゴル人」において、それぞれ「モンゴル国の政治的地位-宗主権をめぐって」、「ボグド・ハーン政権の歴史的重要性-モンゴルにおける2つ『革命』」「20世紀初頭の『モンゴル史』における内モンゴル-帰順した旗について」という報告を行った。日本では、辛亥革命百周年記念東京会議において、「辛亥革命と『モンゴル』-独立か、立憲君主制か、共和制か」と題する報告を行った。その他、昨年上梓した『ボグド・ハーン政権の研究-モンゴル建国史序説1911-1921』のモンゴル語版〓〓〓〓〓〓〓〓1911-1921(『忘れ去られたモンゴル史-ボグド・ハーン政権1911-1921』)をモンゴル国において出版した。
著者
橘 誠 中岡 慎一郎 剣持 秀紀
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.14, pp.1-6, 2010-02-08

本稿では,2009年10月に開催されたCEATEC JAPAN 2009にて,ヤマハブースに出展した歌声合成システムVOCALOIDと産業技術総合研究所が開発したサイバネティックヒューマンHRP-4C"未夢"のコラボレーションによる歌うロボットの演出について,その概要とデモシステムの技術を紹介する.This paper describes the technique applied to a robot to perform singing-voice as exhibited at CEATEC JAPAN 2009. To achieve a realistically robot-singing performance, facial motions such as lip-sync and facial gestures are required. This work is a result of a collaboration between the technology "VOCALOID" (developed by YAMAHA) and the cybernetic Human HRP-4C named "Miim" (developed by AIST). We report the technical overview of the system developed for the mentioned exhibition.
著者
橘 誠
出版者
全国大学国語教育学会
雑誌
国語科教育 (ISSN:02870479)
巻号頁・発行日
vol.19, pp.104-105, 1972-03-28
著者
橘 誠 才野 慶二郎 久湊 裕司
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2013-SLP-99, no.22, pp.1-6, 2013-12-12

HMM 音声合成は統計的な韻律のモデル化により,話者性やスタイルを柔軟に多様化することができる.本稿では,その表現力を波形素片接続型の歌声合成システムである VOCALOID™ に取り入れる方法として,歌唱表現が現れる重要な特徴と考えられるピッチの変化をHMMでモデル化,生成する歌唱スタイル生成手法を提案する.HMM音声合成手法を歌唱スタイルのモデル化に利用する際には,未知の音高に対しても適切なパラメータ生成を行う必要がある.そこで本研究ではピッチベンドチェンジを用いたモデル化を提案する.また,長い時間伸ばされる音符に対して自然な変動を付与するため,ノート内を複数のセグメントに分割した単位でモデル化し,多段階のコンテキストクラスタリングを導入して楽曲構造と音符内の変動を階層的に表現する.また,この手法をVOCALOID™3の機能である Job Plugin として組み込んだ例を紹介する.
著者
才野 慶二郎 大浦 圭一郎 橘 誠 剣持 秀紀 徳田 恵一
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-94, no.7, pp.1-6, 2012-01-27

ラップのような短時間のうちに音高などの特徴が大きく変動するスタイルの歌い方は,それを適切に表現するための記譜法が確立されておらず,従来のように五線譜基づく合成の仕組みではユーザが直観的にそのスタイルの歌声を再現することが難しかった.本稿では,ラップスタイルの歌唱のための記譜法を定義し,それを用いて HMM 歌声合成の枠組みでラップスタイルの歌声合成を行った.その結果得られた合成音声はラップ特有のグリッサンド技法によるピッチ変動の現象を含むものになっていることが確認された.また,合成時に得られる対数基本周波数系列を素片接続型の歌声合成器に与えてラップスタイルの歌声を合成することも試みた.
著者
橘 誠 才野 慶二郎 久湊 裕司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.113, no.366, pp.123-128, 2013-12-12

HMM音声合成は統計的な韻律のモデル化により,話者性やスタイルを柔軟に多様化することができる.本稿では,その表現力を波形素片接続型の歌声合成システムであるVOCALOID^<TM>に取り入れる方法として,歌唱表現が現れる重要な特徴と考えられるピッチの変化をHMMでモデル化,生成する歌唱スタイル生成手法を提案する.HMM音声合成手法を歌唱スタイルのモデル化に利用する際には,未知の音高に対しても適切なパラメータ生成を行う必要がある.そこで本研究ではピッチベンドチェンジを用いたモデル化を提案する.また,長い時間伸ばされる音符に対して自然な変動を付与するため,ノート内を複数のセグメントに分割した単位でモデル化し,多段階のコンテキストクラスタリングを導入して楽曲構造と音符内の変動を階層的に表現する.また,この手法をVOCALOID^<TM>3の機能であるJob Pluginとして組み込んだ例を紹介する.
著者
才野 慶二郎 大浦 圭一郎 橘 誠 剣持 秀紀 徳田 恵一
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2012-SLP-90, no.7, pp.1-6, 2012-01-27

ラップのような短時間のうちに音高などの特徴が大きく変動するスタイルの歌い方は,それを適切に表現するための記譜法が確立されておらず,従来のように五線譜基づく合成の仕組みではユーザが直観的にそのスタイルの歌声を再現することが難しかった.本稿では,ラップスタイルの歌唱のための記譜法を定義し,それを用いて HMM 歌声合成の枠組みでラップスタイルの歌声合成を行った.その結果得られた合成音声はラップ特有のグリッサンド技法によるピッチ変動の現象を含むものになっていることが確認された.また,合成時に得られる対数基本周波数系列を素片接続型の歌声合成器に与えてラップスタイルの歌声を合成することも試みた.
著者
橘 誠 才野 慶二郎 久湊 裕司
出版者
一般社団法人情報処理学会
雑誌
研究報告音声言語情報処理(SLP) (ISSN:09135685)
巻号頁・発行日
vol.2013, no.22, pp.1-6, 2013-12-12

HMM 音声合成は統計的な韻律のモデル化により,話者性やスタイルを柔軟に多様化することができる.本稿では,その表現力を波形素片接続型の歌声合成システムである VOCALOID™ に取り入れる方法として,歌唱表現が現れる重要な特徴と考えられるピッチの変化をHMMでモデル化,生成する歌唱スタイル生成手法を提案する.HMM音声合成手法を歌唱スタイルのモデル化に利用する際には,未知の音高に対しても適切なパラメータ生成を行う必要がある.そこで本研究ではピッチベンドチェンジを用いたモデル化を提案する.また,長い時間伸ばされる音符に対して自然な変動を付与するため,ノート内を複数のセグメントに分割した単位でモデル化し,多段階のコンテキストクラスタリングを導入して楽曲構造と音符内の変動を階層的に表現する.また,この手法をVOCALOID™3の機能である Job Plugin として組み込んだ例を紹介する.Recent HMM-based speech synthesis systems have the capability to control speaker/style characteristics by statistically modeling prosodic features of speech. In this paper, we aim to introduce such flexibility into VOCALOID™, a singing voice synthesizer based on concatenative synthesis. An HMM is used to model the pitch trajectory, which is an important feature for expressing singing style. In order to synthesize appropriate results for pitches which do not have training data, we propose using pitch bend change as a feature for training the HMM. We also propose a segment-level unit modeling and multiple-stage clustering technique for the expression of long note sequences. We show the proposed technique implemented as a VOCALOID™3 Job Plugin.
著者
橘 誠 神保 恭一 中田 幸二 羽田野 甫 玉乃井 愛仁 大塚 喬
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. US, 超音波
巻号頁・発行日
vol.96, no.546, pp.1-7, 1997-02-28
被引用文献数
5

回転機械の異常振動や装置設備の漏洩等の異常現象を、音響によって検出するために開発されたパラボラ集音器を対象に、差分法シミュレーションを行った。パラボラ反射器へ取り付けるマイクロホンの位置と向きなどによる、音波伝搬特性の変化を明らかにした。トーンバースト音源に対するマイクロホン受音面の音圧波形を求め、デジタル信号処理を用いた実験と比較検討した。さらに、シミュレーションの結果は、1コマずつ時間を追ってビデオに録画し、動画として表示できるようにした。
著者
川島 啓吾 橘 誠 山岸 順一 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.496, pp.151-156, 2005-12-15

本論文では, 多空間上の確率分布(MSD)に基づくHMMを用いた音声の感情・発話様式の識別について検討している.MSD-HMMにより音声のスペクトル情報と基本周波数(F0)の同時モデル化を行い, 複数の話者の平静調音声で学習されたユニバーサルバックグラウンドモデル(UBM)を目標話者・スタイルの少量の文章によりモデル適応し, 話者及びスタイルの同時適応を行ったモデルを用いて識別を行っている.まずMSD-HMMを用いて特徴量にF0を含めることで識別率が改善することを示し, 次に, 適応時の初期モデルとしてUBMを用いる場合と, 目標話者の読上げ音声から作成した話者依存モデルを使用する場合の比較を行い, UBMを用いて話者とスタイルの同時適応を行った場合においても, 話者依存モデルと同等の性能が得られることを示す.最後に, ナレーション経験のない話者の音声を用いた評価実験を行った結果を示す.