著者
辰巳 直也 森勢 将雅 片寄 晴弘
出版者
情報処理学会
雑誌
研究報告エンタテインメントコンピューティング(EC) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.17, pp.1-6, 2010-03-05
参考文献数
8

Vocaloid 「初音ミク」 の発売以来,歌唱合成に対する注目が高まりつつある.Vocaloid では,メロディーと歌詞を入力することにより歌声を生成できる.また,表情パラメタを調整することにより様々な表情を付与することができる.しかし,より人間らしい歌声にするには,表情パラメタの調整を細かく設定することが必要なため,非常に煩雑で時間がかかる.本研究では,あらかじめ,特定の歌唱者 (GACKT) の歌い方にみられるビブラートやポルタメントといった音量,音高等の特徴を表情パラメタとして抽出しておき,それらを Vocaloid の出力に付加することで,より,当該の歌唱者らしい歌い方を実現するような GACKT レゾネータの開発を目指す.Since the release of Vocaloid "Hatsune Miku," voice synthesizing applications have been known to the public people. Vocaloid generates vocal melodies, from the given lyrics and melodies, and provides users with the interfaces for adjusting parameters for expression control. However, setting parameters for elaborating natural expressiveness requires complicated operations. This paper introduces a vocal resonator that makes the vocal melodies more natural by copying the characteristics of a professional singer's (GACKT) singing.
著者
辰巳 直也 森勢 将雅 片寄 晴弘
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-6, 2010-10-07

Vocaloid 「初音ミク」 の発売以来,歌唱合成に対する注目が高まりつつある.Vocaloid では,メロディと歌詞を入力することにより,サンプリングされた人の声を元にした歌声を合成することができる.また,表情パラメタを調整することにより,様々な表情を付与することができる.しかし,より人間らしい表情豊かな歌声にするには,表情パラメタの調整を細かく設定することが必要なため,非常に煩雑で時間がかかる.本研究では,ロック歌手の一人 「GACKT」 の歌い方に見られるビブラートやポルタメントといった音高・(音量) 等の歌唱技法を低次のモデルパラメタで近似し,混合ガウス分布を用いた手法でモデルパラメタを決定する.それらの値を Vocaloid の出力に付加することで,ロック歌手らしい歌い方を実現する 「ロックボーカルレゾネータ」 を提案する.Since the release of Vocaloid "Hatsune Miku", voice synthesizing applications have been known to the public people. Vocaloids generate human-like vocal melodies by giving lyrics and melodies. If the parameters for expression control are elaborated, Vocaloids yield more natural vocals. However, setting these parameters requires complicated expertise. This paper proposes a system called "Rock Vocal Resonator" that emphasizes Rock vocalist styles for Vocaloids, based on analysis of a Japanese Rock singer, GACKT's singing.
著者
森勢 将雅 藤本 健 小岩井 ことり
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.63, no.9, pp.1523-1531, 2022-09-15

本論文では,統計的歌声合成に向けた日本語の歌唱データベース(以下ではデータベースをDBと呼称する)を構築した結果について報告する.歌唱DBは歌声のジャンルを統一して構築することが望ましく,著作権上の問題を勘案し,従来は著作権の切れた童謡が用いられてきた.一方,2019年に改訂された著作権法第三十条の四に基づき,利用条件に制約があるものの,既存の楽曲を用いた歌唱DBを研究者向けに公開する動きもある.本研究は,さらに利用条件を緩めるため,従来の歌唱DBと同程度の規模ですべてオリジナルの楽曲で構成される新たな歌唱DBを構築する.構築する歌唱DBでは,音高,音高遷移,音符の長さや,日本語で出現するモーラを幅広くカバーすることで,様々な楽曲の合成に対応できることを目指す.既存の歌唱DBと比較してカバーするモーラの種類が多いことを確認し,エントロピーによる評価では,全項目で最高値ではないものの,良好な結果を達成した歌唱DBであることが示された.
著者
森勢 将雅
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.74, no.11, pp.608-612, 2018-11-01 (Released:2019-05-01)
参考文献数
18
著者
森勢 将雅 山下 洋一
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.4, pp.1-6, 2012-08-02
被引用文献数
2

スマートフォン等のマイクロフォンを備えた携帯端末は,携帯電話としての機能だけではなく,音楽再生,音収録等様々な機能をユーザに提供しつつある.本研究では,スマートフォンを用いた音楽試聴スタイルの 1 つとして,タイトルやアーティスト等の情報,および歌詞が音楽に同期して表示される音楽試聴システムの実現に取り組む.本システムを実現するため,音楽に知覚的な影響を与えず情報を埋め込み,埋め込まれた情報をリアルタイムで抽出する技術を提案する.知覚に影響せず情報を埋め込むための技術として電子透かしが一般的に用いられるが,雑音に対する頑健性や通信速度の問題があり,実時間での情報伝達手段に用いることは困難であった.本研究では,モスキート音の考え方に基づくシンプルな方法を提案することで,目的とするシステムへの要求を満たす技術の確立を目指す.本稿では,モスキート音を用いた電子透かしの概要,および情報を埋め込むための仕様について説明する.次いでスマートフォン上に実装されたプロトタイプシステム,およびいくつかの音楽を用いた動作確認テストにより本システムの有効性について議論する.Smartphone that has a microphone has been used as a good tool for dairy life, and we can easily record a sound. In this research, a lyric-synchronized music listening system with smartphone is introduced to provide users with a new music listening style. The system can display the information such as title, lyric, and so on, extracted from the recorded music. The information is hidden in the music signal to avoid deteriorating the sound quality. Digital watermarking is one of the technology to hide the information, and several watermarking technologies for audio signal have been proposed. However, it was difficult for them to realize the good noise tolerance and transmission performance. In this paper, we focus on the mosquito sound to develop the digital watermarking to solve these problems. This paper shows the method to hide the information and the specification about the transmission of the information. The implemented system is introduced and tested in a real environment, and its effectiveness is also discussed.
著者
森勢 将雅 能勢 隆
出版者
山梨大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2016-04-01

VOCALOIDを代表とする歌声合成ソフトウェアが広く一般に普及するにつれ,計算機による「人間的」な歌唱を目指す数多くの取り組みがなされてきた.一方,Auto-Tuneなどのソフトウェアを用いた「非人間的」な歌唱もコンテンツとして利用されている.ここでは,コンテンツとしての自然さと非人間性を両立する歌声が存在するか確認するため,人間性を制御する加工法について研究に取り組んだ.実験の結果,提案法により,人間の歌声が有する揺らぎ成分を除去するという従来のアプローチだけではなく,誇張させた場合でも一定の自然さを保ちつつ非人間的な歌声を生成できることを確認した.
著者
河原 英紀 森勢 将雅 西村 竜一 入野 俊夫
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-95, no.4, pp.1-6, 2012-05-26

シャウトやデスボイスなどの激しい表現は、ポピュラー歌唱で広く用いられている。これらを適切に分析、再現、制御する方法を明らかにすることは、歌唱合成システムに豊かな表現力を与えるために解決すべき重要な課題である。本報告では、まず、新たに開発した高い時間分解能を有する基本周波数抽出法とそれに基づく TANDEM-STRAIGHT により、様々な歌唱音声を分析した結果について報告する。分析結果は、激しい表現にいおいて、70 Hz付近に 20 dB程度の高さのピークを有する高速の (基本周波数の) 周波数変調と、同様に、高速の (スペクトル包絡の) 振幅変調が存在することを示した。このような高速の変調の存在は、これまでにはっきりとは報告されていない。予備的な実験により、それらの高速の変調を加工することにより、発声の声区と努力の印象を保ったまま、シャウトなどの歌唱表現の強さ (生々しさ) を制御できる可能性が示された。
著者
辰巳 直也 馬場 隆 森勢 将雅 片寄 晴弘
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2012-SLP-90, no.12, pp.1-6, 2012-01-27

Vocaloid 「初音ミク」 の発売以来,歌唱合成に対する注目が高まりつつある.Vocaloid では,メロディと歌詞を入力することにより,サンプリングされた人の声を元にした歌声を合成することができる.また,表情パラメタを調整することにより,様々な表情を付与することができる.しかし,より人間らしい表情豊かな歌声にするには,表情パラメタの調整を細かく設定することが必要なため,非常に煩雑で時間がかかる.本研究では,Vocaloid 歌唱をロック歌手風の歌い方に変換し,Vocaloid 歌唱における作り込みを支援する 「ロックボーカルレゾネータ」 の提案をする.
著者
森勢将雅 村主 大輔 馬場 隆 片寄 晴弘
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.54, no.4, pp.1244-1253, 2013-04-15

電子的に合成される歌唱が音楽コンテンツ制作に用いられるようになって以来,パソコンを用いた音楽制作はこれまでにない盛り上がりを見せている.Vocaloidに代表的される歌唱合成ソフトウェアでは,煩雑なパラメータの調整(歌唱デザイン)が自然な歌声を生み出すために必要であり,クリエイタは,作業時間の多くを歌唱デザインに割いている.本研究では,歌唱デザインの1つの形として,歌唱素材に対して,特定の歌手の歌唱スタイルを転写する方法を取り扱う.本論文では,島唄風歌唱における歌唱技巧「グイン」を対象とし,入力された歌声を島唄風に変換する技術,および,歌唱デザインを支援するインタフェース「グインレゾネータ」を提案する.F値により性能を評価した結果,67.8%であることが示され,主観評価では知覚的にグインを転写できることが確認された.
著者
高木 信二 倉田 岳人 郡山 知樹 塩田 さやか 鈴木 雅之 玉森 聡 俵 直弘 中鹿 亘 福田 隆 増村 亮 森勢 将雅 山岸 順一 山本 克彦
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2018-SLP-120, no.14, pp.1-9, 2018-02-13

2017 年 8 月 20 日から 8 月 24 日にかけ,ストックホルム ・ スウェーデンで Interspeech 2017 が開催された.Interspeech は音声言語情報処理の分野におけるトップカンファレンスと位置付けられており,今後の本分野の動向に大きく影響を与えている.本稿では,本会議における研究動向,注目すべき発表について報告する.
著者
小川 樹 森勢 将雅
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J103-D, no.4, pp.205-214, 2020-04-01

音声合成や声質変換に関する技術は幅広く提案され,既にいくつもの製品が多岐にわたって利用されるようになった.声質変換技術の普及により,音声の加工も誰でも手軽に行えるようになった.音声の加工には,音の3要素と呼ばれる「大きさ」,「高さ」,「音色」をそれぞれ加工する方法が広く用いられている.大きさや高さは,音圧レベルや基本周波数を加工するため,加工の結果の予測が容易である.しかし,音色の加工は,加工に伴う劣化の予測が困難という問題点がある.本研究では,音声の音色加工に伴う劣化を計測する知覚モデルによりこの問題の解決を図る.様々なスペクトル尺度と距離関数の組み合わせと音質の関係を調査し,その結果を用いて知覚モデルを開発した.主観評価実験を実施し,従来法と開発した知覚モデルの間に,主観評価結果との相関係数の有意差があるかの検定を行った.検定の結果,p<0.001で有意な差があり,従来法より開発した知覚モデルが優れていることを示した.
著者
村主 大輔 馬場 隆 森勢 将雅 片寄 晴弘
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.3, pp.1-8, 2012-01-27

日本ではカラオケや DTM の普及によって音楽活動がますます一般化され,年間 200 組以上のアーティストがメジャーデビューしている.それに伴い,新たなジャンルや歌唱スタイルが生まれることは少なくない.その一つの例として,ポピュラーソングに沖縄や奄美大島などアーティスト出生地の特色を出した音楽表現のスタイルが近年注目されるようになっている.そこで本研究は,歌唱スタイルが特徴的な奄美大島出身歌唱者の歌い回しに注目し,一般歌唱を奄美大島出身の歌唱者の歌い回しにするシステムの開発を目指す.具体的には,「グイン」 と呼ばれる奄美大島出身歌手の歌唱音声を歌唱特徴の定量的な分析を実施し,その分析結果に基づいて,一般歌唱に 「グイン」 を付加するシステムの概要と,その動作結果について報告する.The recent spread of "Karaoke" and DTM has been promoting music production more generally, and more than 2 hundreds musicians make their debuts in Japan. This leads emergence of new singing styles. Among them, "Okinawa-style" or "Amami-style" is typical one that has been popular recently. We have been developing an assistance system for designing "Okinawa-style" or "Amami-style" vocal melodies. In this paper, we report acoustic analysis of "Amami-style," especially singing style called "guin" and propose a "Amami-style" singing generator, called "Guin-Resonator."
著者
村主 大輔 馬場 隆 森勢 将雅 片寄 晴弘
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-94, no.3, pp.1-8, 2012-01-27

日本ではカラオケや DTM の普及によって音楽活動がますます一般化され,年間 200 組以上のアーティストがメジャーデビューしている.それに伴い,新たなジャンルや歌唱スタイルが生まれることは少なくない.その一つの例として,ポピュラーソングに沖縄や奄美大島などアーティスト出生地の特色を出した音楽表現のスタイルが近年注目されるようになっている.そこで本研究は,歌唱スタイルが特徴的な奄美大島出身歌唱者の歌い回しに注目し,一般歌唱を奄美大島出身の歌唱者の歌い回しにするシステムの開発を目指す.具体的には,「グイン」 と呼ばれる奄美大島出身歌手の歌唱音声を歌唱特徴の定量的な分析を実施し,その分析結果に基づいて,一般歌唱に 「グイン」 を付加するシステムの概要と,その動作結果について報告する.
著者
的場達矢 馬場隆 成山隆一 松本秀一 森勢将雅 片寄晴弘
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014-MUS-102, no.12, pp.1-5, 2014-02-16

VOCALOID などの音声合成技術の普及に伴い,歌声に関連する研究は活性化し,歌声情報処理と呼ばれる研究領域が定着した.また,歌声のうまさを自動採点する技術が実用化され,プロ歌手が 「うた」 の上手さを競う TV 番組が制作されるなど,歌のうまさについて興味が高まっている.Pops 歌唱の主要な表現対象の一つに 「グルーブ感」 が存在するが,その構成要因については明らかになっていない.本稿では,プロ歌唱者による 「グルーブ歌唱」 と 「非グルーブ歌唱」 の比較に基づいて,聴取者が 「グルーブ感」 を感じる要因が何であるのかについて検討した結果について報告する.分析の結果,子音長が 「グルーブ感」 の重要な構成要因であることが見いだされた.
著者
森勢将雅 河原 英紀 片寄 晴弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2008, no.50, pp.117-122, 2008-05-21

STRAIGHT を用いた音声モーフィング技術の拡張として,スペクトル包絡,基本周波数を個別にモーフィングできる,部分モーフィングが提案された.さらに,部分モーフィングを用い,歌唱の特徴を声質・歌い回しに分離し,それぞれを個別にモーフィングできる歌唱デザインインタフェースが提案されている.今回,声質・歌い回しについて様々なモーフィング率で合成した歌唱をあらかじめデータとして蓄積し,波形を接続することで擬似的にリアルタイムでモーフィング率を変化させることが可能なインタフェースを実装した.本報告では,再生中にリアルタイムでモーフィング率を変化させる方法,停止中にモーフィング率の時系列を編集し,編集されたモーフィング率の時系列に基づいて再生を行う方法について説明する.また,リアルタイムにモーフィング率を変化させた歌唱の品質や問題点について述べる.Partial morphing by using STRAIGHT was proposed for independent processing in spectral and source parameters. Moreover, an extension of partial morphing, which enables individual control of voice identity and singing style, was implemented to design the singers' voice identity and their singing style. We describe the implementation of the real-time application in STRAIGHT-based morphing system. This morphing system enables us to control two (voice identity and singing style) morphing-rate during reproducing. This paper shows how to achieve the "real-time" morphing by using a lot of synthesized voices. The quality of real-time morphed singing is also discussed.
著者
田原 佳代子 高橋 徹 森勢 将雅 坂野 秀樹 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.198, pp.19-24, 2005-07-14

歌唱音声のパラメタ(ピッチ, 音量, 音色)には, ランダムな揺らぎと系統的な変化が含まれている.本報告では音量により系統的に変化する音色の成分を明らかにすることを狙い, RWC研究用音楽データベース中の歌唱音声と新たに録音した男性歌手による歌唱音声素材の分析を行った.新たな録音では, RWC研究用音楽データベースに収録されていない連続的な音量変化の影響を調べるため, 一定音量の歌唱に加え, クレッシェンドとデクレッシェンド歌唱を収録した.これらの素材は, STRAIGHTにより分析された後, 1/3オクターブ毎のレベルに変換され主成分分析により直交する成分に分解された.音量を独立変数, 主成分得点を従属変数とする回帰分析の結果は, 第一主成分と音量との高い相関を示した.この結果に基づき, 本報告では, 第一主成分に対応する固有ベクトルを用いた音色制御法を提案した.予備実験の結果は, 合成歌唱によるクレッシェンドおよびデクレッシェンドの自然性が, 提案した方法を用いることにより改善されることを示した.
著者
坂野 秀樹 森勢 将雅 高橋 徹 西村 竜一 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.551, pp.157-162, 2008-03-13
被引用文献数
2

実時間動作するSTRAIGHT,リアルタイムSTRAIGHTの改良を行ったので,その詳細について報告する.高品質音声分析変換合成法STRAIGHTは極めて高品質であり,合成システムや聴覚実,験用のツールとして広く利用されるようになってきている.STRAIGHTは,MATLABによって実装されており,オフラインでの処理にはこれが広く用いられているが,実時間で動作するものではない.そこで,我々は,実時間で動作するリアルタイムSTRAIGHTをC言語による実装で構築してきた.今回は,まず,C言語によるSTRAIGHTの実装であるC言語版を,MATLAB版STRAIGHTの最新版と同等のものに更新した.そして,このC言語版の関数の一部を利用し,リアルタイムSTRAIGHTのスペクトル抽出部分を改良した.改良したリアルタイムSTRAIGHTを用いて主観評価実験を行った所,MOS値が3.4となり,これまでのリアルタイムSTRAIGHTに比べ0.7程度改善したことが分かった.また,C言語版STRAIGHTにおいては,バージョンによるAPIの違いが大きいという問題があった.今回,このような問題を解決したC言語版STRAIGHTのAPIを策定し,STRAIGHTライブラリとして実装した.
著者
森勢 将雅
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.79, no.1, pp.9-17, 2022-12-25 (Released:2023-02-01)
参考文献数
24

本論文では,テキスト音声合成の中でも特にEnd-to-End音声合成時代に向けた大規模日本語コーパスROHANを提案する。ROHANは常用漢字すべてを網羅しつつ,日本語文章では出現しにくいモーラを一定数含めるモーラバランスを重視している。オリジナルのコーパス文4,600文を22のサブセットとして構築しており,パブリックドメインのライセンスで公開している点も,本コーパスの特色である。本論文では,ROHANの設計コンセプトと具体的な作成手順を示し,各モーラの出現回数やコーパス文の平均モーラ数などの解析結果を示す。モーラ出現頻度に関するエントロピー,及び音素の拡張エントロピーによる評価から,既存のコーパスよりもモーラ・音素バランスに優れていることも示す。