能勢 隆 (Takashi Nose) (@takashi_nose)

投稿一覧(最新100件)

おそらくですが、下記の手法は私が約10年前に提案したHMM+量子化F0に基づく任意話者声質変換法と似たようなことをやっているのでは、と想像。一番大きな違いは合成をニューラルベースにしたことかなと。https://t.co/ZgZBr7BV1Y https://t.co/nezNDGwmO1 間違ってたらすみません^^; https://t.co/tKbrWr3mw5
@aman0_kei あ、そういう切り口でしたか。なにげに最近のニューラルボコーダの考え方に近くて驚きました。ちなみに声帯から出る音は喉頭原音と呼ばれるようで、音声のみからは正確にはわかりませんが、https://t.co/ptpSImR423 https://t.co/a4P2pEonxp あたりに説明がありますね。
10年くらい前に、今はなきATRの音声研にインターンに行ったときのテーマが言語獲得でした。私はお手伝い的なポジションでしたが、端点フリーDPマッチング使ってたなあ。「モデル選択による言語獲得手法とその評価」https://t.co/ob0d002AGP でも、「実現へ一歩」って多分ずっと言われている気がする。 https://t.co/dWeBKSnAEw

お気に入り一覧(最新100件)

フォロー(10ユーザ)の投稿一覧(直近7日間)

フォロワー(479ユーザ)の投稿一覧(直近7日間)