Heiga Zen (全 炳河) (@heiga_zen)

投稿一覧(最新100件)

RT @hidekikawahara: Now, CAPRICEP made an objective comparison of pitch extractors possible. The right bottom extractor shows outstanding p…
RT @hidekikawahara: これも4/1ネタではない。「まだ性懲りもなくVOCODERの話を」のPDFが今日からOPEN access。@heiga_zen さんの原稿を読む前に書いたので内容はかなりの周回遅れ。日本にも研究拠点ができたので、アカデミアの人もGoog…
音響学会誌2018年7月号に載った音声合成に関する記事、PDFがネットに上がってました -- テキスト音声合成技術の変遷と最先端 https://t.co/KSVMZDptFY

お気に入り一覧(最新100件)

ありがとうございます。 VR学会とその運営についての私見を、VR学会史と自分史を紐解きながら書かせて頂きました。 https://t.co/pAzcTnKjBe からPDFでもご覧頂けます https://t.co/SFn7Ep2OmK https://t.co/BfVcTkRFhY
利用価値の高い音声データの録音手順 https://t.co/jLeeijyuwQ
科研費・研究活動スタート支援内定していました 音声合成の声質を制御します! https://t.co/blxmYe6qaY
第18回電子情報通信学会通信ソサイエティ論文賞(和文マガジン論文賞)を頂きました。 https://t.co/sJbK0AgpS4
修士で取り組んだ群遅延特徴量のネタが publish されました。 実際に合成した結果はまた別の機会に。 https://t.co/gIzKe9BkDT
2020年から実施した「なりきりAI 京町セイカ」の実証実験の取り組みが人工知能学会の論文誌(実践AI論文)に採録されました ご当地広報キャラと実用対話システムの融合・実用化を目指し、実証実験で得られたノウハウも色々詰め込んだ論文になります https://t.co/ou4gS4y1QZ https://t.co/gjzgvpKYQv
博士課程に関して昔から一貫して言ってるのは「職業研究者を輩出したい」よりも「博士号を取れる実力のある人を随所に輩出したい」である。ITならエンジニアやコンサルタントも含めて色んな人が博士を志す社会を目指していて現に研究室運営はそっちに向かっている。 (参考: https://t.co/BEoD17Gj29) https://t.co/qJz8J0oWmm
異なる音声表現の調和を保つことに力点を置いた対話音声合成のための音声収集手法の設計 https://t.co/ZlEgvkp2sJ
J-STAGE Articles - 理工系大学・高専の研究室不登校 https://t.co/E7G64hnUtN TLで見かけたこれを読んでみたけど,やっぱり問題の本質は「大学にいる研究者を論文で評価すること」に行き着くんだろうな.学生を使役することが教員自身のキャリアに連動する仕組みに問題がある.
backpropagationしないニューラルネットワーク学習法(2000) https://t.co/F84AWz80C4
一方で対岸のエストニアは,探究型の実験実習などせず,ゴリゴリと科学知識や理論を暗記させ詰め込むのですね https://t.co/2dLN962cCa .その結果PISAの2018年で読解力と科学的リテラシーで1位、数学的リテラシーで3位.相当程度の詰め込みがないと,科学や技術の基盤人材を作ることができないの.
各位だ / おめでとう論文賞 Real-Time Full-Band Voice Conversion with Sub-Band Modeling and Data-Driven Phase Estimation of Spectral Differentials https://t.co/fjSYx9ACf6
「機械学習と音声生成:統計的手法に基づく音声信号モデリング」のところはToda-senseiによるものですかね おそらくこの記事がベースになっていると想像 https://t.co/Y2XH2LlAe3
日本の場合,日米安保があるから一般市民は国家の安全保障を無視して暮らせる特別な立場で,平和維持の努力やコストを考えないし教えないのですよね….この本 https://t.co/03G1yo7MAT によると,2012年の試算で日米安保の維持コストは2兆円未満だけれど,それを自主防衛すると23兆以上かかるという… https://t.co/mzAgm3JXCp
Crazy vocoder は砕けない~でもちょっとくだけた未来の話を~ https://t.co/dvXaYPDPGQ
我々のリアルタイム声質変換の論文(D2佐伯君筆頭)が電子情報通信学会論文賞を受賞いたしました。ありがとうございます。本論文は以下で読む事ができます(無料ダウンロード可)。ご興味がある方はどうぞ。 https://t.co/Vl3D9zYY0W
今月の人工知能学会誌の私のブックマークの特集が「不均衡データ分類」で、応用例・解説・手法のリンク集になっていた 大崎美穂. 2022. “私のブックマーク:不均衡データ分類.” 人工知能 37 (3): 376–81. https://t.co/fCFKZKls9K
Now, CAPRICEP made an objective comparison of pitch extractors possible. The right bottom extractor shows outstanding performance. It is the re-engineered version of my Google UK extractor. I will put it on GitHub. https://t.co/iiHuRxyUPf https://t.co/LSO2yBEKk3 https://t.co/CcHNQiFMSu
連載講座「短時間フーリエ変換入門」の最終回が無料オンライン公開されました! https://t.co/0i96CpPI3b https://t.co/bsWdnRo0dx
K. Matsubara et al., "Comparison of real-time multi-speaker neural vocoders on CPUs" now officially published. Multi-speaker HiFi-GAN with LPCNet features is investigated and compared with MWDLP. https://t.co/ROSUkLapBw
またaかtheかそれとも冠詞を付けないかでよくわからなくなってきたのでググってたら「科学英語文法 覚え書き(冠詞について)」というのを見つけて読んでる。奥が深い・・・ https://t.co/Asp4rjq2Ut
連載講座「短時間フーリエ変換入門」の第四回が無料オンライン公開されました! https://t.co/ZHmNHVe3S6 https://t.co/zsqQk6yGcy
3年前に書いたコラムが気になって、恐る恐る読み返してみた。予想は斜め上に外れて、現実はもっと面白いことになっていた。ますます、大人になってしまうのがもったいなくなった。 https://t.co/cCXck0X0yo https://t.co/o4C0odZovA
連載講座「短時間フーリエ変換入門」の第三回が無料オンライン公開されました! https://t.co/XrJRhvDJHn https://t.co/APq9UqoG0D
これから JSUT や JVS を研究に利用しようと思っているそこの君! 論文には arXiv ではなく以下を引用しよう! https://t.co/1JFjlB3rfP
@heiga_zen 私は "affect burst" は日本語の発表のときでもそのまま使っていました。科研費の報告書では「感情の噴出」と訳を当てましたが、自分でも納得はしていません。 https://t.co/GUejKCJkxw
連載講座「短時間フーリエ変換入門」の第一回が無料オンライン公開されました! https://t.co/dUp9DmAwzG https://t.co/tzD4L5uMGY
Ueno et al., "Convex and Differentiable Formulation for Inverse Problems in Hilbert Spaces with Nonlinear Clipping Effects" https://t.co/OtOp9r8j5Y
「学業成績には,LINE,Twitter,YouTubeの利用が負の影響を与えていた。つまり,これらのSNSの利用時間が増えるほど学業成績が悪くなることが示唆された。」 J-STAGE Articles - 日本の大学生のSNS利用と学業成績との関連性について https://t.co/XRy9nBpgJe
知らないうちに音響学会誌でディスられてたんですけど!チャラチャラしてないんですけど! https://t.co/F4MQMvEHcK https://t.co/HjcZ4cNAq1
早速ダウンロード、斜め読み(失礼)しました。交通整理された文献のリストとそれらの関連がありがたい。 SIP研究会提案 音響信号処理における位相復元 矢田部 浩平 https://t.co/5D93e9MTYW https://t.co/RQ7JAP04vD
「音響信号処理における位相復元」という解説論文がオンラインで出版されました!誰でも無料で読めます! https://t.co/PGz5roians 「位相復元」という処理について,光と音の両方から解説を試みました!めっちゃサーベイ頑張って124本も文献を引用してます!連載講座と同時執筆で大変でした…! https://t.co/dcBTRY9A62
Twitterを始めてちょうど1年,関西での生活もちょうど9年が経ちました.そして本日より,日本音響学会誌1月号のキャリアパス特集の記事がオープンアクセスになりました. https://t.co/EfqAxSqnXA
PFNの丸山先生の論文、『人の心に似た機械を設計できるか』という挑発的なタイトルで、かつ、出だしもかっこよい https://t.co/e3cWdg5pC5 https://t.co/Mv1XkeqDrK
サンプル数は小さいですが、某女子大の情報科学専攻者80名弱に聞き取りしたら「女子大だから情報系を受験した」「他の大学では別の学部を受験した」という学生が半数近くいたという話はあるので、日本の現状では取り得る選択しかも知れません https://t.co/AhRMNiTOrr https://t.co/AB85kyTR4D
Formant estimation from speech signal using the magnitude spectrum modified with group delay spectrum https://t.co/n1O6Dy0iss
音声研究会で発表してきた 「事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換」 https://t.co/wG4WijHCgz
統合型ソースフィルタネットワークによるニューラルボコーダ https://t.co/FksYjmoprA
こちら,オンラインで公開されました.オープンアクセスです. https://t.co/8sYX6ZJMhf https://t.co/UF0Wa2Qvye
PatrickくんのD論 (2020.3) / High-Quality and Flexible Voice Conversion Techniques based on Statistical Spectral and Waveform Modeling https://t.co/bQgXiuaUw7

38 0 0 0 OA 機械翻訳

1962年に書かれた「機械翻訳」についての記事を発見‼️ #n年前の情報処理 当時の課題と、模索されていたアプローチ、必要な基礎知識が詳しく解説されている……
Prosodic Features Control by Symbols as Input of Sequence-to-Sequence Acoustic Modeling for Neural TTS https://t.co/LIOidpnCSe
Happy New Year!! K. Matsubara's work in NICT "Investigation of training data size for real-time neural vocoders on CPUs," in AST is now online as open access!! https://t.co/9k3XWpTY96 https://t.co/dBxQ5lPtiH
必読ですぜ / 《第9回》機械学習と音声生成:音声波形モデリングの進展 https://t.co/EmrC0M5OvA
榊原,水町先生と共著の解説「利用価値の高い音声データの録音手順」がオープンアクセスになっていた.ここで触れたツールは,既に倉庫の奥.急進化した新しいツールの解説をしなければと思うけれど,まだまだ更新中.悪癖が止まらない https://t.co/C3i175JWKR https://t.co/x86jDAgN2m https://t.co/PCOMLDYMDV
DNN-Based Full-Band Speech Synthesis Using GMM Approximation of Spectral Envelope https://t.co/14vbvlSesq
研究における「問い」を見出すには https://t.co/9ZUue7HOtT
信学会の情報・システムソサイエティ誌の喜連川先生の巻頭言オープンになってた.NLPやAIの人にも是非読んでほしい 巻頭言 学会の役割:難しい評価をすること 喜連川 優 https://t.co/Mu8q4FbrDb
オープンアクセスになってました https://t.co/21QRfA1EBo https://t.co/8qQSEuvzXg
M2の学生の古市さんが書いた論文が情報処理学会の論文誌に掲載されました。「ブロック型ビジュアルプログラミング機能を有する音声対話シナリオ編集システム」15ページもある意欲作です
Joint Adversarial Training of Speech Recognition and Synthesis Models for Many-to-One Voice Conversion Using Phonetic Posteriorgrams https://t.co/VUAyVh2w2S
Tensor Factor Analysis for Arbitrary Speaker Conversion https://t.co/udmnH9vm1s
メルケプストラムを加工した音声の音質を計測する知覚モデルの開発と評価 https://t.co/X6Z42OmRXC
これ面白かった:「座談会: 感情の心理学的構成主義に見るこれからの感情研究」https://t.co/Z69ChwJBOK Anil Sethの内受容感覚予測モデルとかFEPも言及している。内容はほぼ大平さんの独壇場。「数年前からうちの大学院生には,「今日から基本感情禁止!」,という禁止令を出したのです…(続)
それから,音響学会誌3月号の「複素スペクトログラムと位相の話」の解説論文の英語版もオープンアクセスで一般公開されました!MATLABコードがついてます! https://t.co/HSF39oxGul https://t.co/zBImTi3Ka4
前回の音響学会誌で掲載していただいた「複素モデルに基づくNMF」の英文版(invited review)がリリースされました.オープンアクセスなのでどなたでも閲覧できます.アプリケーションとしてスパースノイズ除去をやってみたりしています(この応用自体はn番煎じですが). https://t.co/ifrR3ZPXtF https://t.co/B1MqJ5VUrI
これも4/1ネタではない。「まだ性懲りもなくVOCODERの話を」のPDFが今日からOPEN access。@heiga_zen さんの原稿を読む前に書いたので内容はかなりの周回遅れ。日本にも研究拠点ができたので、アカデミアの人もGoogleでの研究を経験しては?Google UKよりも簡単に行けるし! https://t.co/cCXck0ERkg https://t.co/Mj5hBT9eTD
論文が公開されました。 > K. Yamamoto et al., “Speech intelligibility prediction with the dynamic compressive gammachirp filterbank and modulation power spectrum,” Acoustical Science and Technology, Vol. 40, Issue 2, pp. 84-92, 2019. https://t.co/WecgS3FAN8
Generative Adversarial Networksの基礎と応用 https://t.co/yxpZddToJJ
これもまた / 音響信号処理の変遷と最先端 ―ロボット聴覚の視点から― https://t.co/n0VXrFch4p
Googleで作った音源情報分析法(改)を用いて国立国語研のCSJコーパスを分析した論文が公開されました。open accessです。この時に用いた分析法にも、スペクトル包絡推定法にも次々と改良のネタが出てきて収拾がつかない。ネタの9割以上はゴミ箱行きになるのだけれど。。。 https://t.co/qqGhCRisip https://t.co/0DJo8yx1BY
FYI / Okamoto et al., "Deep neural network-based power spectrum reconstruction to improve quality of vocoded speech with limited acoustic parameters" https://t.co/Dgh2lZhz3O
国際会議Interspeech2017報告 https://t.co/aFxchZChHG
「Constructing text-to-speech systems for languages with unknown pronunciations」と題する論文がAcoustical Science and Technologyに掲載されましたhttps://t.co/uHoUkLgSxf。 音素等の発音が未知の言語に対して音声合成システムを構築する手法について論じています。
音声電子透かしを用いた改竄検出手法の研究紹介ビデオをアップロードしました. https://t.co/TWiI31PKXd 整数離散コサイン変換に基づいて高周波数成分を拡張し,ペイロードを埋め込む手法です. 2012年楽天Tech ConfのLTで話した内容で,かなりの簡潔版 論文は↓ https://t.co/ftt8ZAwu2n
吉井さん糸山さんによる統計的信号処理の解説@映像情報メディア学会。フリー https://t.co/SQQaGQL2zV https://t.co/S8IypbCsKs
A survey / 確率分布間の距離推定 : 機械学習分野における最新動向https://t.co/9VgOboMAyA
合成音声の多様化についてまとめた解説論文「統計モデルに基づく多様な音声の合成技術」が先月の信学会和文DLランキングに入っていました。https://t.co/wHHPaiwsgs HMMが中心ですがDNN他でも参考になるかと思います。入門的内容で無償で見れますので興味のある方はどうぞ。https://t.co/jCFUVV2XSp
私の国際交流ノート(15) : 英語論文の書き方ノート https://t.co/u3GfEPpIUB 「良い英語論文(日本語 論文でも)を書くためには,「文章構成 (organization)」と「パラグラフ (paragraph)」の概念が 最重要」
MERL堀さん / 夢の音声言語処理技術の実現に向けて https://t.co/ec7abolCOc
多様体仮説を知らなかったので追加の資料が必 「Deep Neural Networksの力学的・幾何学的解析」 https://t.co/Id7SRpr3Lm "The Manifold Tangent Classifier" https://t.co/lWpKkvTqQ2 https://t.co/MCu4AUzxD6
#数楽 https://t.co/wGEOzKXDIk 渡辺澄夫、特異モデルとベイズ学習 (2003) これ読みものとしてとても面白い。添付画像はこれより。渡辺澄夫さんが佐藤のb函数とゼータ函数を「発見」したときの感動の話。 https://t.co/3EWg17HyoW

フォロー(192ユーザ)の投稿一覧(直近7日間)

フォロワー(7330ユーザ)の投稿一覧(直近7日間)