著者
金子 卓弘 平松 薫 柏野 邦夫
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2017-CVIM-208, no.36, pp.1-8, 2017-09-08

本稿では生成的属性制御と呼ぶ新しい問題に取り組む.生成的属性制御では,画像の生成または編集を,属性内多様性 (例えば,笑顔属性であれば微笑み,大笑い,にやり笑いなどの様々な笑い方) を直感的に制御しながら行えるようにすることを目指す.これを実現するためには,画像の表現空間があった時に,(1) 個人性と属性が分離され,さらに,属性に対して (2) 高い表現力と (3) 高い操作性が得られていることが必要になる.これらを満たすために,本稿では Conditional Filtered Generative Adversarial Networks (CFGAN) と呼ぶ Conditional GAN (CGAN) の新しい拡張モデルを提案する.CGAN は GAN を条件付き設定に拡張したもので,属性の観測変数を生成器と識別器の入力に組み込むことで,表現空間内で個人性と属性を分離することを可能にしている.一方で,表現力と操作性は観測変数に強く制約されており,例えば,観測変数が属性の有無を表すバイナリであればオン ・ オフの制御しかできなかった.これに対して,CFGAN では新たにフィルタリング構造と多次元の隠れ変数を導入し,属性の観測変数の値に応じて隠れ変数のフィルタリングを行う.これにより属性は多次元的に表現されるため表現力を高めることが可能であり,さらに,フィルタリング構造と隠れ変数の分布形状を工夫することで様々な制御を実現することが可能である.実験では,CFGAN を MNIST,CUB,CelebA データセットに適用し,様々なデータに対して属性内多様性を制御しながら画像を生成または編集できることを示す.さらに,本手法を属性転写と属性に基づく画像検索の二つのタスクに適用し,本手法が属性の表現学習にも有用であることを示す.
著者
金子 卓弘 亀岡 弘和 北条 伸克 井島 勇祐 平松 薫 柏野 邦夫
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2016-SLP-114, no.20, pp.1-6, 2016-12-13

統計的パラメトリック音声合成は,その柔軟性と省メモリ性などの利点により広く使われている. しかし,この手法で生成した音声パラメータは,学習の際の統計的平均化によって過剰な平滑化が生じ,合成した音声は肉声感が失われる傾向がある. この問題に対し,本稿では,敵対的学習を用いて取得したポストフイルタを用いることにより,失われた肉声感を再構成する手法を提案する.従来研究でも,系列内変動や変調スペクトルに着目して肉声感を取り戻そうという試みはあるが,これらは経験的発見に基づくものであり,合成音声と自然音声の差異の一部に対処しているに過ぎない. これに対して,提案手法は敵対的学習を用いながら,合成音声と自然音声とのギャップを埋めるようなポストフイルタをデータから直接学習しようとするものである. これにより,合成音声の音声特徴量を真の音声の音声特徴量の分布に近づくように変換するポストフイルタを得ることができる.実験では,提案手法を用いることにより,合成音声から分析合成音声に匹敵する音声が得られることを示す.
著者
村田 眞哉 永野 秀尚 川西 隆仁 平松 薫 柏野 邦夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.114, no.521, pp.245-249, 2015-03-12

本論文では特定物体が映る画像をクエリとして,映像中からその特定物体を探索するタスクに対する我々の探索法を説明する.その際画像クエリ内の特定物体の領域を示す注目領域情報(region-of-interest, ROI)も同時に入力されることを想定し,その効果的な使用法を提案する.提案法は検索結果のリランキングになっており,ROI内の画像特徴のみを使用した検索結果ランキングの上位K件を,ROI外の特徴でリランキングする.これにより特定物体の背景情報(ROI外の特徴)によるトピックドリフトをある程度防ぐことができ,背景情報を特定物体の情報と同時に使用する従来法と比べて探索精度の改善が期待できる.実際、TRECVIDのインスタンスサーチタスクのデータセットを使用した実験により、提案法の探索精度が従来法の探索精度より高いことを確認した。
著者
平松 薫 小林 堅治 Ben Benjamin 石田 亨 赤埴 淳一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.41, no.12, pp.3314-3322, 2000-12-15
参考文献数
14
被引用文献数
7

インターネット上における地図を媒体とした情報提供方法は,都市に関連したホームページを提供するサービスにおいて数多く利用されているが,今後予想されるホームページ数の増加や地理的な集中に対処するためには検索機能との統合が必須である.そこで,都市に関する大量のホームページを効率的かつインタラクティブに検索できるようにするため,地図を利用した多角的な検索機能をホームページの検索に組み入れた地図インタフェースを提案する.本地図インタフェースでは,検索機能として近傍検索,カテゴリ検索,およびキーワード検索を取り入れ,検索結果を地図上に重ね合わせて表示することによって,実世界に即した情報利用を可能にする.また,動作中にクライアント側へ転送したデータをキャッシュとして利用することで,クライアント側の地図インタフェースとサーバ上の情報検索システムとの間で検索処理の分散を図り,地図インタフェースからのインタラクティブな検索を実現する.実際にデジタルシティ京都において地図インタフェースの公開運用を行い,公開用データを利用した性能評価とアクセスログに基づいたユーザの利用状況の分析を行ったところ,検索要求に対する即応性とキャッシュデータを活用するシステム構成の有効性を確認することができた.Online map systems have been used extensively to provide living cityinformation on the Internet.However, because of the spatial limitations of geographically-basedvisual representation, such systems can not deal with the anticipatedexplosive growth in the number of Web pages; such growth results inareas on the map with an over-concentration of links. In this paper, we propose a map-based user interface which integratessearch functions that evaluate Web page contents and the geographicalinformation located therein. This interface enables neighborhood search, category search, andkeyword search. The search results, which are hyperlinks to the searched Web pages are superimposed as icons on a map image. In addition, the interface utilizes enables users to searchinformation interactively by caching the transmitted data so as todistribute search processing between client and server. We also present performance evaluations and user access analysesof this map-based user interface on Digital City Kyoto which providesregional information to the public on the Internet.The results show the effectiveness of using a system configured toutilize cached data and respond quickly to search requests.