著者
尾崎 嘉彦 野村 将寛 大西 正輝
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J103-D, no.9, pp.615-631, 2020-09-01

ハイパパラメータ最適化は,機械学習モデルのチューニングを自動化するための実用的な技術である.本論文は,ハイパパラメータ最適化に関心のある周辺分野の研究者及び,それを実務に活用しようとするエンジニアに向けた,ハイパパラメータ最適化手法の実用に焦点を当てたサーベイである.本サーベイの目的は,ハイパパラメータ最適化手法を概説し,各手法のもつ特徴や適切な使い分けについて整理し,見通しの良い形で読者に知識を共有することである.本サーベイは,序章と終章を除いて四つの節から構成される.まずはじめに,2. においてハイパパラメータ最適化の基礎知識について解説する.その後,3. でハイパパラメータ最適化において標準的であるブラックボックス最適化,4. で近年のトレンドであるグレーボックス最適化について順に解説する.最後に,5. では逐次評価回数の上限値,並列計算リソース,ハイパパラメータの種類の観点から,状況ごとに個別に議論を行い,適切な最適化手法選択のガイドラインを与える.
著者
松金 輝久 武永 康彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.89, no.3, pp.405-413, 2006-03-01
参考文献数
8
被引用文献数
3

ゲームやパズルの計算量や解法に関する研究は古くから行われている.特に最近ではテトリスのようなゲームが注目を集めている.本論文では,対戦型ゲームとして広く知られるぷよぷよを,人力として初期盤面と落下してくるピース列が与えられ,ピースを落下させることにより特定の目的を達成するパズルゲームとして定式化し,その連鎖数判定問題を考える.連鎖はぷよぷよにおける特徴的な性質であり,最大の連鎖を発生させる連鎖数判定問題がNP完全であることを証明する.
著者
内田 祐介 山下 隆義
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.3, pp.203-225, 2019-03-01

2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては畳み込みニューラルネットワーク(CNN)を用いることがデファクトスタンダードとなった.ILSVRCでは毎年のように新たなCNNのモデルが提案され,一貫して認識精度の向上に寄与してきた.CNNは画像分類だけではなく,セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきている.本論文では,AlexNet以降の代表的なCNNの変遷を振り返るとともに,近年提案されている様々なCNNの改良手法についてサーベイを行い,それらを幾つかのアプローチに分類し,解説する.更に,代表的なモデルについて複数のデータセットを用いて学習及び網羅的な精度評価を行い,各モデルの精度及び学習時間の傾向について議論を行う.
著者
矢野 正基 大賀 隆裕 大西 正輝
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.2, pp.34-52, 2019-02-01

深層学習の分野はAlexNetの登場により画像識別精度が大幅に向上して以来,毎日のようにarXivに新たな手法が提案されるなど発展のスピードは著しい.しかし深層学習は学習に膨大な計算時間を必要とし,更なる精度向上のためには多くのハイパパラメータやData Augmentationなどを調整しなければならない.本論文では深層学習を用いた画像識別タスクにおける識別精度を向上させるためのテクニックとしてData Augmentation,学習率スケジューリング,アンサンブル手法に注目し,サーベイを行うとともに網羅的な検証実験を行うことで,できるだけ多くの知見を読者と共有することを目的としている.最後に特に精度向上に貢献したものを選択し,複合実験を行うことで定量的に評価を行い,今後の展望を述べる.
著者
鈴木 和明 齋藤 豪 張 英夏 近藤 邦雄 中嶋 正之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.12, pp.2961-2972, 2008-12-01

ドット絵とは,1990年代前半までの据置き型ゲーム機や現在でも携帯型ゲーム機などで用いられる低解像度の画像の表現手法であり,その表現手法を用いて制作された画像でもある.ゲーム制作などでドット絵が大量に必要になる場合,アーティストが1枚1枚描かなければならず制作に手間がかかるため,本研究では計算機によってドット絵風のキャラクタ画像を生成する手法を提案する.ドット絵風の画像を生成するために,写真から輪郭線を抽出して,その輪郭線をもつ画像を縮小する.はじめに,抽出される輪郭線がドット絵において頻繁に用いられる形状になるように,Canny edge detectorに対してドット絵作成に特化した変更を行い,そのCanny edge detectorを用いて輪郭線画像を生成する.次に,そのような輪郭線をもつ画像を縮小するが,既存の縮小手法では,画像がぼやけたり,画像の輪郭線が途切れたり,画像の線と線が隣接し潰れてしまう問題があった.これらの問題を解決するために,輪郭線を保護しつつ縮小するアルゴリズムを提案する.これらのアルゴリズムを用いて,ドット絵風のキャラクタ画像を生成した.
著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.9, pp.2017-2040, 2013-09-01

人検出とは,画像中から人が存在する位置と大きさを自動的に求める技術である.人検出は古くから取り組まれてきた顔検出の研究がベースとなっている.近年では多様な見えの変化が生じることから検出が困難とされている人画像に研究対象が遷移している.こうした中で,人検出を難しくする要因を克服するような手法が数多く提案されている.そこで,本論文では人検出を難しくする要因を整理し,この要因を克服するための特徴抽出と統計的学習手法による識別器の二つの観点から手法をサーベイする.また,人検出法を定量的に評価するために利用されている人画像データベースと統一的な評価指標についても紹介する.
著者
箕浦 大晃 平川 翼 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J105-D, no.5, pp.372-404, 2022-05-01

経路予測は,歩行者や自動車などの移動物体が未来にどのような経路を辿るかを過去の軌跡から予測する技術である.経路予測は古くからベイズモデルやSocial Force Modelを利用して研究されてきたが,Deep Learning (DL)の発展によりConvolutional Neural Network及び,Recurrent Neural Networkを利用した手法に大きく移り変わっている.これらを利用した予測手法は車載カメラ映像視点や俯瞰視点,移動物体の位置情報や物体情報など様々な要素を組み合わせてモデル化することで高精度な経路を予測できる.特に,移動物体間の衝突を避けるインタラクションを考慮することは,多くのアプリケーションで必要となるため近年盛んに研究されている.そこで,本論文ではDLを活用した経路予測手法についてサーベイする.その中でも,インタラクションに着目した予測手法について述べつつ分類する.また,定量的評価のために使用されるデータセット及び,評価指標についても紹介する.更に,代表的なモデルについて複数のデータセットを用いて精度評価を行い,各モデルの精度及び予測結果について議論を行う.
著者
能勢 隆
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.556-569, 2017-04-01

HMM音声合成に代表される統計モデルに基づくテキスト音声合成は,モデルがコンパクトであるにもかかわらず,従来の波形接続方式に比べて少ない音声データで音声に含まれる話者性や感情表現・発話様式(スタイル)を合成音声に反映することができる手法として急速に利用が広まっている.本論文では,HMM音声合成を中心とし,話者やスタイル,声質を多様化する手法についてそのアイデアや実験結果なども含めて解説を行う.HMM音声合成ではスペクトルや韻律特徴量がモデル内の各状態の分布パラメータとして表現されるため,モデルパラメータの操作,モデルの拡張が容易であり,様々な多様化手法が提案されている.代表的な話者の多様化手法として話者適応,話者補間,話者強調について,またスタイルの多様化手法としてスタイルモデリング,スタイル適応,スタイル補間,スタイル制御,スタイル変換について基本的な枠組を説明する.更に声質の制御法や話し言葉音声についても概説し,今後の課題や展望について述べる.
著者
松金 輝久 武永 康彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J89-D, no.3, pp.405-413, 2006-03-01

ゲームやパズルの計算量や解法に関する研究は古くから行われている.特に最近ではテトリスのようなゲームが注目を集めている.本論文では,対戦型ゲームとして広く知られるぷよぷよを,入力として初期盤面と落下してくるピース列が与えられ,ピースを落下させることにより特定の目的を達成するパズルゲームとして定式化し,その連鎖数判定問題を考える.連鎖はぷよぷよにおける特徴的な性質であり,最大の連鎖を発生させる連鎖数判定問題がNP完全であることを証明する.
著者
上東 太一 甫足 創 柳井 啓司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.8, pp.1397-1406, 2010-08-01
被引用文献数
3

近年,食事に関する健康管理が注目され,より簡単に食事内容が記録できるシステムの実現が望まれている.そこで,本研究では,画像認識技術を用いて食事内容を記録するシステムを提案する.画像認識手法としては最新の機械学習の手法であるMultiple Kernel Learning(MKL)を用いて,局所特徴,色特徴,テクスチャ特徴などの複数種類の画像特徴を統合し,高精度な認識を実現することを提案する.MKLを用いることにより,カテゴリーごとに認識に有効な画像特徴を自動的に推定し,各特徴に対して最適な重みを学習することが可能となる.それに加え,本研究では,提案した食事画像認識手法を組み込んだ食事画像認識システムのプロトタイプを実装した.実験では,50種類の食事画像データセットを構築し,提案手法の評価を行い,平均分類率61.34%を達成した.50種類もの大規模な食事画像の分類は,実用的な精度で実現することが困難であったため報告例がないが,本研究ではMKLによる特徴統合を行う提案手法によって,初めて大規模食事画像分類において高い認識精度を達成することができた.
著者
井上 勝文 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.8, pp.1407-1416, 2010-08-01
被引用文献数
1

局所特徴量を表す特徴ベクトルを用いた特定物体認識において,メモリ使用量を削減することは,重要な課題の一つである.メモリ使用量を削減する一般的な手法として, "bag of features" モデルに基づくものがある.この手法では,クラスタリングにより複数の特徴ベクトルをある代表ベクトルにまとめることでメモリ使用量を削減している.しかし,得られる代表ベクトルの識別性が低下するため,高い認識率が得られないという問題がある.この問題を解決する一つの方法は,特徴ベクトルを代表ベクトルに置き換えずにそのまま保持して認識処理に用いることである.この際,異なるメモリ削減の方法が必須となる.本論文では,特徴ベクトルの照合に距離計算ではなく, Bloomier filterを用いることでメモリ使用量を削減する手法を提案する.55個の3次元特定物体を用いた実験より, "bag of features" モデルに基づく手法と比較し,同じ認識率を得るために必要なメモリ使用量を1/3に削減することができた.また,1万個の平面物体を用いた実験でも同様に,メモリ使用量を1/7に削減することができた.
著者
鳥海 不二夫 神谷 達幸 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.94, no.11, pp.1740-1750, 2011-11-01
被引用文献数
1

近年,SNS(Social Networking Service)やBlog,Twitterなどのインターネットを利用したコミュニケーションツールの利用が拡大している.SNSのユーザは友人登録機能によってSNS上での他のユーザとの関係を表現する.このようにSNS上に現れる友人関係は,実社会において観測することの困難な人間関係を限定的ではあるが具現化する可能性がある.本研究では性質の異なる多数の小規模SNSを表現可能なネットワーク生成モデルを提案した.提案モデルは,SNSの成長モデルとして知られているCNN+Fitnessモデルに,管理者優先モデル,トライアドフォーメーションモデル,優先的近傍接続モデルを組み合わせて作られた.そして,それぞれのモデル適用率をパラメータとし,モデル化したいSNSに特化して最適化することで,現実の友人ネットワークの構造を近似する.パラメータの最適化にはSimulated Annealingを利用した.また,提案モデルの近似性能を確認するために,ネットワーク指標間の距離に基づいた評価関数を提案した.提案モデルを279の小規模SNSに適用し,提案評価関数で評価した結果,従来のモデルよりも高い精度で小規模SNSの友人ネットワークを近似できることを確認した.また,提案した3種類のモデルについて有効性を確認したところ,管理者優先モデル,優先的近傍接続モデルは友人ネットワーク生成モデル構築上重要であったが,トライアドフォーメーションモデルはネットワークの生成にほとんど寄与しないことが明らかとなった.
著者
木村 翔 筧 康明 高橋 桂太 苗村 健
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.12, pp.2781-2790, 2008-12-01
被引用文献数
1

筆者らは,プロジェクタ映像の中に,人間には見えないメタ情報を埋め込んで投影できる可視光通信プロジェクタの開発を進めてきた.このメタ情報による機械の制御は,人が目にする映像と画素単位の精度で一致させることができる.本研究は,実世界に根ざした様々なインタフェースを実現するための基盤技術として位置づけられる,これまで,埋め込まれたメタ情報を読み出すにあたり,ホトセンサ付きの受光端末を用いて,映像中の1点での情報を取得していた.本論文では,高速度カメラを用いてこのメタ情報を読み出す手法を提案する.高速度カメラを用いることで,映像全体から複数のメタ情報を同時に取得可能になる.いくつかのアプリケーション例を示すとともに,実験を通じて,その有効性を明らかにする.
著者
住元 宗一朗 中川 博之 田原 康之 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.94, no.11, pp.1800-1811, 2011-11-01

近年増加したコンテンツ投稿型SNSでは日々膨大にコンテンツが増え続けるため,嗜好には合っているもののユーザが見逃してしまうようなコンテンツは少なくない.また,多くの推薦技術では精度を重視するあまり,その推薦結果に面白みがないという課題がある.本論文では,主に音楽,イラスト,詩等の創作者向けであるコンテンツ投稿型SNSにおける未知性,意外性を考慮した推薦手法について述べる.未知性に関しては,質の高いコンテンツを投稿する投稿者(有力投稿者)に注目し,コンテンツの質を確保しつつもロングテールのテール部分に属する,ユーザがまだ知らないコンテンツを推薦する.意外性に関しては,多くのコンテンツ投稿型SNSで利用されているFolksonomyを利用する.以上の二つの推薦部からなる推薦エージェントを提案し,イラスト投稿型SNSであるPixivの実データを用い,未知性,意外性に関する評価実験を実施した.その結果,推薦リストの6割に未知性,意外性のあるコンテンツが含まれ,本研究の有効性が確かめられた.
著者
興梠 紗和 木村 昭悟 藤代 裕之 西川 仁
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.4, pp.403-414, 2016-04-01

SNSの隆盛によりニュースを取り巻く環境は大きく変化している.新聞やテレビから一方的に配信される記事を受け取るのではなく,膨大な情報で溢れるSNS上から関心のある記事を選択して購読する新たなニュースの読まれ方が生まれている.この変化により,ニュースメディアはSNS上で記事を読者に対して効果的にアピールする必要に迫られている.その一方で,刺激的な言葉を用いてむやみに拡散させるのではなく,記事を正確に説明し,その内容に興味をもつ読者に記事を届ける必要がある.本研究では,ニュース配信者がニュース消費者に適切なニュース記事を提供するための一手段として,ニュース記事を的確に説明する説明文が,SNS上でより多くの読者に読まれるために備えるべき性質を特定することを目指す.この目標に向け,本論文ではまず記者と編集者を対象としたヒアリング調査と,ニュースサイトがSNSに投稿している説明文の調査を行った.これらの調査を分析することで明らかになった,説明文がもつべき性質を利用することで,与えられたニュース記事をSNS上で紹介する説明文を幾つかの候補の中から自動的に選択する手法を提案する.
著者
中村 和寛 大浦 圭一郎 南角 吉彦 徳田 恵一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J97-D, no.10, pp.1572-1581, 2014-10-01

本論文では隠れマルコフモデル(Hidden Markov Model; HMM) に基づく英語歌声合成について述べる.HMM歌声合成システムは,学習用の歌声データに基づいて,あらかじめスペクトル,基本周波数,ビブラートをHMMにより同時にモデル化しておき,合成時には合成したい歌声の楽譜に合わせてHMMを連結し,歌声を生成する.これまでに,日本語の楽譜から歌声を合成するシステムが提案され,一般ユーザによる楽曲作成の際のボーカルとして利用されてきている.本論文ではこのシステムを,英語の歌声を合成できるように拡張するために,英語歌声合成のコンテクストを定義し,楽譜の音符と実際の発音を対応付ける手法を提案する.客観・主観評価実験により効果を確認し,また,日本語歌声合成との比較実験も行う.
著者
伊藤 則之 安永 守利
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edetion) (ISSN:18804535)
巻号頁・発行日
vol.94, no.12, pp.2004-2030, 2011-12-01

プロセッサの設計では,高い動作周波数を実現するために様々な設計手法が研究され,そして適用されている.このような高性能実現のためには,アーキテクチャ設計や論理設計だけでなく,半導体上で実現する回路設計や物理設計も重要となる.プロセッサの回路設計や物理設計では,高い動作周波数をできるだけ短い期間で実現するために,マニュアル設計と自動設計が選択的に適用される.この両者を組み合わせて適用するために,すべてが自動設計であるASIC設計とは異なり,設計手法に多様性が生まれる.本論文では,実際のプロセッサ設計に適用された設計手法をサーベイし,高性能化を実現するための回路設計及び物理設計の設計フローとCADシステムをまとめる.また,最後に,今後のプロセッサ設計における設計手法の展望について述べる.
著者
大谷 大和 戸田 智基 猿渡 洋 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.4, pp.1082-1091, 2008-04-01
被引用文献数
3

声質変換において,スペクトル特徴量系列の統計的モデル化技術の発展により,その変換性能は大幅に改善された.しかし,声質変換で用いられる音源モデルでは実際の音源を正確に表現できていないため,その変換音声の自然性は十分なものとはいいがたい.これを改善するために,スペクトル特徴量系列と同様に音源特徴量系列に対しても統計的なモデリングを行う必要がある.本論文では混合正規分布モデル(Gaussian Mixture Model: GMM)に基づく声質変換法の枠組みに対してSTRAIGHT混合励振源を導入する.提案法では,スペクトル特徴量系列及び音源特徴量系列に対して最ゆう推定(Maximum likelihood estimation: MLE)に基づく特徴量変換が行われる.客観評価実験並びに主観評価実験の結果より,提案法により音質,話者性変換精度が大きく改善されることを示す.
著者
小林 潤平 関口 隆 新堀 英二 川嶋 稔夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.1, pp.13-22, 2016-01-01

日本語の読み効率向上を目的に,文節ごとに文字ベースラインを階段状に下げながら文章をレイアウトする電子リーダーを開発し,その効果を読み速度や眼球運動の点から詳しく調査した.文字ベースラインを階段状に配置したレイアウトでは,直線状に配置した標準的なレイアウトよりも,最大で約11 %速く読めることがわかった.読み速度の向上は停留数の減少によってもたらされており,逆行数の減少と順行サッカード長の伸長が主な原因であることがわかった.