著者
尾崎 嘉彦 野村 将寛 大西 正輝
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J103-D, no.9, pp.615-631, 2020-09-01

ハイパパラメータ最適化は,機械学習モデルのチューニングを自動化するための実用的な技術である.本論文は,ハイパパラメータ最適化に関心のある周辺分野の研究者及び,それを実務に活用しようとするエンジニアに向けた,ハイパパラメータ最適化手法の実用に焦点を当てたサーベイである.本サーベイの目的は,ハイパパラメータ最適化手法を概説し,各手法のもつ特徴や適切な使い分けについて整理し,見通しの良い形で読者に知識を共有することである.本サーベイは,序章と終章を除いて四つの節から構成される.まずはじめに,2. においてハイパパラメータ最適化の基礎知識について解説する.その後,3. でハイパパラメータ最適化において標準的であるブラックボックス最適化,4. で近年のトレンドであるグレーボックス最適化について順に解説する.最後に,5. では逐次評価回数の上限値,並列計算リソース,ハイパパラメータの種類の観点から,状況ごとに個別に議論を行い,適切な最適化手法選択のガイドラインを与える.
著者
内田 祐介 山下 隆義
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.3, pp.203-225, 2019-03-01

2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては畳み込みニューラルネットワーク(CNN)を用いることがデファクトスタンダードとなった.ILSVRCでは毎年のように新たなCNNのモデルが提案され,一貫して認識精度の向上に寄与してきた.CNNは画像分類だけではなく,セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきている.本論文では,AlexNet以降の代表的なCNNの変遷を振り返るとともに,近年提案されている様々なCNNの改良手法についてサーベイを行い,それらを幾つかのアプローチに分類し,解説する.更に,代表的なモデルについて複数のデータセットを用いて学習及び網羅的な精度評価を行い,各モデルの精度及び学習時間の傾向について議論を行う.
著者
矢野 正基 大賀 隆裕 大西 正輝
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.2, pp.34-52, 2019-02-01

深層学習の分野はAlexNetの登場により画像識別精度が大幅に向上して以来,毎日のようにarXivに新たな手法が提案されるなど発展のスピードは著しい.しかし深層学習は学習に膨大な計算時間を必要とし,更なる精度向上のためには多くのハイパパラメータやData Augmentationなどを調整しなければならない.本論文では深層学習を用いた画像識別タスクにおける識別精度を向上させるためのテクニックとしてData Augmentation,学習率スケジューリング,アンサンブル手法に注目し,サーベイを行うとともに網羅的な検証実験を行うことで,できるだけ多くの知見を読者と共有することを目的としている.最後に特に精度向上に貢献したものを選択し,複合実験を行うことで定量的に評価を行い,今後の展望を述べる.
著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.9, pp.2017-2040, 2013-09-01

人検出とは,画像中から人が存在する位置と大きさを自動的に求める技術である.人検出は古くから取り組まれてきた顔検出の研究がベースとなっている.近年では多様な見えの変化が生じることから検出が困難とされている人画像に研究対象が遷移している.こうした中で,人検出を難しくする要因を克服するような手法が数多く提案されている.そこで,本論文では人検出を難しくする要因を整理し,この要因を克服するための特徴抽出と統計的学習手法による識別器の二つの観点から手法をサーベイする.また,人検出法を定量的に評価するために利用されている人画像データベースと統一的な評価指標についても紹介する.
著者
箕浦 大晃 平川 翼 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J105-D, no.5, pp.372-404, 2022-05-01

経路予測は,歩行者や自動車などの移動物体が未来にどのような経路を辿るかを過去の軌跡から予測する技術である.経路予測は古くからベイズモデルやSocial Force Modelを利用して研究されてきたが,Deep Learning (DL)の発展によりConvolutional Neural Network及び,Recurrent Neural Networkを利用した手法に大きく移り変わっている.これらを利用した予測手法は車載カメラ映像視点や俯瞰視点,移動物体の位置情報や物体情報など様々な要素を組み合わせてモデル化することで高精度な経路を予測できる.特に,移動物体間の衝突を避けるインタラクションを考慮することは,多くのアプリケーションで必要となるため近年盛んに研究されている.そこで,本論文ではDLを活用した経路予測手法についてサーベイする.その中でも,インタラクションに着目した予測手法について述べつつ分類する.また,定量的評価のために使用されるデータセット及び,評価指標についても紹介する.更に,代表的なモデルについて複数のデータセットを用いて精度評価を行い,各モデルの精度及び予測結果について議論を行う.
著者
能勢 隆
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.556-569, 2017-04-01

HMM音声合成に代表される統計モデルに基づくテキスト音声合成は,モデルがコンパクトであるにもかかわらず,従来の波形接続方式に比べて少ない音声データで音声に含まれる話者性や感情表現・発話様式(スタイル)を合成音声に反映することができる手法として急速に利用が広まっている.本論文では,HMM音声合成を中心とし,話者やスタイル,声質を多様化する手法についてそのアイデアや実験結果なども含めて解説を行う.HMM音声合成ではスペクトルや韻律特徴量がモデル内の各状態の分布パラメータとして表現されるため,モデルパラメータの操作,モデルの拡張が容易であり,様々な多様化手法が提案されている.代表的な話者の多様化手法として話者適応,話者補間,話者強調について,またスタイルの多様化手法としてスタイルモデリング,スタイル適応,スタイル補間,スタイル制御,スタイル変換について基本的な枠組を説明する.更に声質の制御法や話し言葉音声についても概説し,今後の課題や展望について述べる.
著者
松金 輝久 武永 康彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J89-D, no.3, pp.405-413, 2006-03-01

ゲームやパズルの計算量や解法に関する研究は古くから行われている.特に最近ではテトリスのようなゲームが注目を集めている.本論文では,対戦型ゲームとして広く知られるぷよぷよを,入力として初期盤面と落下してくるピース列が与えられ,ピースを落下させることにより特定の目的を達成するパズルゲームとして定式化し,その連鎖数判定問題を考える.連鎖はぷよぷよにおける特徴的な性質であり,最大の連鎖を発生させる連鎖数判定問題がNP完全であることを証明する.
著者
森田 正典
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J70-D, no.11, pp.2047-2057, 1987-11-25

まず,入力の対象となる日本文の特徴,入力方式に関係する人間工学的要素,および入力方式として望ましい条件の3者を明確にした.上記3要件を踏まえて,最適の日本文入力方式は何であるかを追求した結果,日本文入力用に最適化したローマ字方式である通称M方式が最も優れているとの結論を導いた.M方式の特徴は,子音キーと母音キーを,右手と左手に分類してそれぞれを50音順に配置し,漢字入力の際の打鍵数節減のための特別な複合キーを配置して,漢字入力の高速化を図ったことである.一方鍵盤方式としては,現在一般に使用されているキーボードの欠点を明確にし,筆者らが,それらの欠点を改善のために努力して改善を重ねてきた各種の製品を紹介し,最新型の鍵盤方式としては,仮想キー方式の採用によって機能キーの数を減少させ,常時頻繁に使用する機能キーのみを左右の手の形に合わせたデータキーの周辺に配置した,左右分離型の鍵盤を紹介している.
著者
橋本 新一郎
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J56-D, no.11, pp.654-661, 1973-11-25

日本語単語アクセントの言語学的,音響学的,聴覚的諸性質について,統一的に論じた.まず,単語アクセントの種類が,日本語東京方言では,せいぜい十数種であり,0形から5形までで,全単語の98%以上をしめること,また3形以上で,nモーラ長の単語を取り上げた場合,8形の例外を除けば,第(n-2)モーラにアクセント核が存在する確率が最も高いことを見い出した.つぎに,単語の各モーラについて,母音のエネルギー重心点で求めた基本周波数は,単語の種類によらず(同一アクセント形をもつ単語について),きわめて安定であり,単語アクセントの形を反映する音響パラメータとなることを示した.また,この基本周波数と振幅および音韻継続時間の三要素がアクセント感形成に,上記の順序で寄与していることを明らかにした.最後に,合成音声を用いて,種々なピッチパターンのアクセント感に及ぼす影響を調べた結果,単語の種類や被験者によらない,各アクセントの形に固有なピッチパターンが存在し,その聴覚的許容範囲は,一人の話者の発音によるピッチパターンのばらつきよりも一般に広いことが明らかとなった.
著者
興梠 紗和 木村 昭悟 藤代 裕之 西川 仁
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.4, pp.403-414, 2016-04-01

SNSの隆盛によりニュースを取り巻く環境は大きく変化している.新聞やテレビから一方的に配信される記事を受け取るのではなく,膨大な情報で溢れるSNS上から関心のある記事を選択して購読する新たなニュースの読まれ方が生まれている.この変化により,ニュースメディアはSNS上で記事を読者に対して効果的にアピールする必要に迫られている.その一方で,刺激的な言葉を用いてむやみに拡散させるのではなく,記事を正確に説明し,その内容に興味をもつ読者に記事を届ける必要がある.本研究では,ニュース配信者がニュース消費者に適切なニュース記事を提供するための一手段として,ニュース記事を的確に説明する説明文が,SNS上でより多くの読者に読まれるために備えるべき性質を特定することを目指す.この目標に向け,本論文ではまず記者と編集者を対象としたヒアリング調査と,ニュースサイトがSNSに投稿している説明文の調査を行った.これらの調査を分析することで明らかになった,説明文がもつべき性質を利用することで,与えられたニュース記事をSNS上で紹介する説明文を幾つかの候補の中から自動的に選択する手法を提案する.
著者
佐藤 宏介 井口 征士
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J68-D, no.3, pp.369-375, 1985-03-25

距離画像(Range-Picture)は,画像中の各画素が物体面までの距離情報を担ったものであり,三次元物体の認識に有効である.本論文では距離画像入力の新しい計測法について述べる.本方法ではCCDカメラとパターン光投影器を用いて,能動ステレオ法により距離情報を得る.パターン光投影器は2進符号化された縦縞状の2値パターン光を測定空間に投光して,空間を細いクサビ状に分割する.各々の領域は1本1本のスリット光に見なすことができ,割り当てられたコードにより識別が可能である.n回のパターン光投影で2n本のスリット光投影と等価な距離画像が得られるため,高速な計測が期待できる.空間のコード化には交番2進符号(グレイコード)を用いて,パターン光の明暗部境界でのコード化誤りを最小にする.最後に,実際の計測例により,テクスチャを含む物体にも有効であることを示し,また多面体の観測も行う.
著者
中村 和寛 大浦 圭一郎 南角 吉彦 徳田 恵一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J97-D, no.10, pp.1572-1581, 2014-10-01

本論文では隠れマルコフモデル(Hidden Markov Model; HMM) に基づく英語歌声合成について述べる.HMM歌声合成システムは,学習用の歌声データに基づいて,あらかじめスペクトル,基本周波数,ビブラートをHMMにより同時にモデル化しておき,合成時には合成したい歌声の楽譜に合わせてHMMを連結し,歌声を生成する.これまでに,日本語の楽譜から歌声を合成するシステムが提案され,一般ユーザによる楽曲作成の際のボーカルとして利用されてきている.本論文ではこのシステムを,英語の歌声を合成できるように拡張するために,英語歌声合成のコンテクストを定義し,楽譜の音符と実際の発音を対応付ける手法を提案する.客観・主観評価実験により効果を確認し,また,日本語歌声合成との比較実験も行う.
著者
小林 潤平 関口 隆 新堀 英二 川嶋 稔夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.1, pp.13-22, 2016-01-01

日本語の読み効率向上を目的に,文節ごとに文字ベースラインを階段状に下げながら文章をレイアウトする電子リーダーを開発し,その効果を読み速度や眼球運動の点から詳しく調査した.文字ベースラインを階段状に配置したレイアウトでは,直線状に配置した標準的なレイアウトよりも,最大で約11 %速く読めることがわかった.読み速度の向上は停留数の減少によってもたらされており,逆行数の減少と順行サッカード長の伸長が主な原因であることがわかった.
著者
惠本 序珠亜 平田 豊
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J101-D, no.2, pp.456-467, 2018-02-01

マイクロサッカード(MSC)はヒトの潜在的注意を反映すると考えられている微小で高速な眼球運動である.MSCの発生特性から,ヒトの潜在的注意の定量的な評価が可能となることから,MSCの実時間検出法の開発が望まれている.これまで,MSC検出法として幾つかの手法が提案されているが,これらの手法はオフライン解析での利用を想定しており,実時間で利用することは考慮されていない.そこで本研究では,実時間MSC検出に対応するため,ディープラーニングの手法を応用した畳み込みニューラルネットワークによる新しいMSC検出法を提案する.また,提案法を評価するため,MSC誘発実験を実施し,MSC波形のデータセットを作成して,従来法と検出精度を比較する.その結果,提案法は現在広く使われている従来法と比較し,最大で8.1%検出精度が高く,ノイズの変化や個人差に対しても安定してMSCを検出できることを示す.更に,提案法は現在一般的なPCを用いた場合にも,実時間MSC検出が可能であることを示す.
著者
小林 潤平 関口 隆 新堀 英二 川嶋 稔夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.1, pp.23-34, 2016-01-01

縦スクロール型の日本語電子リーダーにおいて,5〜40文字/行の行長変化がもたらす読み速度及び眼球運動への影響を検証した.読み速度は行長の伸長とともに増加し,最も短い5文字/行で最小,最も長い40文字/行で最大となったが,20文字/行付近で上限に至る傾向が認められた.読み速度の行長依存性は「停留時間」「順行サッカード長」「逆行による過剰停留数」「改行運動中の過剰停留数」のバランスで決定されることがわかった.また,行長が長いほど,停留時間は短く順行サッカード長は長くなって読み速度向上に寄与する一方で,逆行による過剰停留及び改行運動中の過剰停留は増えて読み速度の低下をもたらすというトレードオフの関係が見出された.トレードオフ関係の妥協点を最適行長とすると,本研究における文字サイズ4.4mm及び行高6.0mmの縦スクロール型日本語電子リーダーの最適行長は,20〜29文字/行と結論付けられた.
著者
後藤 英昭 新妻 共 大和 純一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.5, pp.584-594, 2017-05-01

国際的な学術系無線LANローミング基盤であるeduroamは,世界約80か国(地域)に普及しており,キャンパス無線LANのデファクトスタンダードになっている.日本では,欧州各国と比較して格段に多い約1,200の高等教育機関が存在することから,eduroamの早急な展開を行うために,国内のeduroam運用を行う組織の負担をできるだけ小さくすること,各機関のeduroam導入・運用コストを抑制すること,及び,スケーラブルで安定な認証連携基盤を構築することが課題としてあった.これらの課題に対処するため,我々は,各機関で行う利用者認証の処理を代行する集中型認証システムを開発し,2008年から国内の大学等に試験的にサービス提供してきた.この8年間の運用において,冗長化による可用性向上や,オンラインサインアップなどの機能拡張を行い,システムの改良を進めてきた.当システムは40以上の機関に利用されるに至り,当初の目的どおりにeduroam導入の敷居を下げるのに加えて,学会会場等におけるゲストアカウント発行など,新しいサービスの創成にも貢献した.
著者
照屋 大地 宮崎 大智 中條 拓伯
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.3, pp.287-297, 2017-03-01

複数の高速なデータ入力とインターネットへのデータ出力が必要となる組み込みシステムのプロトタイピングのためのフレームワークPyJerを提案した.PyJerを用いた開発では汎用の高位合成ツールとメモリアクセスチューニングのための高位合成ツールを組合せそれぞれの利点を活かすことが可能となる.これによってSoCを用いた組み込みシステムの高速なプロトタイピングが実現できる.複数ツールの使用に起因する複雑なビルド手順の自動化を行い,開発サイクルの短縮を可能とした.またPyJerによってセンサ入力の並列化を行ったアプリケーションのプロトタイピングを行い,ハードウェア使用率の低いこと,CPUを用いた実装と比較してパフォーマンスの向上が期待できることを確認した.
著者
宇都 雅輝
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J105-D, no.7, pp.457-469, 2022-07-01

近年,論理的思考力や表現力といった被評価者の実践的な能力を測定する手法の一つとして,ルーブリックを用いたパフォーマンス評価が注目されている.ルーブリックの利用により評価者間の採点基準のばらつきを低減できると期待されるが,それでも評価結果がパフォーマンス課題や評価者,ルーブリックの評価観点の特性の影響を受けることが指摘されている.この問題を解決する方法の一つとして,課題や評価者,評価観点の特性を考慮して被評価者の能力を推定できる項目反応モデルが提案されてきた.それらの既存モデルの多くは測定対象の能力に一次元性を仮定しているが,高次な能力の測定を目的とするルーブリックを用いたパフォーマンス評価では測定対象の能力に多次元性が想定される場合がある.そのような能力の多次元性に対応できる項目反応モデルも提案されているが,既存のモデルでは課題と評価者,評価観点の特性を同時に考慮した能力推定は実現できない.そこで,本論文では,課題・評価者・評価観点の特性を同時に考慮して多次元尺度上で被評価者の能力を推定できる項目反応モデルを提案する.また,シミュレーション実験と実データ実験を通して提案モデルの有効性を示す.
著者
松本 鮎美 三上 弾 木全 英明
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J101-D, no.10, pp.1448-1461, 2018-10-01

本論文では,スポーツ映像を対象として,動作中のイベントの発生タイミングを時間的に詳細に検出することを目指し,映像を疑似的に高フレームレート化した上で,高フレームレート化された映像からイベントを検出する手法を提案する.一般的に,スポーツの動作は非常に高速である.例えば野球において投手のボールのリリースタイミングを分析することを考えると,フレームとフレームの間で撮影されていない可能性がある.一般的な映像からのイベント検出手法の時間分解能は映像のフレームレートに制約されてしまう.この問題を解決するために我々は,低次元特徴に着目し,低次元特徴空間における映像の疑似高フレームレート化による高い時間分解能でのイベントタイミング検出方法を提案する.これは,映像をダイナミックスを保持したまま低次元特徴空間へマッピングするものであり,これにより高フレームレート化が容易となり,フレームレートより詳細なレベルでのイベントのタイミング検出が可能となる.更に,クラスタリングによるアノテーションを行うデータの自動抽出と,ストリームデータに対する逐次的なアノテーションの導入により,実環境での利用への拡張を行う.