著者
松永 悟行 大谷 大和 平原 達也
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.10, pp.721-729, 2019-10-01

Deep Neural Network(DNN)を用いた音声合成の基本的な構成は,文章を構成する情報を数値で表現した言語特徴量を入力して音声を合成するための特徴量を出力するものである.これらの入出力特徴量は,DNNに適するように学習データを用いて正規化や標準化することが多い.しかし,自由文章から音声を合成する場合には,この正規化の範囲や標準化の分布から外れる値が言語特徴量に含まれる可能性がある.そして,この外れ値はDNNの外挿能力が十分でないために適切に補間されないまま伝搬して出力特徴量に誤差を生じさせる.本論文では,言語特徴量の外れ値の問題を解決するために,一発話内の閉じた条件における正規化手法を提案し,日本語の音声合成で重要な要素の一つである基本周波数について,予測誤差と合成音声の聴取による評価を行った.その結果,提案した正規化手法では,従来の正規化手法で発生していた外れ値は発生しないこと,正規化した値が基本周波数に適したものになったことにより少量の学習データでも予測誤差は従来よりも小さくなり,安定した予測が可能になることがわかった.
著者
羽山 徹彩 難波 英嗣 國藤 進
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.9, pp.1483-1494, 2009-09-01

近年の電子化プレゼンテーションの普及により,講義や会議などの多くの場面で電子的なプレゼンテーション資料(スライド)が利用され,蓄積されてきた.蓄積されたスライドデータは知識資源として膨大となりつつあるため,その高い利活用性が求められている.その有用な方法のひとつとして,レイアウトや視覚的効果など人間の理解を促すための有意な構造情報を利用することが挙げられる.しかしながら,そのような構造情報は,スライドデータの中で明確に定義されていないため,計算機で直接的に扱うことが困難である.そこで,本研究ではスライドに含まれる情報からその構造を抽出する手法を提案する.提案手法は,まずスライド上のオブジェクトを“タイトル”,“図”,“表”,“本文”,“装飾”といった機能的な属性の纏まりに組織化し,それら纏まりをトップダウン的に木構造へ組み上げる構造化を行う.評価実験では人手で作成した正解データをもとに,標準的な手法と比較することで,提案手法の有効性を確認した.
著者
品川 政太朗 吉野 幸一郎 サクティ サクリアニ 鈴木 優 中村 哲
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.8, pp.514-529, 2019-08-01

自然言語から思い通りの画像を生成するシステムは,コンピュータによるデザイン作成支援に有用であると期待されている.本研究では,自然言語によってインタラクティブな画像編集を行うことを指向して,自然言語の指示によって直前にシステムからユーザへ共有された生成画像を操作することで,より意図に沿った画像を新たに生成するフレームワークを提案する.具体的には,修正元となる画像データをConvolutional neural networks (CNNs)によって埋め込んだベクトルと,画像に対する自然言語の修正指示文をLong short-term memory neural networks (LSTM)によって埋め込んだベクトルを入力とし,敵対的学習によって指示通りに修正された画像の生成を行う枠組みを提案した.実験では,手書き数字操作データセットを用いた単純なタスクにより,提案モデルが学習した画像編集タスクにおける振る舞いについて分析した.また,実際に人手で付与した指示文によってアバター画像を修正し,意図に沿った編集を行うことができることを確認した.
著者
菊地 真人 川上 賢十 吉田 光男 梅村 恭司
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.4, pp.289-301, 2019-04-01

データを確率的に取り扱う問題において,統計的尺度の推定は手法の構成やデータ分析の基盤的役割を担う.本論文では統計的尺度の一つであるゆう度比を,離散的な標本空間から得た観測頻度をもとに推定する問題を扱う.素朴な推定方法は,ゆう度比の定義に従い,ゆう度比を構成する二つの確率分布を最ゆう推定して,その比を取ることである.しかし,低頻度からゆう度比を求めるとき,この方法は推定量を不当に高く見積もってしまう場合がある.そこで,ゆう度比の直接推定法uLSIFを応用し,ゆう度比を低めに(保守的に)推定する方法を提案する.提案手法は,最ゆう推定によって求めたゆう度比を正則化パラメータによって調整する枠組みである.実験では提案手法の振る舞いを明らかにし,その有効性を示した.更に,自然言語処理におけるブートストラップ法を利用した実験も行い,提案手法の実用性も示した.
著者
硴崎 賢一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151915)
巻号頁・発行日
vol.J75-D1, no.4, pp.241-250, 1992-04-25

本論文では,コンパイラの最適化手法をインタプリタに適合させ,処理速度とメモリ効率を向上させたPROLOGインタプリタの構築法について述べる.このインタプリタでは,インデキシング,レジスタ割当ての最適化,環境生成の抑制などの最適化手法を取り入れることによって性能の向上を図っている.例えば,インデキシングは,述語を動的と静的の2種類に分類し,この分類に基づいて行う方式を提案している.また,組込み述語の特性を利用することによって,複合項の構造複写を抑制し,処理速度とメモリ効率を大幅に向上させることができる最適化方式を提案している.この方式は,インタプリタだけでなくコンパイラにも導入できるため,PROLOG処理系の一般的な手法として広く利用できるという特長がある.試作した処理系では,RISCワークステーション上で従来のインタプリタの4倍程度の40 K LIPSの処理速度が得られると共に,メモリ効率が大幅に向上することを確認した.
著者
熊谷 匠純 菊地 拓翔 澤 信吾 加藤 菜美絵 関 良明
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J101-D, no.10, pp.1438-1442, 2018-10-01

情報システムのユーザ認証に用いるパスワード等を学生間で共有する事例が散見される.大学生にはISMSによる内部統制が効きにくいことが原因と考えられる.本論文では,質問紙調査により,友人関係が情報セキュリティ行動に与える影響を調査する.
著者
水科 晴樹 阪本 清美 金子 寛彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.10, pp.1640-1651, 2011-10-01

機器使用時のユーザの心理的ストレスを客観的に評価するために,心拍や皮膚導電率等の生体信号を用いる手法が提案されている.しかしそれらの手法には電極の装着等の煩わしさが伴うため,それ自体がストレスの原因となる可能性もある.その点において,眼球運動は非接触で計測可能であるため,ストレスの優れた指標になり得ると考えられる.本論文はそのための基礎的な知見を得ることを目的とし,多様な課題の遂行時における眼球運動を計測した.また,そのときの心理状態の主観評価も併せて行い,眼球運動の特性との対応を検討した.その結果,課題によって時間的な切迫感を与えた場合に,振幅の小さいサッカード眼球運動の分布における振幅の平均値と主観的な「焦り感」との間に正の相関が見られた.このことから,サッカード眼球運動の動特性が心理的ストレスの指標として利用できる可能性が示された.一方,課題の遂行に関連すると考えられる振幅の大きなサッカードの分布においては,眼球運動の動特性と心理状態との間に相関は見られなかった.このことから,心理状態は課題の遂行に関連しない振幅の小さい眼球運動により強く反映されると考えられる.
著者
内田 雄基 大橋 一輝 高橋 桂太 藤井 俊彰
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.9, pp.823-835, 2016-09-01

本論文では,代表的なlight field cameraの一つであるLytro Illumを対象とし,カメラの物理的な画素配列を考慮した超解像手法を提案する.Lytro Illumでは,イメージセンサの手前に挿入されたマイクロレンズアレーの働きにより,多視点画像の同等のデータ(light fieldデータ)がイメージセンサ上に多重化されるため,一度の撮影で三次元情報を取得できる.取得データ(RAW画像)に逆多重化を施すことで,多視点画像(sub-aperture image)を取り出せるが,個々の画像の解像度は限られる.そこで,多視点画像を相互に位置合わせして超解像を行い,解像度を向上させる方法が考えられる.しかしながら,従来の手法では,Lytro Illumのようなカメラに特有のRAW画像の画素配列の扱い方に問題がある.RAW画像では,各画素はRGBのうち一つの色情報をもち,かつ,マイクロレンズが六角格子状に並んでいる.従来の手法では,デモザイキングにより色情報を復元し,レンズ配列が正方格子状になるように画素をリサンプリングする.これらの過程には重みづけ和のような演算を伴うデータの補間が含まれるため,RAW画像のもつオリジナルの情報が損なわれ,超解像の効果を妨げると考えられる.それに対して我々は,演算を伴う補間処理を行わず,RAW画像の画素配列を維持したsub-aperture imageを用いて超解像を行う手法を提案する.また,幾つかの実写画像を用いた実験により,提案手法の有効性を示す.
著者
安達 博行 亀川 裕之 岩田 茂樹
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J70-D, no.10, pp.1843-1852, 1987-10-25

将棋の盤面を縦横9マスから縦横nマスに一般化したとき,与えられた局面から先手が勝てるかどうかを決定する問題は指数時間完成であることを示す.すなわち一般化将棋の先手必勝問題を解くどのアルゴリズムも少なくともnの指数時間を必要とし,この問題は「手に負えない」問題であることを証明する.この結果は,すでに指数時間完全であることが知られているG3の先手必勝問題(Stockmeyer, et al., Provably difficult combinatorial games, SIAM J. Comput. 8)から対数領域還元可能であることを示す.G3は与えられた積和形式の論理関数上のゲームである.一般化将棋の構成は各論理変数をシミュレートするための変数部,論理関数の各項に対応する飛車捕獲部,リテラルが項に含まれることに対応する竜角交代部などからなる.
著者
宇都 雅輝
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J101-D, no.6, pp.895-908, 2018-06-01

近年,受験者の実践的かつ高次の能力を測定する手法の一つとしてパフォーマンス評価が注目されている.一方で,パフォーマンス評価の問題として,能力測定の精度が評価者とパフォーマンス課題の特性に強く依存する点が指摘されてきた.この問題を解決する手法として,近年,評価者と課題の特性を表すパラメータを付与した項目反応モデルが多数提案され,その有効性が示されている.他方,現実の評価場面では,複数回の異なるパフォーマンステストの結果を比較するニーズがしばしば生じる.このような場合に項目反応モデルを適用するためには,個々のテスト結果から推定されるモデルパラメータを同一尺度上に位置付ける「等化」が必要となる.一般に,パフォーマンステストの等化を行うためには,テスト間で課題と評価者の一部が共通するように個々のテストを設計する必要がある.このとき,等化の精度は,共通課題や共通評価者の数,各テストにおける受験者の能力特性分布,受験者数・評価者数・課題数などの様々な条件に依存すると考えられる.しかし,これまで,これらの要因が等化精度に与える影響は明らかにされておらず,テストをどのように設計すれば高精度な等化が可能となるかは示されてこなかった.そこで本研究では,項目反応モデルをパフォーマンス評価に適用して等化を行う場合に,その精度に影響を与える要因を実験により明らかにし,その結果に基づき,高い等化精度を達成するために必要なテストのデザインについて基準を示す.
著者
横山 拓 鈴木 宏昭
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J101-D, no.2, pp.294-305, 2018-02-01

本論文は,不確実性が高く,事前のプランが立てにくい環境に置かれたマネジャーが,断片的で無計画に見える日常活動を送りながらも,周囲の職場環境が提供する様々な認知資源をたよりに組織運営にあたっていることを示す.具体的には,非定型的な業務に従事する2人のマネジャーに対して各3日間の観察調査を行い,時間配分,計画やコミュニケーションの特徴を分析した.その結果,マネジャーの日常活動が断片化していること,マネジャー自身と周囲の環境とに計画が分散されていること,周囲との偶発的かつ頻繁なコミュニケーションによって仕事が調整されていることが確認された.この結果を分散認知,拡張された心の観点から検討した.
著者
町澤 朗彦 青木 哲郎 岩間 司 鳥山 裕史 今村 國康 土屋 茂 金子 明弘 前野 英生 高橋 幸雄
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.10, pp.2308-2318, 2013-10-01

時刻情報は重要な社会基盤となっている.そこで,日本標準時システムに直結した信頼性の高い時刻配信システムを開発し,NTPサーバntp. nict. jpとしてインターネットを介して公開したので報告する.本システムは,インターネットにおける標準的な時刻同期プロトコルであるNTPを利用しているが,安定して時刻を配信するために,耐障害性,過負荷対策,将来にわたるサービスの維持,セキュリティ対策,Stratum 1の提供,GPS非依存などの特徴を有している.また,実運用から得られた利用統計情報を解析した.2012年末現在,1日当りのリクエスト数は約1億7千万,クライアントは約1500万IPアドレスであり,世界230の国と地域に広がっている.更に,ピーク時には1秒間に約13万リクエストの利用があることが明らかになった.一方,1日のポーリング頻度が1回以下のクライアントが約8割であること,並びに,1台の時刻サーバしか参照していないクライアントが約9割であることなど,クライアントの時刻維持が不十分であることが推測される.更に,クライアントのネットワーク距離分布から,インターネットの直径が従来の推定値よりも大きいことを示した.
著者
山崎 俊彦 アンドリュー ギャラガー ツーハン チェン 相澤 清晴
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J97-D, no.9, pp.1437-1444, 2014-09-01

近年,SNSにアップロードされた大量のジオタグ(位置情報)を用いた処理が盛んに研究されている.旅行推薦はその代表的なものであり,特に都市内旅行推薦の研究が数多く進められてきた.都市内推薦とは,ある都市で旅行しているとき,その時点までの旅行履歴を元に今後の訪問地を推薦するものである.これまで,トピックモデルを用いた推薦や年齢・性別・人種などの属性に応じた推薦などが提案されている.本論文では,季節・時間帯を考慮にいれた都市内旅行推薦方式を提案する.推薦では,ベイズの定理を用いて季節と時間帯による旅行ルートの人気の違いを表現し,マルコフモデルに組み入れることにより高精度な推薦を実現する.ベイズの定理に基づく旅行推薦手法は,これまでも幾つか提案されており,本手法はそれらの手法と組み合わせて用いることが原理的に可能である.提案手法の妥当性は,世界21の都市・公園で撮られた620万枚のジオタグ付き写真を用いた実験により確認した.
著者
徳永 弘子 武川 直樹 木村 敦 湯浅 将英
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.1, pp.3-14, 2013-01-01

複数人が集って共にする食事(共食)は,人のコミュニケーションにおいて重要な役割を果たしているが,共食の場の構造を定量的データに基づき分析した研究例は少ない.本研究では,3人が食事をしながら会話をする映像から,参与者の視線,発話の行動を定量的に調査し,共食会話の構造を分析した.特に,視線持続時間と参与の役割ごとの発話行為,会話の順番交替直前の視線先と順番交替の関係を詳細に調べた.その結果,共食会話は食事のない会話に比べ,人に向ける視線持続時間が短く,会話は話者発話-聞き手発話-話者発話の隣接で構造化されること,更に話者発話による会話の順番交替では,会話者同士が視線を合わすことなく発話が遷移するケースが多いことが明らかになった.これにより,共食中は会話への参加の義務が緩く,話し手の発話は場に投げられ,次の発話は誰が開始してもよい場として形成されていることが示唆された.
著者
境 くりま 港 隆史 石井 カルロス寿憲 石黒 浩
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.3, pp.310-320, 2017-03-01

人間はわずかな感情や態度の変化を細かな動作の変化で表現することにより,対話相手に様々な感情や態度を伝達することができる.更にそれらが場の雰囲気を形成し,対話しやすさの促進などの効果をもたらす.人間に酷似したアンドロイドで人間同様に感情や態度を伝達するためには,感情の連続的な変化に対応するように動作特徴(動作の振幅や速度など)を変化させることができる動作生成手法が必要となる.人間では感情が身体の筋系に影響を及ぼして身体動作を変化させていることを踏まえると,筋系の振る舞いをモデル化した動作生成手法において,筋系のパラメータと感情状態を対応づけることで,上記のような動作生成手法が構築できると考えられる.本論文では,対話において常時現れる発話動作に着目し,著者らがこれまでに提案した音声駆動頭部動作生成システムのパラメータ空間と感情空間の対応関係を実験により明らかにした.このマッピングを用いて,感情の細かな変化を表現するように動作を変調することができる発話動作生成システムを提案する.
著者
中川 聖一 神谷 伸 坂井 利之
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J64-D, no.2, pp.116-123, 1981-02-25

本論文は,不特定話者の音声自動認識のための個人差,特に年齢・性別が同一層である話者間の個人差の正規化法について述べる.まず,パターンマッチング法で,個人差によるパターン変動に対処するためには,個人差に関する何んらかのモデル・構造を導入する必要のあることを述べる.これに基づいて,音声スペクトルの周波数軸上とスペクトル強度軸上での非線形なマッチングによる正規化法を提案し,この手法を10数字音声の認識に適用する.更に,この手法は,キーワードを用いた話者適応化にも有効であることを示す.最後に,標準パターンの選択法について述べ,これにより不特定話者に対して安定な認識率を得ることができることを示す.本手法により,不特定男性話者30名の10数字音声に対して,約97.6%の認識率を得ることができた.
著者
吉澤 貴拓 善甫 啓一 中林 紀彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.510-519, 2017-04-01

アパレル業界における販売予測は,機会損失や在庫コストを減らすために重要な役割を担っており,今までも多く研究がなされてきたが,実際のアパレル業界の現場においては人の「経験と勘」に従ってオペレーションが行われている.高精度な予測手法であっても現場の人々にとって予測結果をオペレーションへ活用させづらいことがある.そこで本研究では,現場における意思決定をサポートするための予測アルゴリズムの開発を目指しており,その中で本論文では,現場でも着目をされている売上の周期性に着目し,フーリエ変換を用いた販売予測アルゴリズム提案と精度検証を行った.結果として,提案したアルゴリズムがSARIMAモデルと比較して良い予測が可能であることを確認し,周波数成分を特徴量として用いた予測アルゴリズムの有用性を示した.
著者
上田 博唯 宮武 孝文 吉澤 聡
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J75-D2, no.2, pp.216-225, 1992-02-25

映像を中心とするマルチメディアの自由な編集・作成という,ユーザの創造的活動を支援する環境を実現するための新しいアプローチを提案し,プロトタイプの試作結果について報告する.このアプローチの特徴は音声や画像の処理・認識技術を応用して,映像情報の時間・空間構造を一貫性のある形で視覚化して,それをダイレクトマニピュレーションできるようにすることにある.これによりユーザは対話的に映像素材を編集できる.プロトタイプでは,まず自動カット分割機能とカットの内容解析機能の一部を開発した.そしてこれらの機能によりアイコン化されたカットを用いた映像の構造の視覚化を実現し,その上でカット・アイコンのダイレクトマニピュレーションによる時間軸編集を実現した.また,画像中の対象物の抽出についても実験的な機能を組み込み,そのユーザにとってのメリットについて検討した.これらの結果により,本アプローチの有用性と妥当性が示された.
著者
北森 詩織 酒井 浩之 坂地 泰紀
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.2, pp.150-161, 2017-02-01

本論文では,企業の決算短信PDFから,今後の業績に関する記述がある文を抽出する手法を提案する.近年,証券市場における個人投資家の比重が増大しており,個人投資家に対して投資判断の支援をおこなう技術の必要性が高まっている.そのため,人工知能分野の手法や技術を,金融市場における様々な場面に応用することが期待されており,例えば,膨大な金融情報を分析して投資判断の支援を行う技術が注目されている.ここで,投資の際,投資家にとって重要なのは,企業の今後の業績予測を知ることである.なぜなら,現在の業績が赤字であったとしても,今後の業績が回復することが企業側から示されれば,株価は上昇する場合がある.そこで,本研究では,企業の決算短信PDFから,業績予測文(企業の今後の業績予測を示す文)を抽出する手法を提案する.本手法では,業績予測文の文頭と文末に特徴的に出現する表現を用いることで,業績予測文を抽出する.加えて,これらの特徴的な表現を,半自動的に収集することが可能な手法となっており,業績予測文を幅広く網羅できる.
著者
大向 一輝 武田 英明
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151915)
巻号頁・発行日
vol.J87-D1, no.11, pp.1020-1029, 2004-11-01

本研究では複数の個人による協調的なタスク管理手法モデルを提案し,これを実現するためのアプリケーションとして携帯電話用スケジューラの実装を行った.一般に,複数人がかかわる共同作業のようなタスクの管理コストを下げるためには,参加者がスケジュール情報を公開することが望ましい.しかしながら多くの個人は複数の組織に所属しており,すべての情報を公開することは難しい.しかも,それらの組織の一部はアドホックに形成されるためにグループウェアに代表されるトップダウンの管理モデルを適用することは難しい.そこで,本研究では個人同士がタスクの依頼及び受理を行った履歴より人間関係ネットワークを生成し,完全グラフとなる部分グラフをグループとみなす手法及び発見されたグループ単位での情報のアクセスコントロールを提供する手法によって,プライバシー侵害の問題を低減した上で情報公開を行うことを可能にする.また,本手法では明示的に記述されたプロファイルを必要としないために,ユーザの情報入力の付加を軽減することができる.これらの手法を日常的なスケジューリングに適用するために携帯電話アプリケーションを開発し,実証実験を行った結果,半自動的なグループ発見及びアクセスコントロールは有効であるとの結論を得た.