著者
小野 佑大 甲藤 二郎
出版者
一般社団法人情報処理学会
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.23, pp.61-66, 2009-02-26

近年、大規模楽曲データベースの中から類似した楽曲を検索するシステムの構築が期待されている。そして、楽曲の類似性を判断する指標として、楽曲を聴いたときに受ける印象を推定する研究が行われている。代表的なものに、Thayerの音響心理学実験で得られたモデルによって定義される4つの印象を表現するクラスタへ楽曲を分類する手法があるが、その印象は曖昧なもので、音楽情報検索に応用することが難しかった。そこで本稿では、ThayerモデルにおけるArousal-Valence値を求め、楽曲を印象の分布として表現する。そして、特定の領域において非排他的クラスタリングを行ない、精度の向上を図る。Recently, construction of the system that retrieves similar music from the large-scale music data base is expected. As a metric of the music similarity, estimation of the emotion feeling in listening to music has been studied. As a typical method, music emotion classification to four emotion clusters defined by Thayer's musical psychology experiment had been proposed. However, categorized emotions are too ambiguous for music information retrieval. Therefore, in this paper, we calculate arousal and valence values of Thayer's model, and show distribution of music emotions. Furthermore, overlapping clustering is applied to improve accuracy.
著者
辻 麻美 飯倉 麻子 小舘 亮之 石井 大祐 下村 道夫
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2013, no.2, pp.1-5, 2013-02-15

新たに読み始めようとする書籍を選ぶ際の手がかりとする情報は多様である.例えば,ジャンルや作家名などの情報以外に,表紙のデザイン,とりわけ絵を楽しむ漫画の場合は,登場人物の顔などの画像的特徴を手がかりとして選ぶ方法もある.本研究では,漫画ならではの特徴が表れると想定される顔要素の特徴量をベースとする漫画作品推奨システムを提案し,そのための基礎検討として,顔パーツ特徴量の算出方法について検討する.There are various ways to choose books we read. For instance, the genre and author's name are one of the helpful information to choose one book from various options. Pictures of characters (how they look) are also useful information especially when we are looking for picture book, Manga. This paper proposes a Manga content recommendation system focusing on the facial feature characteristics of main characters. When one Manga content is selected, the system returns similar content based on the similarity scores calculated by the facial features of their main characters.
著者
藤田 秀 高橋 桂太 藤井 俊彰
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2016-AVM-95, no.16, pp.1-6, 2016-12-01

光線空間法は,光線を単位として 3 次元空間の視覚情報を記述する手法である.光線空間は一般に 4 次元信号空間となるが,その信号は特有の構造をもつ.すなわち,光線空間の 2 次元部分空間では,信号は直線状の軌跡の集合となり,局所的にみれば,それらの直線の傾きはほぼ一定となる.この性質は,光線空間の補間等の処理において有用である.本研究では,光線空間の直線状の軌跡を効率よく記述するために,スパースコーディングの枠組みを検討する.従来研究においても,光線空間のスパースコーディングが試みられてきたが,直線の傾きが局所的に一定である性質は必ずしも十分に用いられていなかった.そこで,我々は,この性質を十分に用いるため,光線空間の離散フーリエ変換 (DFT) 領域に対して,グループスパース性を導入し,より効率的に光線空間を記述する.この際,DFT 係数に対して直接グループスパース性を適用する手法と,方向別の DFT 領域を記述する shearlet 変換係数に適用する手法を提案する.また,従来提案されていた shearlet の最適化手法を見直し,解析的に行うことで性能を向上させる.
著者
亀田 裕介 岸 浩志 石川 知一 松田 一朗 伊東 晋
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2016-AVM-95, no.17, pp.1-5, 2016-12-01

本論文では画素毎の動き (オプティカルフロー) による時間外挿フレームを用いた複数参照フレーム動き補償予測方式を提案する.復号済みの連続 2 フレームから僅かな符号量で推定できる画素毎の動きを用いることで,ブロックごとの動きでは必ずしも適切ではない局所的な回転 ・ 拡大縮小 ・ 変形などの動きを補正することができる.ただし,外挿フレームは等速直線運動を仮定しており,またオクルージョンの悪影響もある.外挿フレームを参照ピクチャリストに追加して従来同様にブロックマッチングによる動き補償を行うことで,外挿フレームの欠点を補うことができる.可逆符号化での複数参照フレームの動き補償予測の性能評価の結果,外挿フレームを用いる提案手法の有効性と領域ごとの特性が確認できた.
著者
石井 大祐 張 傑 石上 諒 渡辺 裕
出版者
一般社団法人情報処理学会
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2014, no.5, pp.1-5, 2014-02-14

マンガは 2 値線画からなる複雑な模様によって描かれている.従来,画像のエッジをとらえる画像特徴量として,HOG が使用されており,マンガにも一定の解析結果をもたらすことがわかってきている.その一方で,2 値の線画を扱ううえで,HOG 特徴量では形状をとらえるために冗長な次元がある.また,2 値の斜線は縦横 2 方向の合成によって構成されることから,方向の取得にも難点がある.本稿では我々の提案する 2 値線画像用に作成した特徴量 Histograms of Binary Oriented Pattern(HBOP) を用いてマンガ画像の解析を行う.マンガ画像解析において従来の HOG 特徴量と HBOP を用いた場合の比較結果を示す.Comic image was drawn into complex pattern using binary line. In conventional research, HOG it can treat image edge was utilized for to analyze Comic image as image feature. On the other hand HOG feature has redundant dimension for to treat binary line image. Moreover, diagonal line on binary image was consisted by combination of vertical and horizontal edge. Thus it is hard to get line angle. Histograms of Binary Oriented Pattern(HBOP) was proposed for to analyze binary line image by us. In this research, We analyze comic image using HBOP. Then, comparison results between HOG with HBOP on Comic image analysis was derived by examination.
著者
山本 愛佑子 渡辺 裕
出版者
一般社団法人情報処理学会
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2014, no.6, pp.1-2, 2014-02-14

HTML5 では,ビットマップ形式のデータを扱う Canvas,ベクター形式のデータを扱う Inline SVG がサポートされ,JavaScript ベースで HTML 内に図形や画像を直接記述できる.しかし,Flash,Java などのプラグインを使用した場合と比べ,描画パフォーマンスが劣るという問題点がある.本研究では,Canvas および SVG における従来の描画パフォーマンス高速化手法の比較を行った.さらに,描画する要素に対して最適な手法を自動選択し,適切な手法で描画するアルゴリズムを提案する.In HTML5, Canvas dealing with data of the bitmap and Inline SVG dealing with Data for vector are supported. Thus we can directly describe image or graphic in HTML, by the JavaScript. However, drawing performance is not good compared with the plugins such as Flash or Java. In this paper, we sinvestigate the performance of traditional approaches to increase drawing speed. Finally, we propose an algorithm to select the best approach automatically.
著者
星田 裕司 岡 稔之 大塚 直哉 永松 良仁 井上 豊 坂元 宏聡
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2015-AVM-91, no.1, pp.1-6, 2015-11-26

毎日放送では,2014 年 4 月に本館に隣接する新館の運用を開始し,その約 1 年後の 2015 年 4 月 20 日より新館のテレビマスター設備から放送を行っている.新マスター設備は,マスター送出設備,番組バンク設備,CM バンク設備,ダイレクト送出設備等から構成されている.また,監視者の負担を軽減しながら,より精度の高い監視が行えるよう様々な自動監視装置を導入する事で,安全で信頼性が高い放送を実現している.
著者
武田 翔一郎 亀田 明男 磯貝 愛 木全 英明
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2019-AVM-104, no.9, pp.1-5, 2019-02-21

ビデオマグニフィケーションは,ヒトの視覚では捉えることが困難な映像中の微細な変化を強調 ・ 可視化する技術だが,被写体に素早く大きい変化があると,強調後の映像にノイズが発生するという課題を抱えている.これまでに,時系列データの滑らかさを評価する躍度という指標を用いることで,素早く大きい運動を無視しながら,微細な変化のみを強調する新たなビデオマグニフィケーション手法が提案されている [9].この手法は,定性的および定量的評価を通じて,従来発生していたノイズを著しく抑制できることが確認されているが,強調された映像がユーザに与える体感品質については明らかにされていない.本稿では,微細な変化の強調率に応じた,変化に対するユーザの気づきやすさと自然さの関係性について主観評価を行い,その結果を報告する.
著者
松村 誠明 亀田 明男 磯貝 愛 能登 肇 木全 英明
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2018-AVM-101, no.10, pp.1-5, 2018-05-31

スタジアムやアリーナではスポーツを観戦する観客に対し,より試合に熱中いただくため,会場では様々な演出が行われる.これら演出は,熱中度低い観客に対しては楽しみ方の気付きを与えるような演出が望ましく,熱中度が高い観客に対してはより会場全体と一体になれるような演出が望ましい.本研究では,観客の熱中状態を判断する材料として興奮 ・ 緊張状態に着目し,観客の挙動を波と捉え,周波数変換したデータを基に興奮度や緊張度を推定する技術を構築したので報告する.
著者
辻 麻美 飯倉 麻子 小舘 亮之 石井 大祐 下村 道夫
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2013-AVM-80, no.2, pp.1-5, 2013-02-15

新たに読み始めようとする書籍を選ぶ際の手がかりとする情報は多様である.例えば,ジャンルや作家名などの情報以外に,表紙のデザイン,とりわけ絵を楽しむ漫画の場合は,登場人物の顔などの画像的特徴を手がかりとして選ぶ方法もある.本研究では,漫画ならではの特徴が表れると想定される顔要素の特徴量をベースとする漫画作品推奨システムを提案し,そのための基礎検討として,顔パーツ特徴量の算出方法について検討する.
著者
前田 哲汰 パナヒプル テヘラニ メヒルダド 高橋 桂太 藤井 俊彰
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2017-AVM-96, no.3, pp.1-6, 2017-02-17

我々は,サッカーなどの広大な空間を用いて行うスポーツを対象として,疎に配置した多数のカメラでシーンを撮影し,visual hull 法を用いてその 3D モデルを生成し,可視化する研究を行っている.Visual hull 法では微小なボクセルの集合によって 3D モデルを表す.扱う空間が広大かつ多数の選手が存在する場合,処理時間の削減やボクセル同士のオクルージョンの効率的な扱いが課題となる.そこで本稿では,処理時間を削減するために,8 分木構造を用いてボクセル群を多重解像度化し,内部を削りながらモデルを生成した.また,オクルージョンを明示的に扱わずに各ボクセルに対して矛盾のない色付けを可能にするために,仮想視点の角度に応じて表示色の変化をフーリエ級数で近似した.この表示色の推定において,周辺のカメラから得た色の中央値を用いることで比較的正しい色付けを行うことができた.
著者
三輪 篤志 坂東 敏博 佐々木 康成
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2015-AVM-88, no.5, pp.1-6, 2015-02-20

ヒトはオノマトペ (擬音語,擬態語の総称) を用いてテクスチャ (画像において色彩,濃淡の分布が形づくる表面の性質) を表現することがある.タイルの表面を 「つるつる」,雲の質感を 「もくもく」 と表現する振る舞いは日常茶飯事的に行われている.本研究ではこれを視覚情報から音声情報への変換と捉え,その関係を調べた.さらにそこから,重要だとわかった音響特徴量,メル周波数ケプストラム係数の 8 次,12 次を用いて,音源に効果を付与するフィルタを設計した.
著者
関 健太郎 榎本 忠儀
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2013-AVM-81, no.1, pp.1-6, 2013-07-12

SHV 向けに動きベクトル検出処理速度を超高速化した帯状探索窓動きベクトル検出アルゴリズムを開発した。本アルゴリズムは 0 次~ 2 次探索で構成される。0 次探索は複数の候補点より最適な探索点を得る予備探索、1 次探索は帯状探索窓探索、2 次探索はダイアモンド探索である。本アルゴリズムを H264/AVC に準拠したソフトウェアエンコーダに実装し、6 種類の HDTV(High Definition TeleVision) 画像 (“Bronze with Credits”、“Ice Hockey”、“Whale Show”、“Tractor”、“Riverbed”、“Inter-section”) に適用し、画質、探索速度を評価した。その結果、本アルゴリズムは全探索法と遜色のない高画質を維持することができた。 “Bronze with Credits” で評価した本アルゴリズムは探索速度を FS の 204.53 倍、S-UMHS の 3.346 倍、EPZS の 1.727 倍、高速化することができた。
著者
石井大祐 柳澤秀彰 三原鉄也 永森光晴 渡辺裕
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2014, no.15, pp.1-4, 2014-11-27

物語性のあるマンガにおいて,シーン情報は重要なメタデータの一つである.シーンはマンガの意味的側面における一区間として定義されており,内容の要約単位として有効である.また,マンガ内に含まれる多数のメタデータをシーン単位にまとめることで,メタデータの利便性を高められるものと考えられる.これまでに,マンガ画像解析処理として,コマ,登場人物,吹き出し等,マンガの構成要素を検出するための手法が提案されている.我々の研究目的は,マンガのコマ内に含まれる構成要素に基づいて,シーンの切り替わりとなるコマを判別する手法を実現することである.本稿では,マンガの各コマに含まれる構成要素の分布について調査し,シーンの切り替わりとなるコマについて重要な構成要素を明らかにする.実際のマンガ画像から取得したメタデータを基に調査を行った.調査結果から,他のメタデータと比較して,現時点で自動取得可能とされるメタデータではナレーション,現時点で自動取得困難なメタデータでは背景の距離がシーン切り替わりにおいて重要な要素となりうる可能性が高いことが確認された.
著者
石井 大祐 山崎 太一 渡辺 裕
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2013-AVM-80, no.1, pp.1-4, 2013-02-15

近年マンガは電子書籍市場における重要なコンテンツである.一方でマンガ画像の解析は現状あまり進んでいない.我々はマンガ画像における自動メタデータ生成技術の実現を目指している.本稿では,マンガの登場人物の顔画像に対する識別処理を行う手法を提案する. HOG と SVM による判別処理に対する学習と判別の為のマンガの特徴に基づく顔のパターン分類を示した.実験により,パターン分けを利用しない場合で本人に対して 80%,他人に対して 40%程度の識別率が得られ,パターン分けを用いた場合には,正面向きの場合および後ろ向きの場合に,より良好な結果が得られる事を確認した.
著者
中静 真
出版者
一般社団法人情報処理学会
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.23, pp.43-48, 2009-02-26

近年,信号の線形モデルを構築する方法の一つとして,スパース信号表現が注目を集めている.本稿では,スパース信号表現の基本と計算法の概要および,分解に用いる基底系を設計するスパースコーディングの概要を解説する.Sparse representation is an emerging topic in the signal processing area. This paper presents the brief overview of the sparse representation and its applications. The sparse coding that is a design strategy of the basis sets for sparse representations is also explained.
著者
高山伸也 明堂絵美 酒澤茂之 愛澤伯友
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2013-AVM-80, no.7, pp.1-6, 2013-02-15

音楽付写真スライドショーが広く使用されているが、独立して作成された写真と音楽を同時に再生するだけでなく,視覚と聴覚の感覚が適合する提示ができれば,魅力的なサービスとなる.また,視覚に合わせて音楽が自動生成できれば,手軽に音楽付写真スライドショーを楽しめる.筆者らは,写真データを画像解析して視覚効果を自動付与し,付与された視覚効果に対応する旋律を自動生成して提示する写真再生システムを構築した.しかし,同システムでは,単音のみの旋律生成に止まっており,音楽表現が乏しいという課題があった.そこで本報告では,音楽のジャンルを予め指定し,多楽器で構成される伴奏と共に高度な旋律を生成することで,より豊かな音楽表現を可能とした写真再生システムを提案する.また,提案システムにおいて,主観評価試験を実施したので報告する.
著者
笠原 辰也 澤渡 隆寛 上岡 英史
雑誌
研究報告オーディオビジュアル複合情報処理(AVM)
巻号頁・発行日
vol.2011, no.2, pp.1-6, 2011-07-07

研究では,脳波を用いたコンテクストアウェア・システムとしてユーザの行動推定および屋内位置推定方式について検討する.脳波信号は生体情報のなかでもユーザの心理状態を検知するのに有力な情報であり,ユーザの心地良さ,および,ストレスを反映すると考えられる.本稿では,実証実験を通して脳波から判定できるユーザの心理状態がどこまで細かく判定できるかについて報告し,これらの問題点と提案手法の将来性について議論する.This study discusses a user's behavior and indoor location estimation technique using electroencephalographic signals as a context-aware system. The electroencephalographic signals are regarded as reliable biological information to detect users' psychological conditions because they reflect the comfortableness and stressfulness that each user feels. In this paper, the effectiveness of the proposed method through field experiments will be reported. In addition, the issues to be solved on this study and the future possibilities of the proposed technique will be mentioned.