著者
柳井 啓司 田中 哲朗 武市 正人
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.1996, no.13(1995-ARC-116), pp.55-60, 1996-01-26

関数型言語向きアーキテクチャを持つプロセッサを,1万ゲート相当のFPGAを用いて実現した.本プロセッサは通常命令を実行するノーマルモードと関数型言語実行のためのリダクションモードの2種類の実行モードを持つ.リダクションモードでの実行を使用頻度の高い5つコンビネータにとどめ,他のコンビネータをノーマルモードで実行するという方針で設計をした結果,少量のハードウェアの追加で製作でき,ノーマルモードのみの実行と比較して5倍程度の速度の向上が確認された.
著者
金子 昂夢 柳井 啓司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.113, no.230, pp.53-58, 2013-09-26

近年,スマートフォンのような位置情報を扱えるデバイスの普及に伴い,撮影した画像に位置情報を付加することが容易となった.また,ツイートと呼ばれる短文を投稿できるサービス,Twitterの普及により,自分が今何をしているのか,どこにいるのかといったことを投稿する人が増加してきた.ツイートには本文の他に画像や位置情報を添付でき,外出先で撮影した位置情報付き画像を即座に投稿することができる.本研究では,これらのTwitterに投稿された位置情報付き画像ツイートから視覚的なイベントの検出を試みる.まず,対象をより小さな地域に分割し,各地域において前日の状態と比較して得られるスコアが一定以上となるキーワードを検出した.そして,検出されたキーワードを含むツイートの各画像から画像特徴量を抽出し,クラスタリングを行った.クラスタリング結果からイベントの代表的な画像を選出し,中心座標を計算して地図上に表示させた.実験では,日本とアメリカで投稿されたツイートを用いて,それぞれのデータセットを作成した.検出の結果,台風や虹,花火大会,スポーツの試合といったイベントが検出され,画像からその様子を視覚的に捉えることができた.
著者
岡本 昌也 柳井 啓司
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J97-D, no.8, pp.1237-1249, 2014-08-01

近年,ウェアラブルカメラと呼ばれる頭や胸などに装着し撮影するカメラの普及に伴って,一人称視点の映像が多く撮られるようになってきている.本研究では,一人称視点映像の実用的な利用の一つとして,道案内映像としての利用を考える.一人称視点映像の移動映像を入力として,映像中の道順が分かるようシーンの重要度に応じて動的に再生スピードを変化させた要約映像を自動生成することを目的とする.要約映像を生成するために,自己動作分類と横断歩道検出という二つの処理を行う.自己動作分類は,映像撮影者の行動を“前進”,“停止”及び“右折”,“左折”の四つに分類する.横断歩道検出は,映像中に出現する横断歩道を検出することで,映像中の交差点や分岐点を推定する.要約映像の生成は,自己動作分類と横断歩道検出の結果を統合し,動的に再生速度を制御することによって行う.実験では,横断歩道検出の精度実験及び自己動作分類の精度実験を行い,その有効性を検証した.映像3本に対して提案手法の要約映像を生成して被験者10人による比較評価実験を行い,横断歩道検出と自己動作分類の両方を用いた提案手法が他のベースライン手法より優れていることを示した.
著者
金子 昂夢 柳井 啓司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

スマートフォンとTwitterの普及により,今の自分の状況を投稿する人が増加してきた. ツイートには本文の他に画像や位置情報を添付でき,外出先で撮影した画像を即座に投稿することができる. 本研究では,これらのTwitterに投稿された位置情報付き画像ツイートリアルタイムなイベント検出を行う. さらに,イベントを表す画像を抽出することにより,視覚的にイベントが捉えられるようにする.
著者
柳井 啓司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

Webの位置情報付き画像を用いて,ある特定の対象X について,世界の各地域の代表的 なX 画像を表示するシステムを実現する.実験では,例えば「noodle」というキーワードに対して,代表的な画像として日本ではラーメン画像,ヨーロッパではスパゲティーの画像が,各地域の代表的画像として抽出され,世界各地の様々な「noodle」文化の違いを画像によって容易に理解することが可能となった.
著者
野口 顕嗣 柳井 啓司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.470, pp.311-316, 2010-03-08
被引用文献数
1

映像中の動作を認識することは,様々なアプリケーションに応用することが可能で,非常に意義のあることである.動作認識は多くの分野で扱われてきた研究だが,Youtube動画のような制限のない環境における認識を行った研究は少ない.そこで本研究ではMultiple Kernel Learning (MKL)に基づく特徴統合による動作認識フレームワークを提案しWeb動画における動作認識を行った.統合に利用した特徴は時空間特徴,視覚特徴,動き特徴である.時空聞特徴は,点の周辺パターンとその点の微少時問の動きを特徴化したものを利用した.実験にはKTHデータセットと,二種類のYoutubeデータセットの計3種類のデータセットにおける分類を行った.結果としてKTHデータセットで最新手法に匹敵する分類率の94.0%,Youtubeデータで最新手法を大幅に上回る分類率である80.4%という結果が得られた.
著者
柳井 啓司
巻号頁・発行日
2003-03-12

報告番号: 乙15631 ; 学位授与年月日: 2003-03-12 ; 学位の種別: 論文博士 ; 学位の種類: 博士(工学) ; 学位記番号: 第15631号 ; 研究科・専攻: 工学系研究科情報工学専攻
著者
林山 剛久 柳井 啓司 野下浩平
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.34, pp.161-168, 2002-05-09
被引用文献数
4

テレビ放送からの自動情報抽出の研究の一例として、本研究では、囲碁対局テレビ番組から画像認識によって自動的に対局棋譜を生成するシステムを提案する。システムは、囲碁対局番組の画面画像を取り込み、画面中の囲碁盤の位置を検出し、置石(囲碁盤上に置かれている石)を検出して、囲碁対局の棋譜の自動生成を行う。対局中の画面画像を認識する際には、対局画面とそれ以外の対局には直接無関係な画面の識別や、囲碁盤上に現れる指し手の手や頭などの置石以外の物体の除去などの、囲碁対局テレビ番組の特有の問題点に対する対処を行う。我々は、実装したシステムを用いて、実際の11対局分の囲碁対局番組に対して実験を行い、96%の適合率と83%の再現率を得た。In this paper, we present an image-recognition system for generating Go-kifu (i.e., Go-records) automatically from games played by human professionals on a TV program. The system takes screen images of a TV program every several seconds, determines the position of the Go-board, and detects Go-stones played on the board. The system deals with several problems encountered on the TV program. It has to remove several types of noise like players' heads or hands, and discriminate a scene of the game from other various scenes like conversations by commentators. We have implemented the system, and performed experiments for eleven games on the TV program, whose results show high performance of the system. In particular, the precision and recall rate are 96% and 83%, respectively.
著者
上東 太一 柳井 啓司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.42, pp.201-208, 2007-05-15
被引用文献数
1

近年、デジタル画像の爆発的な増大によって、実世界の一般的な画像に対する認識技術への要求が高まっている。そこで、本研究では、新しい認識の手法として G. Csurka らによって提案された bag-of-keypoints 手法を利用して、Web から収集した一般的な画像に対して画像分類実験を行った。Bag-of-keypoints 手法によって画像特徴量を抽出し、SVM によって分類実験を行った結果、100 クラスの分類において分類率 51.1%を実現した。Recently, need for generic image recognition is getting larger due to the explosive increase of digital images. Then, we have performed classification experiments for general real-world images gathered from Web employing the bag-of-keypoints method proposed by G.Csurka et al. In the experiments, we have obtained the 51.1% classification rate for 100 object classes.
著者
柳井 啓司
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.19, no.1, 2004-01-01

なぜ「ライオン」画像はライオンなのか?「トラ」画像はトラなのか?現在においても「人間の顔」などの特定の対象以外の一般的な画像の分類・認識はまったく実現されていない.本論文では,実世界画像のもつ二つの困難な問題(1)多数の種類の物体が存在しており,物体の種類によって適する認識方法,モデル表現が異なる,(2)単一種類の物体でもさまざまな個体が存在し,画像中に現れる見え方が多様である,に対して,それぞれシステム構成法と認識方法の観点から行った研究について述べる.(1)の問題に対しては,従来の画像認識の研究で多数提案されている特定種類の物体に対する認識手法と知識表現を統合して対処することとし,そのためのマルチエージェントによる画像認識システムの構築法を提案する.システムは単一種類の物体のみを認識する独立した認識システムの集合体として構築する.最終的な認識結果はエージェント間の相互作用によって求める.また,物体間の定性的な位置関係に関する推論機構を導入し複雑な画像の認識を可能とし,エージェント間の相互作用によるスケール選択を可能としたマルチエージェント多重解像度画像認識システムの実現も行う.(2)の問題に対して,単一種類の物体の画像中でのさまざまな現れ方に対応するために,多数の学習画像をWWW(World-Wide Web)から自動収集し,自動的に画像認識のための知識ベースを構築する方法「Web画像マイニングによる一般画像分類」を提案する.まず,実世界画像を大量にしかも手軽に収集する方法として,WWWから自動的に大量の実世界画像を収集する方法について提案する.次に,自動収集した実世界画像をクラス既知の学習画像として,実世界画像に対する認識を行うことを提案する.この手法によって,単語入力のみで画像に関する知識をまったく与えることなく,一般画像の画像分類が実現できる.
著者
湯志遠 柳井 啓司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.42, pp.209-216, 2007-05-15

TRECVID とは、共通テストコレクションを用いたビデオ検索技術に関する研究開発促進のための国際ワークショップである。本研究では、TRECVID の中の4つのタスクのうちの1つである、提供されたニュース映像から切り出されたフレーム画像の中から特定の事象と一致する画像を抽出する high-level feature extraction task (高次特徴抽出タスク)について扱う。本研究では、このタスクに対して、bag-of-keypoints モデルによる画像認識を適用し、結果の評価を行う。認識する事象は TRECVID2006 の評価対象になっている Sports、Weather、Office など20種類とした。分類手法としては、最近傍法と SVM を用い、両者の結果を比較した。TRECVID is an international workshop for research and development promotion about video search technology. TRECVID provides common test data and four kinds of tasks, and participants compete on their results regarding the given tasks. In this research, we tackle the high-level feature extraction task which is one of four tasks in TRECVID. In the high-level feature extraction, we extract frame images in which a specific kind of features appears from the provided news video. For this task, we applied the bag-of-keypoints model which is a state-of-the-art method on generic object recognition, and used nearest neighbor classifier and SVM as classifiers. The features we made experiments on are 20 kinds of features including Sports, Weather, Office, Mountain, Animal and Car.