著者
西田 典起 中山 英樹
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

In this paper, we propose a new approach to learning syntactically plausible word representations. The proposed method learns word embeddings by solving word ordering tasks using pointer networks.
著者
中山 英樹 原田 達也 國吉 康夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.8, pp.1267-1280, 2010-08-01
被引用文献数
2

汎用的な一般物体認識の実現のためには,膨大な数の対象と画像のアピアランスを学習する必要があり,人手によって学習過程を管理することは難しい.このため,Web上の大量の画像を用い自律的に画像知識の獲得を行う方法が近年検討されている.これを実現するための学習・認識手法には,精度と同時にスケーラビリティが必要不可欠である.本研究では,大量のWeb画像への適用を念頭に置いた,高速画像アノテーション・リトリーバル手法を提案する.本手法は,複数ラベルが表す画像のコンテクストを用い,高速に学習・認識を行うことが可能である.実験では,まずベンチマークであるCorel画像セットにより比較実験を行い,本手法が多くの既存手法に比べ高速・高精度であることを示す.次に,270万枚のFlickr画像から学習を行い,Web画像マイニングにおける本手法の有効性を検証する.
著者
中山 英樹 原田 達也 國吉 康夫 大津 展之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.384, pp.65-70, 2007-12-06
被引用文献数
5

画像アノテーション・リトリーバルは,インターネットにおける検索をはじめとする幅広い応用が期待できる技術である.しかし,対象とする画像や認識対象が一般的なものであるため,極めて難しい課題であり,既存技術は精度・速度の両面において難を抱える.本研究では,高次局所自己相関特徴と確率的正準相関分析の組み合わせにより,画像・単語間の概念を効率よく学習することで,従来の世界最高精度の手法とされるSML[1]に比し,精度・速度の両面で圧倒的な向上を実現した.特筆すべきは,認識速度において最高で約1万倍の向上を果たしている点であり,本手法は認識精度と同時に高い汎用性・実用性を有する.
著者
森好 浩行 三好 美紀 日野 大樹 中山 英樹 森川 俊雄 中木 真一 糸原 幸次
出版者
日本法科学技術学会
雑誌
日本法科学技術学会誌 (ISSN:18801323)
巻号頁・発行日
vol.14, no.2, pp.61-70, 2009 (Released:2009-08-25)
参考文献数
19
被引用文献数
5 7

Facial image identification has become important in forensic science because surveillance cameras are popularly used as silent witnesses at potential crime scenes. In general, three methods are used for facial image identification: morphological comparison of facial features, facial image anthropometry and face-to-face superimposition. The most commonly employed method in actual casework is morphological comparison based on the morphological classification of facial components such as facial types, eyebrows, eyes, nose, lips and ears. However, classification for ear morphology has not been developed, except for the ear lobe. The human ear has various anatomical parts, including the helix, antihelix, tragus, antitragus, scaphoid fossa, and ear lobe. The present study was designed to develop a new classification system for the ear.   Ear images obtained from 164 Japanese adult males (n=94, age range: 24-60) and females (n=70, age range: 20-54) were used for establishing the morphological classification. In general, the features of the ear are very easily influenced by camera angle, which usually make it difficult to compare facial images taken with surveillance cameras to mug shots in actual casework. In our previous study, however, it was suggested that some components of the ear are little affected by camera angles if the scaphoid fossa could be found on the image even though the external acoustic meatus could not be found. Therefore, the morphological characteristics of some components such as the antihelix, tragus, antitragus, scaphoid fossa, and ear lobe were observed in the ear images from all persons, and morphological classification items for those components were established. All data classified according to these items were analyzed to obtain their frequency distribution in each component and to clarify the correlation between morphological characteristics. The results revealed that some morphological characteristics in each component were significantly correlated.   The present classification system for ear morphology would be useful for facial image identification.
著者
原田 達也 中山 英樹 國吉 康夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.857-869, 2010-06-01

本論文では実世界でユーザの見たものを瞬時に記述・蓄積し,後で言葉を用いて検索可能とするAI Gogglesを提案する.これは,カメラを備えたゴーグル,タブレット型計算機とHead Mount Displayからなるウェアラブルシステムである.本システムは以下の五つの機能を特徴とする. (1)高速かつ高精度な画像アノテーション・リトリーバル機能, (2)画像の大域的な情報から画像に写る対象を推論する機能, (3)安定かつ高速な追加学習機能, (4)常にデータが増え続ける状況に対応可能な機能, (5)意味に基づいた特徴抽出を行える機能.標準的なデータセットを用いた実験では,本手法が精度の面で2008年度の最良手法と同等の性能を示し,計算速度では上回ることを示した.更に,屋内と屋外の双方における実験を実施し,提案システムは統制困難な環境において予測できない認識対象の追加に対応可能であり,安定して動作することを確認した.
著者
森好 浩行 三好 美紀 日野 大樹 中山 英樹 森川 俊雄 中木 真一 糸原 幸次
出版者
日本法科学技術学会
雑誌
日本法科学技術学会誌 (ISSN:18801323)
巻号頁・発行日
vol.12, no.1, pp.27-34, 2007 (Released:2007-06-27)
参考文献数
17
被引用文献数
8 7 1

Images of the ear are highly valuable for facial photographic identification because the ear has a lot of morphological features, such as the helix, ear lobe, antihelix, scapha, antitragus, tragus, and so on. However, the morphology of ear components changes so easily depending on the camera angle that it is usually difficult to identify people based on images of their ears from surveillance cameras and mug shots.   In this study, the correlation between the morphology of ear components and camera angles was investigated in order to identify people based on ear images taken from different camera angles. The samples were ear images of 56 persons taken at 27 different camera angles for each person. The morphologies of the ear components were compared among the angles and among the subjects. This revealed the morphological changes in the helix, ear lobe, antihelix, and tragus according to the camera angle.   It was found that the morphology was consistent between ear images taken at different camera angles if the compared images satisfied two conditions: the scapha must be clearly observed, and the external acoustic meatus must not be visible. If these conditions are met, it is possible to identify a person by images of his or her ear regardless of the camera angles.