著者
山本 千尋 安田 宜仁 別所 克人 内山 俊郎 内山 匡
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

従来情報検索では、クエリを文字列として受け付けることが一般的である。しかし、検索要求があいまいである場合には、文字列として表現することが困難である。そこで、本稿では、近年文字の拡張として注目されている絵文字をクエリとして受け付けるような検索システムを提案する。
著者
岡本 和也 内山 俊郎 竹村 匡正 足立 貴行 粂 直人 黒田 知宏 内山 匡 吉原 博幸
出版者
公益社団法人 日本生体医工学会
雑誌
生体医工学 (ISSN:1347443X)
巻号頁・発行日
vol.49, no.1, pp.40-47, 2011-02-10 (Released:2011-12-13)
参考文献数
30

A DPC code expresses a primary disease, a complication, and procedures, etc. In 2010, 1334 hospitals use DPC codes for calculations of medical fees. Since, in the hospitals, the medical fee of each case is calculated based on one DPC code, each case must be classified into one DPC code. However, the classification is difficult in some cases because patients sometimes have various conditions. Therefore, automatic DPC code selections using machine learning are being studied. Suzuki et al. evaluated automatic DPC code selections from discharge summaries using a vector space method. However, there are general machine learning methods except for the vector space method. Hence, we must evaluate other machine learning methods exhaustively for improvement of accuracy of automatic DPC code selections. Therefore, we evaluated automatic DPC code selections from discharge summaries using naïve Bayes method, SVM, concept base method, and another vector space method which is different from the vector space model used by Suzuki et al. We considered these machine learning methods as general ones. We also focus on characteristics of each machine learning methods on automatic DPC code selections and we utilize a method which combines some machine learning methods. First, the combining method estimates confidences of the machine learning methods bases on classification scores that the machine learning methods regard as classification evidence. Next, the combining method adopts the method whose confidence is highest. We compared accuracy of the methods using discharge summaries created in 2008 fiscal year in Kyoto University Hospital. As a result, SVM classified 72.2% of the cases into correct DPC codes though the vector space model utilized by Suzuki et al. classified 64.8% into correct DPC codes. Moreover the combining method classified 76.1% into correct DPC codes. In conclusion, we achieved significant improvement.
著者
内山 俊郎 山口 雅浩 大山 永昭 武川 直樹 金子 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 (ISSN:09135685)
巻号頁・発行日
vol.101, no.204, pp.23-30, 2001-07-11

マルチスペクトル画像を対象とした新しい類似画像検索方法を提案する。画像検索技術は、画像特徴の表現方法とその表現に基づいた類似度(あるいは距離)定義から成る。特徴表現については、精度と効率性が重要である。ここでは、画像全体の色(正確には、マルチスペクトル信号)の分布に着目する。従来のヒストグラムインターセクション(以下HI)法はマルチスペクトル画像に適用する場合、次元数の増加のために、十分な特徴表現ができないという問題が生じる。特徴表現の精度を向上させるためには、各画像毎で適応的に特徴表現をすることが必要である。しかし、HI法では共通のビンを用いる必要があり、適応的な特徴表現は難しい。本論文では、ベクトル量子化に基づいた各画像毎に適応的な特徴表現方法を導入し、それに基づく検索方法を提案する。実験により有効性を示す。
著者
蔵内 雄貴 内山 俊郎 内山 匡
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.6, pp.1503-1512, 2013-06-01

Twitterは,毎日3億を超える投稿がある.この投稿の収集や解析が可能なことから,Twitterはマーケティングのための情報源として注目されている.年齢,性別,居住地域といったユーザ属性が得られれば,各属性をもつユーザにターゲットを絞って投稿内容を解析できる.しかし,属性を公開していないユーザも多く,投稿内容からの属性推定が研究されているが,精度は十分でない.そこで,ソーシャルグラフにおける近隣ユーザ同士の属性が近いという性質を利用し,これらを組み合わせることによって精度向上を目指す.本論文では,マルコフ確率場を用いてソーシャルグラフ上のユーザ属性をモデル化し,最適化問題として真の属性を推定する手法を提案する.実験では,サイコグラフィック属性とデモグラフィック属性の推定実験を行った.サイコグラフィック属性の推定では,人工的に付加したノイズを54%除去でき,デモグラフィック属性の推定では,地域属性の推定精度が9.1%ポイント改善するなど,提案法の有効性を確認した.
著者
別所 克人 内山 俊郎 片岡 良治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MI, 医用画像 (ISSN:09135685)
巻号頁・発行日
vol.107, no.58, pp.79-84, 2007-05-17

従来のテキスト分類方式は、文書をベクトルとして表現し、コサイン類似度やユークリッド距離のような双方向性のある尺度を、ベクトル間の近さのベースと考えるものが多い。これに対し本稿では、カルバック・ライブラー距離という双方向性のない尺度をテキスト分類に導入する。単語ベクトル間の距離尺度としてカルバック・ライブラー距離を用いると、コサイン類似度を用いた場合と比べ、単語間の連想の様相が変わる。本稿では、この性質を利用し、従来のコサイン類似度やユークリッド距離をベースとする分類方式と、カルバック・ライブラー距離をベースとする分類方式を組み合わせる方式を提案する。評価実験の結果、組み合わせることにより、従来方式よりも精度が向上することを確認した。
著者
中辻 真 藤原 靖宏 内山 俊郎 戸田 浩之
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.28, no.6, pp.457-467, 2013-11-01 (Released:2013-10-01)
参考文献数
33
被引用文献数
1

Tracking user interests over time is important for making accurate recommendations. However, the widely-used time-decay-based approach worsens the sparsity problem because it deemphasizes old item transactions. We introduce two ideas to solve the sparsity problem. First, we divide the users’ transactions into epochs i.e. time periods, and identify epochs that are dominated by interests similar to the current interests of the active user. Thus, it can eliminate dissimilar transactions while making use of similar transactions that exist in prior epochs. Second, we use a taxonomy of items to model user item transactions in each epoch. This well captures the interests of users in each epoch even if there are few transactions. It suits the situations in which the items transacted by users dynamically change over time; the semantics behind classes do not change so often while individual items often appear and disappear. Fortunately, many taxonomies are now available on the web because of the spread of the Linked Open Data vision. We can now use those to understand dynamic user interests semantically. We evaluate our method using a dataset, a music listening history, extracted from users’ tweets and one containing a restaurant visit history gathered from a gourmet guide site. The results show that our method predicts user interests much more accurately than the previous time-decay-based method.