著者
三石 大 佐々木 淳 船生 豊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.44, pp.53-60, 2000-05-25

動画像や音声など、その内容を表すインデックスを明示的に作成することが難しいマルチメディアデータベース等の検索のために、半自動かつ動的にインデックスを生成するための手法について提案する。本稿で提案する手法は、利用者のデータベースの利用が、その利用者の関心や興味によって偏りがあることを利用するものである。これは、予め内容毎にある程度分類されているデータベースへの個々の利用者のアクセス履歴をもとに、それぞれの分野に対する利用者の興味の方向を示すベクトル空間(ユーザモデル)を推測し、同時に、個々のデータがどのような利用者からアクセスされたかの履歴をもとに、このユーザモデルからそのデータの内容を示すインデックスとしてのベクトル空間(タイトルモデル)を推測するものである。これを繰り返すことにより、データベースの利用時に各データの内容の方向性を示す値を動的に更新し、適切なインデックス付けが可能となると同時に、そのデータが持つ潜在的な意味情報の抽出が可能となると予想され、従来のシステムでは利用者が気付かなかったデータを発見することが可能となる。本稿では、このモデルに基づく漸化式を定義するとともに、シミュレーションによりその有効性を示す。We propose a semi-automatic indexing algorithm with emotional keywords such as genre names for multi-media database(e.g. movie files, audio files) according to user's sensitivity by using user's access histories for database. At first, we simply categorize data, and create a vector space of each user's interest(user model) from the history of which categories the data, the user had accessed, belong to. Next, we create vector space of each data(title model) from the history of which users the data had been accessed from. By continuing the above method, we could create suitable indexes, which show emotional content of data. In this paper, we define the recurrence formula based on the proposed algorithm. We also show the effectiveness of the algorithm by simulation result.
著者
佐々木 稔 新納 浩幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.76, pp.109-114, 2007-07-25

ディレクトリ型の検索サービスはあらかじめ Web ページが項目別にまとめられているので、初心者でも簡単に WWW (World Wide Web) 検索をすることができる。このようなサービスを運営する側は Web ディレクトリへのサイト登録や分類、管理といった作業を人手により行っているため、膨大な Web ページを処理することが困難となる。そのため、我々は人手で行っている Web ディレクトリの管理作業を自動化するシステムの構築を目指している。これまで、サイトの内容語を扱わず、ホームページに記述された meta タグの name 属性値である keyword と description をキーワードとして階層のトップレベルで分類を行い、その結果として分類精度が 82% となり、本文を利用した場合の 55% を大幅に上回る分類性能を得ることができた。本稿では、これまでトップレベルで行っていた分類を拡張し、ディレクトリ階層全体を対象として Web サイトを分類する手法について述べる。階層構造全体を対象とすることで、より現実的で、実用的な Web ディレクトリの構築を行うことが可能となる。階層的な分類においても keyword、description 属性値をキーワードとして利用することの有効性を確かめるために、未分類のデータを利用して実験を行った結果、meta タグのみをキーワードとして利用したシステムは平均 62.7% の分類精度を得ることができた。比較として、meta タグを使わずに HTML 文書の本文を利用した場合の分類結果を求めると 42.3% であった。これより、階層的な分類においても HTML 文書の本文を利用するより meta タグのみを利用した方が有効であることが分かった。また、平均精度が 60% を超えていることから、半自動での Web ディレクトリの構築が可能であると考えられる。A web directory is a directory on the World Wide Web. For example, Yahoo! Directory and Dmoz are well known web directories. Some categories have a lot of web site links across an extensive range of topics. So we browse the categories below to find helpful resources and information. The web directories are created and maintained by human volunteers who are experts in particular categories. So many submissions of registering URLs are delayed due to not selecting the most specific category for them. In our research, we construct a system of automatic classification into a web directory which is maintained by human. In former experiments, the keywords and the description value of the meta tag in HTML documents are very efficient for Web site classification and the effects of the common words cause misclassification of Web sites. In this paper, we describe a classification system for hierarchical web directory structure. Using the whole directory hierarchy, we consider that the system enables to construct a practical and useful web directory. To evaluate the efficiency of this system based on the values of meta tag, we make an experiment on classifying web sites into the Dmoz directory using the web site registered in the Yahoo! directory. As the results of these experiments, the average precision using meta tag is about 62.7% and that using text of HTML document is about 42.3%. The precision using meta tag is higher than using text and we find the efficiency of the meta tag in the hierarchical classification as well as the classification to flat categories.
著者
佐々木 稔 新納 浩幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.23, pp.145-152, 2003-03-06
被引用文献数
3

本稿では,文書要約の支援を目的としたシソーラスの自動構築を行うために,大規模な単語集合に対するクラスタリング手法の提案を行う.これまでの単語クラスタリングに関する研究は,索引語・文書行列を利用してさまざまな要素間類似度やアルゴリズムを用いてクラスタリングが行われている.この索引語・文書行列を利用した場合,索引語の分布はどのような文書内容で出現するかを統計的に示したもので,文書内における語と語の間にある意味的なつながりはそれほど強くない.そのため,結果として出力されるクラスタにはある話題に共通する単語が集まりやすくなると考えられる.意味的につながりを持つクラスタを構築するために,共起関係を持つ単語の組を抽出し,ある単語に対して意味的につながりやすい単語を統計的に表現し,それをクラスタリングすることで意味的な共通性を持つクラスタの自動構築を目指す.In this paper, we propose a new clustering algorithm for large scale document size to construct the thesaurus automatically in aid of summarization. The existing word-clustering systems use various similarity and clustering algorithm based on the context of the information retrieval. In case of the clustering using term-document matrix, the distribution of the index word represents the frequency of the word appearance in a certain contents of a document. Therefore, semantic relation between these words in the document is not so strong. As a result, the words which appear frequently in the contents tend to be gathered for one cluster. To construct a cluster set in which semantic relation between these words is contained, we show a word clustering using a pair of words with cooccurrence relation automatically. We further show that our clustering is effective for word sense disambiguation in comparison with using term-document matrix.
著者
新倉 聡 佐々木 将士 藤森 成一
出版者
東海大学
雑誌
東海大学紀要. 電子情報学部 (ISSN:13472666)
巻号頁・発行日
vol.5, no.1, pp.77-82, 2005-09-30
被引用文献数
1

近年では、パソコン、インターネットの普及に伴い、個人でも手軽にネット証券などで株式売買ができるようになり、さらに、売買手数料の値下がりは、個人投資家の増大傾向を誘っている。一方、株式予測は、ニューラルネット、カオス、フラクタルなどの新しい概念をもとに予測研究が盛んに行われており、特にニューラルネットによる予測が一般に行われている。それらの予測は、いずれも数値データをベースとした予測方法であるため、知識データベースからの、売買予測も必要である。このため、本研究では、株式売買シミュレーションモデルを論理プログラミング言語の1つである、Prologを用いて行った。論理プログラミングでは、問題領域における知識として、事実及び規則の表現が基本であり、結論は、これらの知識と推論を用いて、論理的に導かれる。そこで、本研究では、これらの初歩的取り扱いとして、いくつかのテクニカル分析を株式売買に関する必要知識あるいは規則として用い、株の買い、売りを論理的側面から判定し、利益をあげる事ができるかどうかの予測可能性について検討した。即ち、従来の、株価データから、市場予測で使われるテクニカル分析の中短期の予測に適しているオシレーター系のストキャステイクス(STC)とワコーボリュームレシオ(WVR)、チャート分析のゴールデンクロス(GC)等の指標を、事実あるいは、規則として捉え直し、短期間の売買シミュレーションを行ない、日足による短期間売買において利益獲得を実現するシミュレーションモデルを研究した。本研究では、買い先行のみの売買をシミュレーションしている。
著者
舩橋 誠壽 本間 弘一 佐々木 敏郎 佐藤 嘉則 木戸 邦彦 福本 恭 矢野 浩仁
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.126, no.7, pp.897-903, 2006 (Released:2006-10-01)
参考文献数
24

Impact of the ubiquitous information technology on our society is so significant that directing technological development and preparing institutional apparatus are quite important and urgent. The present paper elaborates, with the efforts by both humanity and engineering disciplines, to find out the socio-technical issues of ubiquitous information society in 2010 by inspecting social implications of emerging technology as well as social expectations. In order to deliberate the issues, scenarios are developed that describes possible life in ubiquitous information society. The derived issues cover integrating information technology and human body, producing smart sharable environment, protecting individual rights, fostering new service business, and forming community.
著者
佐野 信行 仁尾 正記 佐々木 英之 小寺 厚志 大井 龍司
出版者
特定非営利活動法人 日本小児外科学会
雑誌
日本小児外科学会雑誌 (ISSN:0288609X)
巻号頁・発行日
vol.41, no.4, pp.679-683, 2005
被引用文献数
1

複数磁石誤飲による小腸内瘻形成に起因した絞扼性イレウスの1例を経験した.症例は3歳4カ月の女児, 主訴は腹痛, 嘔吐.異物誤飲に関連するイレウスの疑いで, 発症36時間後に紹介となった.腹部症状は軽度で発熱はなく, CRPも陰性であった.CTで上腹部に径2cmのリング状に配列する金属片を認め, 家族からの情報で, 8個の磁石と考えられた.X線写真上, 前日と同じ部位に停滞しており, 複数磁石による腸管損傷の可能性を考慮して緊急手術を行った.腹腔鏡下に磁石カテーテルを用いて異物の位置を同定し, 臍部創から病変部腸管を体外に引き出したところ, Treitz靭帯より40cmおよび120cm肛側の空腸同士が磁石で圧挫され内瘻を形成しており, それに伴って生じたblind loopの一部が絞扼性イレウスに陥っていた.同じ創より絞扼腸管を切除した.内瘻の存在によりイレウス症状が軽減されていたものと考えられ, 稀な病態であった.術後経過は良好である.