著者
宮森 恒 中村 聡史 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.46, no.18, pp.59-71, 2005-12-15
被引用文献数
4

本稿では,ウェブ上の実況チャットを利用することでテレビ番組のメタデータを自動的に抽出する手法を提案する.実況チャットは,テレビ番組と同期して視聴者によって書き込まれるウェブ上の掲示板である.番組実況チャットのデータを,利用者全体あるいは特定の傾向を持つ利用者のデータ集合として扱い,チャット上に表れる特徴的な表現を認識処理することで,番組の盛り上がり場面や,視聴者の嗜好・興味に沿ったリアクションなど,視聴者視点に関連するメタデータを効率良く抽出できる.実験の結果,提案方式により,視聴者の反応の大きさや喜び,落ち込みなどの感情度数などのメタデータを効率良く抽出できることを確認した.また,提案方式で得られるメタデータを利用した番組視聴システムを実装することにより,シーンのランキング表示やダイジェスト生成など視聴者視点を反映した多様な番組視聴へ応用可能になることを確認した.A method of automatically indexing broadcast content using live chat on the Web is proposed. The live chat is a Web bulletin board where the viewers post messages in sync with a TV program. The messages in the live chat written by all viewers or by viewers having similar interest or preference to the user are statistically analyzed with pattern recognition to effectively extract indices related to viewer's viewpoints such as important scenes in the program or responses by a particular viewer. Experiments indicate that the proposed method can efficiently extract indices such as the intensity of viewers' responses and degree of emotional delight or disappointment. They also indicate that a prototype TV viewing system using the extracted indices enables a new way of viewing TV content from different perspectives reflecting viewers' viewpoints such as scene ranking and digest generation.
著者
ナッティーチョラウィト 沼尾 正行
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.41, pp.17-24, 2001-05-17
被引用文献数
1

近年、文書の容易な蓄積、管理、検索が実現しつつある。しかし一方で紙は今だ文書の主要な媒体となっている。このことから、既存の紙文書の電子化に対する要求が高まっている。本稿では、機械学習手法を用いた、文書のレイアウト処理システムを提案する。このシステムは、文書レイアウトの役割を分析し、レイアウトのタグ付けを行って、文書の分類を行う。本研究では、訓練例から帰納論理プログラミングという学習手法とウィンノーアルゴリズムを用い、重要な知識を取得し、文書のスタイルの学習を行う。本システムの性能を評価するために、いくつかの学会誌や会議から複数の論文を収集し、文書の理解と分類の実験を行った。その結果、従来のシステムと比較して、本研究で提案されたシステムの正確さの方が高いことを確認した。
著者
堂坂浩二
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.35, no.5, pp.768-778, 1994-05-15
被引用文献数
12

本稿では、日本語対話において待遇表現、受給表現、特定の文末形式を発話環境の下で適切に使用するための語用論的条件を解釈することにより、対話登場人物を指示するゼロ代名詞の指示対象を同定するモデルを提案する。このモデルでは、発話環境として、対話登場人物間の待遇関係、話者の視点、情報のなわぱりに関わる言語外情報を利用する。発話環境は、環壌のあり方を規定する制約の集含として表される。語用論的条件の解釈は、環境に含まれる制約を用いて語用論的条件を充足させることによって行う。この解釈プロセスによって、文に含まれるゼロ代名詞の指示対象が同定され、また、新たな制約が環境の中に導入されることもある。新たに導入された制約は、後続する文の解釈に役立てられる。このモデルは、対話ドメインに特有な制約を与えることにより、対話ドメインにおける行為やイベントの因果関係に関する膨大な量の知識に頼ることなく、対話登場人物を指示するゼロ代名詞の指示対象を同定できるという利点をもつ。
著者
江上 修平 永井 秀利 中村 貞吾 野村 浩郷
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.108, pp.83-88, 2004-11-05
被引用文献数
1

本研究では新聞社説記事を対象に自動要約を行う.従来の文単位で抽出を行う自動要約システムでは文内に残る冗長性が高圧縮率での情報量の低下を生み出していた.そこで,少ない文章中で情報量の増加を目指し文より小さい単位として区を抽出し要約文章を生成する.また,要約文章の論述展開の流れを考慮するために直接関係や段落間の類似度から文章構造解析を行い要約文章の生成処理を行う.その結果,従来の文抽出によるシステムより評価値の向上が見られた.This paper describes a system that makes a summary of an editorial. The system that makes a summary by extracting some sentences cannot eliminate redundant components of the sentence. Thus such a system cannot produce a highly condensed good quality summary. In order to remove such inconvenience, we propose a method which finds important phrases and then constructs the summary from them. Our system analyzes the text structure so that it can recognize a logical stream and connective relationship of adjacent sentences. And furthermore, it analyzes the similarity between adjacent paragraphs. Based on the result of these analyses, the system construct a summary. According to our examination, our system could generate a better summary than that of the traditional one.
著者
亀田 雅之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1997, no.85, pp.119-126, 1997-11-12
被引用文献数
5

文書中の重要文を抽出するために、高順位の段落中の文を優先して文の重要レベルを付与する段落シフト法を主体にした手法を述べる。段落や文内のキーワード候補群間で構成単語レベルでの重複を計数して得た段落間及び文間関速度を、正規化分母の相違に応じて参照関連度と被参照関連度とに区別し、見出しは参照関連度平均値、段落は被参照関連度平均値、文は両関連度平均値の線形和を基本スコアとして順位付けする。この上で、見出しは見出し群内での順位値により、本文中の文は段落内での順位値を段落の順位でシフトして、各々重要レベルを付与し、さらに、見出しとの関連度等で補正を行う。本手法による重要文抽出の小実験(平均12.1文,42新聞記事)を行い、最高レベルの文で再現率約64%/適合率約71%の結果を得た。This paper describes a method to extract key-sentences from texts based on preference-ranking sentences within preference-ranked paragraph. Two types, a referring type and a referred-to type, of degree of relevance between two elements, determined by counting component words common to the two groupes of keyword-candidates, are used for ranking the elements, such as paragraphs or sentences. The key-sentence level assigned to a sentence is calculated by shifting the rank-value of the sentence within the paragraph by the rank-value of the paragraph including the sentence. The result of the highest level key-sentence extractions from 42 newspaper articles shows 64%-recall and 71%-precision compared to sentences selected by human readers.
著者
市丸 夏樹 飛松 宏征 日高達
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.23, pp.43-48, 2004-03-04
被引用文献数
3

本稿では,論説文を読みやすいinformativeな要約文へと自動的に要約するための手法を提案する.まず,文章を段階的に段落分けし,階層的な結束構造を構築する.その際,文間,段落間の繋がりを計測するために,従来の語彙結束性に代えて話題間の連想による話題の流れのよさを表す値を用いる.論説文中の段落列に着目すると,導入部を表す段落から展開部を通って結びへ至る大きな話題の流れが見られることが多い.そこで,我々の要約システムはその大きな流れこそが書き手の主張を表す文脈の本流であるとみなす.最後に,流れを構成する文とその流れへの寄与度が高い文を抽出することによって,流れのよい読みやすい要約文が得られる.In this paper, we propose a method of automatic summarization to produce easy-to-read, informative summaries of editorial articles. Firstly, the document is segmented hierarchically to form a multi-layer paragraph structure. Instead of lexical cohesion, associative relations between subjects are used to measure subject-flow consistency between sentences and between paragraphs. In a paragraph, the most significant subject-flow stream runs from an introductory subparagraph to conclusive one through some intermediates. Thus, our system regards this flow as the contextual main stream of the document. Finally, several sentences which have greater contribution ratio in the flow are extracted gradually, to form a multistage summary which has maximum consistency.
著者
佐藤 一誠 中川 裕志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.43, pp.25-28, 2007-05-17

Unigram Mixture(UM) は教師無し文書分類などで幅広く使われている確率的生成モデルである。UM は、混合モデルであり、実際の適用にはユーザーは混合数決定問題を常に抱えている。近年、このような混合モデルにおいて、Dirichlet Process(DP) を用いたノンパラメトリックベイズモデルが注目を集めている。DP を用いることでデータに合わせてモデル構造(混合数)を変化させることができる。本研究では、DP により拡張した UM に対して、collapsed Variational Bayes inferense を用いてモデル学習する手法を示す。対数尤度と F-score による評価により従来手法に対する有効性を確認した。UnigramMixture(UM) is a probabilistic generative model that is widely used in unsupervized clustering of documents. UM is a mixture model and have a problem of how to determine the number of clusters. Recently, a nonparametric Bayes model using Dirichlet Process(DP) has gotten a lot of attention in this problem. Models using DP can determine the number of cluster corresponding to data. In this paper, we expand UM by DP and present a scheme that learns the model by Collapsed Variational Bayes inference.
著者
金沢 輝一 高須 淳宏 安達 淳
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.57, pp.165-172, 1998-07-08
参考文献数
12
被引用文献数
4

情報検索においては自然言語の意味曖昧性が大きな問題となっており,ベクトル空間モデル上で問合せ表現のベクトルを拡張するquery expansionなどの手法が存在する.しかし問合せ表現は情報量が小さいために,検索者の意図を汲み取って的確にベクトルを拡張することは難しい.著者らは文書関連性を用いて文書ベクトルを拡張することで検索性能を向上させる手法を提案する.提案手法では検索テーブル作成時に文書関連性に基づいて文書集合を作り,この集合を単位として補う要素を決定することで精度の向上を図る.評価実験として,学術論文に予め付与されているキーワードを情報源として文書間の関連性を抽出,この関連性を元にベクトルを補って,tf・idfモデルやquery expansionとの性能比較を行う.Ambiguity of meaning is a serious problem in information retrieval, and query expansion in the vector space model is one of the typical methods, which expands the query vectors to cope with this problem. However, queries tend to have less information for fitting query vectors to the latent semantics, which are difficult to express in a few query words given by users. We propose a document expansion method which expands the document vectors based on relevance of documents. The proposed method, in which document sets are prepared based on the relevance of documents at the time search table is constructed by adding words for each set, is expected to increase the query precision. In this paper, we evaluate our method through retrieval experiments in which the relevance of documents extracted from scientific papers, and the comparison with tf・idf and query expansion methods is described.
著者
平尾 努 磯崎 秀樹 前田 英作 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.44, no.8, pp.2230-2243, 2003-08-15
参考文献数
29
被引用文献数
10

文書から重要な情報を持った文を抽出する重要文抽出技術は,文書要約技術の1つであり,より自然な文書要約を実現するための基盤技術である.重要文の抽出精度を高めるためには,複数の手がかりを統合的かつ効果的に扱うことが必要とされており,機械学習手法を取り入れた重要文抽出法が着目されつつある.本稿では,汎化能力の高い機械学習手法とされるSupport Vector Machine(SVM)を用いた重要文抽出手法を提案する.Text Summarization Challenge(TSC)のデータを用いて評価実験を行い,提案手法はLead手法などの従来手法と比較して統計的に有意な差で優れていることを実証した.また,野本らのデータを用いた評価実験でもこれに近い成績が得られた.さらに,文書のジャンルを考慮することで重要文の抽出精度が向上すること,重要文抽出に有効な素性のジャンルによる違いを明らかにした.Extracting from a text the sentences that contain important information is aform of text summarization.If done accurately, it supports the automatic generation of summaries similar to those written by humans.To achieve this, the algorithm must be able to handle heterogeneous information.Therefore, parameter tuning by machine learning techniques have received attention.In this paper, we propose a method of sentence extraction based onSupport Vector Machines (SVMs).To confirm the performance of our method, we conduct experiments on the Text Summarization Challenge (TSC) corpus and Nomoto's corpus.Results on the former show that our method is better (statistically significant) than the Lead-based method.Moreover, we discover that document genre is important with regard to extraction performance; the effective features of each genre are clarified.
著者
中鉢欣秀
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータと教育(CE) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.13, pp.101-105, 2008-02-17
被引用文献数
1

大学における学生教育のために、プロジェクト型教育(PBL:Project-Based Learning)を取り入れる事例が増えている.その際に,教員は全てのプロジェクトの進捗や課題管理、成果物などの状況を適宜把握して指導する必要が生じる。それには,教育機関で実施する複数のプロジェクトの全体の状況を管理できるインフラストラクチャがあるとよい.本研究では、大学におけるプログラムマネジメントを実施するための環境を試作中であるので報告する.Project-Based Learning (PBL) has become popular among university-level education recently. During projects, teachers need to grasp their progress, problems, and outputs of projects to give effective education to their students. Project management's infrastructure for PBL will support such work. In this paper, prototyping of a program management system that is suitable for PBL is mentioned.
著者
原 一夫 乾 健太郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2008, no.4, pp.75-80, 2008-01-22

本研究では事態の事実性解析に焦点をあてる。テキストに記述されるすべての事態を対象にした情報抽出を行う上で、事実性解析は述語項構造解析とともに必須の技術といえるが、これまでのところ、十分には研究されていない。本稿では、事実性解析の応用例としてブログ記事からの経験抽出を想定し、そのための事実性解析を時間情報、極性、話者態度の観点から抽象化する枠組みを提案する。また、ブログ記事を対象とする予備実験についても報告する。In this paper we concentrate on the analysis of the events in terms of factuality. We consider that the identification of factuality is an inevitable step towards practical information extraction after completing the predicate argument structures, however, it has not been studied well up to now. Then, as a case study, we shall propose a framework for examining the factuality of personal experiences in terms of tense, aspect, and mood, and we also give experimental results using Web log texts.
著者
王玉馨 清水 伸幸 吉田 稔 中川 裕志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2008, no.46, pp.7-14, 2008-05-15
被引用文献数
3

コーパスから同義語の対を抽出するための一般的な方法では、通常二つ単語間の類似度 (例えば、cosine 類似度) が必要である。類似度を使用することで、特定のクエリ単語に対しての類似語ランキングが可能になり、同義語候補リストから正しい同義語が認定できる。この論文では、それに加えて、単語類似度ネットワークを分析する新しい方法を提案する。単語類似度ネットワークでは閾値以上の類似度をアークとして、単語をノードとして定義する。提案する自動同義語候補選択ためのランク閾値(Rank Threshold for synonym candidate Selection RTS) によって類似度の順位が閾値以内のアークが構成される単語類似度ネットワークはスケールフリーグラフである。 この性質に基づいて、我々は新しい同義語候補のリランキング手法を提案する。これを相互リランキング法 (Mutual Re-ranking Method MRM) と呼ぶ。同義語獲得における提案手法の有効性を示すために MRM 方法を Reuters-21578 に適用した。 実験結果によって、RTS と MRM が同義語抽出の品質の向上させることが示された。Popular methods for acquiring synonymous word pairs from a corpus usually require a similarity metric between two words, such as cosine similarity. This metric enables us to retrieve words similar to a query word, and we identify true synonyms from the list of synonym candidates. Instead of stopping at this point, we propose to go further by analyzing word similarity network that are induced by the similarity metric for the edges with the similarities that are ranked as top threshold number. By introducing the rank threshold for synonym candidate selection method (RTS), our analysis shows that the network exhibits a scale-free property. This insight obtained from the network leads us to a method for re-ranking the synonym candidates -a mutual re-ranking method (MRM). We apply our methods to Reuters-21578 to show the generality of the methods on synonym acquisition. The results show that RTS and MRM boosts the quality of acquired synonyms.
著者
山元 理絵 小林 大 吉原 朋宏 小林 隆志 横田 治夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.11, pp.38-48, 2007-06-15
被引用文献数
6

近年,Webサイトによる情報発信の重要性から,ユーザのニーズに適したサイト構築や情報提供の要求が高まってきている.WebアクセスログをWebページ推薦に用いる方法は,クライアント側に手を加える必要がなく有用であるが,これまで提案されている手法では,頻出アクセスパターンとわずかでも外れると適切な推薦ができない,あるいは順序を考慮できないといった問題点があった.我々は,それらの問題を解決するために,WebアクセスログからLCS(Longest Common Subsequences)を抽出してページ推薦に利用する手法であるWRAPLを提案している.本稿では,実際のWebアクセスログを用いた実験を通してWRAPLの効果を詳細に解析し,その実験結果から得られた知見を基に優先順位付け手法に対して改良を行い,その有効性を示す.Sophisticated websites satisfying users' requirement becomes much more important to propagate information via websites, nowadays. Web page recommendation methods using web access logs are useful for them because they need no modification in client-side applications to meet the requirement. However, traditional methods have problems of insufficient recommendation precision caused by strict matching of access patterns or neglect of access sequences. To solve the problems, we are proposing WRAPL as a method of extracting LCSs (Longest Common Subsequences) from web access logs and using them to recommend web pages for an active session. In this paper, we analyze the effects of WRAPL using actual web access logs and propose an enhanced weighting method for it to improve the precision based on the analyses.
著者
馬場 昌之 西川 博文 加藤 嘉明
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.125, pp.71-76, 2007-12-14
被引用文献数
1

インターネットの普及と高速化に伴い,ビデオやオーディオなどのメディアデータをリアルタイムに IP 伝送するようになってきた.しかしながら利用するネットワーク環境により TCP しか使用できないこともある.本稿では,TCP を使用したリアルタイム伝送方法を提案する.既存の TCP を用いて,無線環境での使用にも耐えうるように,バーストパケットロスに対応できるようにパケット伝送方法を制御する.本提案方法では,複数の TCP コネクションを用意し,1パケットずつ異なるコネクションで送信する.これによりパケットロスが発生しても他のパケットに遅延を与えず,バーストロス時にもフロー制御によるレートの低下が発生しない.Real-time multimedia communication over UDP/IP has been put into practical use because of the popularization of the high-speed Internet. However there are some communication environments that can be used only TCP/IP. In this report, we propose a new real-time transmission method using general TCP/IP and dealing with some consecutive packet losses occurred in wireless communication environment. Our proposed method uses multiple TCP connections, and sends packets over different TCP connections. This method can recover some consecutive packet losses quickly and keep the throughput performance at a high level.
著者
片平 尭之 岩井 儀雄 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.36, pp.113-120, 2008-05-01

コンピュータやセンサを身につけてさまざまな作業の支援を行うウェアラブルシステムにおいては,自己位置情報の提供が有益である.本論文では,ウェアラブル全方位視覚センサより得られる画像と GPS の情報に基づく自己位置識別手法を提案する.画像特徴量・GPS 特徴量について,それぞれ部分空間を構成し,各部分空間内で近接した学習データから自己位置を識別を行う.識別された自己位置が異なる場合は,どちらの結果を信用するか判別し識別を行う.実際に屋内および屋外環境で取得した全方位画像,GPS の情報を用いて実験を行い,提案手法の有効性,ウェアラブルシステムへの適応性を確認した.Self-location is very informative for wearable systems. In this paper, we propose a method for identifying user's location from omnidirectional image features and GPS data. User's location is independently recognized from the image feature and GPS data projected into a sub-space made from learning data. User's location is determined from the results. We show the effectiveness of our method by experimental results in real images and GPS data.
著者
小林 貴訓 佐藤洋一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.36, pp.231-246, 2008-05-01
被引用文献数
3

本稿では,環境に疎密に分散配置されたセンサ群を用いて,特定エリア全体における人物動線を計測する手法について述べる.まず,公共施設や商業施設などの監視カメラ映像を想定し,視野を共有する複数のカメラを用いて,人物頭部の三次元位置と向きを追跡する手法について述べる.また,店舗などでの複数人物の追跡のため,監視カメラによる追跡にレーザ測域センサを相補的に統合することで,人物の出現や消失の検出,人物相互の遮蔽を扱う.さらに,エリア内全体を通じて,連続した人物動線を計測するため,障害物や人物相互の遮蔽などにより断片化した人物動線や,複数観測領域間における人物動線を対応付け,観測領域外の人物動線を補間する手法について述べる.This paper describes the method of tracking people in an indoor environment by using a sparse network of multiple sensors. 3D position and the orientation of people's heads are tracked by using multiple cameras. To deal with appearance/disappearance of people including occlusions cased by people's interactions, laser range scanners are seamlessly integrated into the vision based tracking framework. The information from a sparse network of multiple sensors is used to estimate people's trajectories in the whole area including unobserved areas. This paper also describes the method for establishing correspondences between trajectories captured by different cameras and estimating trajectories in unobserved areas.
著者
LuBounVinh 角田 哲也 川上 玲 大石岳史 池内 克史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.36, pp.295-300, 2008-05-01
被引用文献数
2

複合現実感(MR)における実物体と仮想物体のオクルージョン問題を解決するため,実画像から前景領域の抽出と影領域の除去を行い,さらに画像中の位置座標から前景物体の奥行き推定を行う手法を提案する.前景領域の抽出については確率モデルに基づく手法を用い,色,コントラスト,時間的事前確率を用いて精度を高める.確率モデルにおけるエネルギー最小化にはグラフカットを用いる.また抽出した前景領域に対し,各画素の色度とカメラの分光感度特性から求められる logF 値を用いることにより,影領域を除去する.最後に画素ごとの描画判定に利用されるステンシルバッファを用いて,前景物体によるオクルージョンを考慮しながら仮想物体の重ね込みを行う.屋外環境で全方位カメラを用いてパノラマ単画像を撮影し,画像シーケンスに対して仮想物体の合成を行うことによって提案手法の有効性を確認した.This paper presents a method solving the occlusion problem in Mixed Reality (MR). We cut out foreground from a real image using probability-based segmentation method. Using the color, spatial and temporal priors, we can improve the accuracy of the segmentation. The energy minimization is executed by graph cuts. Then we remove shadow region from the foreground with log F value calculated from the pixel value and the spectral sensitivity characteristic of the camera. Finally we superimpose virtual objects using the stencil buffer which is used to limit the area of rendering for each pixel. Synthesized images of an outdoor scene show the efficiency of the proposed method.