著者
長井 歩
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告アルゴリズム(AL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.119, pp.73-80, 2007-11-30

多種多様なアルゴリズムのひしめくクラスタリング・アルゴリズムの中でも,近年注目されているものにNormalized Cutsがある.Norma』ized Cuts の最大の特徴は,固有値分解を行うなど行列計算を多用する点にある.基本的には,Normalized Cuts は分割クラスタ数を固定した上で,独自の評価基準のもとでクラスタ分割を得るという手法である.クラスタ数を固定するため,クラスタ数を変えることに対する柔軟性には乏しい.また Normalized Cuts は行列計算を行う際に粗行列化することによって計算量をO(n1.5) に減らしてるが,粗行列化できない場合にはO(n2.5) にまで増大してしまう.(nはデータ数である.)本論文で提案する階層型アルゴリズムは Normalized Cuts のこれらの問題点を解消できるいったん実行してしまえば,様々なクラスタ数の解を得ることが容易である.また,計算量は常にO(n2)である.アルゴリズムの基本的な骨格は古典的な階層型手法に似ている.しかし Normalized Cuts の評価基準を用いているために,両者の長所を併せ持つ.すなわち,Normalized Cuts のように任意の形状のクラスタを得られ,かつWard法のように樹形図を得ることができる.The characteristic mark of Normalized Cuts is that it relies on a linear algebraic approach including spectral decomposition. Basically, it obtains a partition by fixing the number K; of clusters. Therefore, it is not so easy to obtain partitions of various k, besides re-calculating. Moreover, when we cannot use sparse matrix, computational complexity jumps up to O(n2.5). We propose an hierarchical algorithm which can resolve these problems. It is easy to obtain partitions of various k after running the program. Its computational complexity is O(n2).
著者
久野 敦司 大野 広視 中沢 実 服部 進実
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.3, pp.75-80, 2005-01-20
被引用文献数
1

ユビキタスセンサネットワークの多くの研究は、多数のセンサをインターネットに接続するために、無線ネットワークを用いている。しかし、現状のユビキタスセンサネットワークは我々の社会に大きな問題をもたらす可能性がある。もし、多種類のセンサが我々の社会のいたる所に配置されると、我々はプライバシーを保てなくなる。そこで、本稿では植物をセンサとして用いることで、この問題を解決できることを提案する。植物の出力信号は植物にとっての教師としての役割を果たす人間によって実行される学習プロセスの実行によってのみ、センシングデータとすることができると考える。すなわち、植物は人間の協力無しには、センシング能力を得ることができないのである。もし、人間によって十分な個数の植物にセンシング能力が与えられたならば、複数のセンサ出力に対する多数決論理によって生成される教師データを用いた学習によって、そのセンシング能力を維持できることについて提案する。Almost of researches about a ubiquitous sensor network uses a wireless network that connects many sensors with Internet. But there may bebig problems on this ubiquitous sensor network for our human society. If many kinds of sensors are deployed everywhere in our society, we can not keep our privacy. If we use a plant as a sensor, we are able to solve this problem, because the output signal from plant can be used as a sensing data only after a learning process that is performed by a human who acts as a teacher for a plant. So, a plant can not have a sensing ability without human's cooperation. If enough number of plants is given a sensing ability by human, the sensing ability can be maintained by learning process with the teaching data that is generated by majority logic on a plurality of sensor outputs.
著者
當山 日出夫
出版者
情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.1, pp.1-4, 2009-05-16
被引用文献数
1

人文学では 「文字」 はきわめて重要である。フォント埋め込み PDF の利用は、確かに便利ではある。しかし、フォント (グリフ) とともに文字があつかえるようになることは、新たな問題点を生み出す。現在、デジタル文字を確実に共有できるであろうか。また、将来にわたって、同じ文字を利用できるであろうか。この問題について、『内村鑑三全集』 デジタル版を事例に、考えることにする。Planning of the digital publishing of " UCHIMURA KANZO ZENSHU " is progressing. This is using font embedding PDF. However, the user in the after times can not see the same character. Font embedding PDF invents a new problem about the character. We must proceed with the research about the essence of the character.
著者
李 晃伸 河原 達也 鹿野 清宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.49, pp.281-286, 2003-12-18
参考文献数
15
被引用文献数
7

音声認識システムにおいて,認識結果に対して事後確率などを用いて信頼度を付与することで,発話検証や対話管理などの音声アプリケーションにおいて認識誤りを考慮したより高度な処理を行うことができる.この単語の事後確率を用いた信頼度算出では,通常,認識処理(デコーディング)の結果得られた仮説群のゆう度をもとに計算されるが,十分な精度の確信度を得るためにはN-best候補で数百以上の大量の文仮説を求める必要があり,多くの計算量を必要とする.本研究では,2パストリートレリス探索に基づくデコーディングにおいて,探索中に得られる部分文仮説の尤度から単語の信頼度を簡易かつ高速に算出するアルゴリズムを提案する.後段パスのスタックデコーディングにおける単語仮説展開時に,その次単語仮説の集合およびそれぞれから展開される新たな仮説のヒューリスティックを含む尤度から,その展開単語の事後確率を計算する.通常のデコーディング処理に対して極めて少ない計算量で信頼度を計算できる.認識エンジンJuliusにおいて,N-best候補から事後確率を算出する従来手法との比較を行った結果,提案手法は大量のN-best候補を求める必要がないことから認識処理全体を非常に高速に行え,また信頼度の精度も,簡易な計算法ながらN-best候補を用いる手法と同等以上の信頼度を算出できることが示された.
著者
白楽強 Peter 山川 榎原 博之 中野 秀男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告アルゴリズム(AL) (ISSN:09196072)
巻号頁・発行日
vol.1994, no.82, pp.89-96, 1994-09-21
被引用文献数
1

arrangement graphはstar graphを一般化したグラフであり、star graph同様の良い性質を持っている。さらに、次数、直径、ノード数の点でより柔軟性のある設計ができる。この論文はarrangement graphについて最適なone?to?all放送アルゴリズムを提案する。このアルゴリズムはグラフの階層的な構造を活用して再帰的に実行し、最適なステップ数O()ですべての(!)/((?)!)プロセッサにメッセージを放送することができる。A new interconnection network topology-the arrangement graph, as a generalization of the star graph topology, possesses excellent topology like the star graph and presents more flexibility than the star graph in terms of choosing the major design parameters: degree, diameter, and the number of nodes. In this paper, we propose an optimal distributed algorithm for one-to-all broadcasting on the arrangement graph in fault free mode. The algorithm, which exploits the rich inherent structure of the graph to constitute the structure of broadcasting binary tree and works recursively, broadcasts a message to all the (n!)/((n-k)!) processors in O(klgn) steps.
著者
Wu Haiyuan Chen Qian Wada Toshikazu
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.139, pp.9-16, 2003-07-03
被引用文献数
1

For the camera calibration, point correspondence data between 3D and 2D points widely spreading over the image plane is necessary to get a precise result. However, in the case of wide observing area, it is impractical to use a huge calibration object that covers the camera view. This paper presents a refined calibration method using circular patterns. We already proposed a circular pattern based camera calibration method using a four-wheel mobile robot. That is, by keeping low speed and constant steering angle, the robot can draw a big circular pattern on a plane. Our previous method, however, has a limitation that roll angle around the optical axis is assumed to be zero. This paper presents an improved version of the camera calibration method. Our method estimates the extrinsic parameters of fixed camera from a single circular trajectory when the focal length of the camera is known. In the case that the focal length is not given, two co-planar un-concentric circular trajectories are enough for calibrating the extrinsic parameters and the focal length. In both cases, the center and the radius of the circle(s), the speed of the robot are not required. The extensive experiments over simulated images as well as real images demonstrate the robustness and the accuracy of our method.
著者
谷本 直人 藤村 考
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.3, pp.37-42, 2005-01-19

ネット・コミュニティにおいて提供される様々な情報の評判を定量化する方法を述べる。本稿で提案するEigenRumorアルゴリズムは、コミュニティの参加者による情報の提供と、提供された情報に対する参加者による評価という2種類の行為を参加者から情報へのリンクとみなし、リンク分析によりそのネット・コミュニティでの情報の評判をスコアリングする。本アルゴリズムは、コミュニティ参加者の貢献度も同時に算出するため、コミュニティの中の「良い」参加者を特定するためにも有効である。また、評判の算出で重要な「さくら攻撃」に対する耐性について評価した結果を報告する。This paper describes a method for quantifying the degree of reputation for information resources provided in Electronic communities. The EigenRumor algorithm, proposed here, calculates the reputation scores based on a link analysis approach by considering information provisioning and information evaluation actions as links from participants to information resources. This algorithm also calculates the contribution level of participants in the electronic community and it is used to identify "good" participant as well as "good" information. The robustness of the algorithms against "ballot stuffing" attack is also discussed.
著者
田岡 康裕 納谷 太 野間 春生 小暮 潔 李周浩
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.66, pp.147-152, 2008-07-10

本稿では Bluetooth による受信信号強度を用いたユーザの位置推定手法を提案する. 本手法は医療事故の発生要因の分析などにおいて重要となる 看護師のインタラクション情報を得るためのものである. 本手法ではユーザに装着した移動局が複数の固定局から一定時間で得られる受信信号強度の平均値 最大値 最小値 中央値を特徴量として用いて位置推定を行う. 本手法の有効性を評価するために 2 床のベッドを配置した模擬的な病室環境での実験を行い ベッド際のどの位置にいるかおよびそれ以外にいるかという識別については 80% 以上 どちらのベッドの患者に対するインタラクションかの識別においては 90% 以上の識別率が得られることがわかった.This paper proposes a method for estimating a user's location with RSSI (Receiver Signal Strength Indicator) of Bluetooth in order to obtain information about the user's interactions. The method uses average, maximal, minimum and median values of RSSI that the mobile station attached to the user obtains from some fixed stations in a sliding window. This method has been evaluated experimentally in simulated ward environment with two beds. The method obtains more than 90% accuracy for identifying the patient that the user interacts.
著者
玉真昭男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータと教育(CE) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.128, pp.29-36, 2008-12-13
被引用文献数
1

プログラミング教育において重要なことは、文法マスターと数多くの問題演習に加えて、数千行以上のプログラムの開発体験を積ませることである。 3D ゲーム開発は格好の課題となる。これまでに、 Visual C++ と DirectX を組み合わせ、 3D 描画技術を用いた各種のゲームを作成してきた。物理モデルを取り入れ、ゲームに登場する 3D オブジェクトに物理法則に従ったリアルな運動や挙動をさせることも出来た。今回、シューティングゲームとレースゲームの2つの成果を報告する。後者に於いては、運転再現モード等を追加して、運転の評価・分析が行えるシステムに拡張した。これを 「全日本学生フォーミュラ大会」 に向けたドライバーの運転練習に活用し、総合成績アップにつながる成果が得られた。In the programming education, what is important are not only mastering the programming language grammar and solving many exercises, but also development experience of a program over 3000 lines. 3D-games are good targets for that purpose. This year, two students developed a shooting game and an F1-racing game. Each of them developed an over-10,000 line program and found how difficult a 3D-game development was. They also knew the necessity of knowledge in mathematics and physics, which proved that game development is very good target for the programming education as well as basic subjects education. The F1-racing game has been developed to a racing simulator for the "Student Formula SAE Competition 2008" and helped the driver train his driving skill off the course.
著者
田島 孝治 高田 智和
出版者
情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.6, pp.1-6, 2010-07-24

本発表は,GPS とデジタルカメラを用いた景観文字調査において,目視による写真分類作業を効率的に行うために,撮影位置と Exif 情報中の 「レンズ焦点距離」 を活用する方法について効果と問題点を考察する.また,提案方法を搭載したツール開発の現状について報告する.We discuss the effectiveness and the problem abut classifying images using the focal length information in Exif tag for the linguistic and notational landscape survey with GPS and Digital cameras. And we explain the developing system that has proposed method for notational landscape survey.
著者
児玉 祐悦 高野 了成 岡崎 史裕 工藤 知宏 伊藤 智
出版者
情報処理学会
雑誌
研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.5, pp.1-7, 2009-11-23

データセンタの省エネルギー化を推進するために、IT 機器による生産性を加味した電力利用効率の指標が求められている。そのような指標を策定するために、処理内容による消費電力のモデル化が重要となる。その一歩として、ネットワーク転送時のノードの消費電力のモデル化を試みた。その際、ペーシングによる帯域制御を行ったところ、転送バンド幅を減少させても消費電力が増加する場合が観測された。これは割り込み削減機構に因るものであり、この割り込み遅延時間を制御することにより、消費電力を削減することができた。ネットワーク転送時の消費電力のモデル化には、転送バンド幅だけでなく、割り込み回数をパラメータとすることが有効であった。To improve the energy efficiency of data centers, the new metrics for data center efficiency are required to include productivity that is a useful work produced in a data center. To propose a new metric, we will create a model of power consumption for productivity. As the first step, we measured the power consumption of nodes when they communicate using network. In this measurement, we observed that the power consumption increased when the effective bandwidth was decreased with rate controlling by pacing. This phenomenon was caused by interrupt coalescing, and by controlling the delay time of interrupt the power consumption can be decreased. We also found that the number of interrupts is a good parameter to estimate the power consumption of nodes with communication.
著者
大谷貴胤 佐々木 広 近藤 正章 中村 宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.79, pp.145-150, 2007-08-02

ウェブサーバ用計算機クラスタは消費エネルギーと冷却コストの増加に伴い,電力管理が重要になってきている.従来のウェブサーバクラスタは負荷のピーク時に備え全てのノードが常時稼動している設計であった.、しかし,実際には負荷がピークに達するような状況は少なく,性能の余裕を残した状態で稼動している時間が多いそこで,我々はこれまでに負荷状況に応じてノード数と動作周波数を変化させることにより,応答時間制約を満たし最も消費電力の低い構成を選択し従来よりも低消費電力であるシステムを実現する手法を提案している.本稿では,その実現上必要となる処理性能と消費電力のモデリングについて述べる.With increasing costs of energy consumption and cooling, power management in Web server clusters has become an increasingly important design issue. Current Web server clusters are designed to handle peak loads, where all servers are fully utilized. But in practice, peak load conditions rarely happen and servers are most of the time underutilized. We, so far, proposed a low power cluster-based Web server, which is reconfigured to reduce power consumption by adjusting the number of nodes and clock frequency of each node according to load conditions. In this paper, we describe power-performance modeling in cluster-based Web servers.
著者
五木 宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告エンタテインメントコンピューティング(EC) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.62, pp.1-6, 2008-06-28

良質で豊富なシリアスゲームは社会的資産であり,その充実は開発生産性の向上なくしては達成できないシリアスゲームの企画開発における特殊性への対応と,コンテンツ制作環境の変化への対応,および制作ワークロードの軽減が重要な課題であるシリアスゲームの企画のワークフローに内在する隘路を仮定し,これに対応するフレームワークおよび支援ツールについての検討をすることとした.隘路としては次の三点であると仮定した.すなわち,企画作業の体制および方法に関する問題,プロトタイピングの問題,レベルデザインの問題である.これらの問題に対処する具体的な解決策について今後,制作と実験を行ってゆく予定である.The productivity improvements of seriousgame are required to fill the gap between increasing various and good-quality demand and limited supply. There are three main bottlenecks lying on the workflow of seriousgame development, the planning work, the prototyping and the leveldesign. The key factors on defusing the bottlenecks are solutions for the particularity on planning and reduction of workload under the rich-media environment. For the sake of providing the solutions, such as frameworks for planning and productivity tool, a research and experiment are ongoing.
著者
小畑 郁男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.123, pp.29-34, 2002-12-22
参考文献数
15
被引用文献数
1

多くの音楽様式が混在する現代においては、どのような音楽様式にも適用することができ、音楽の聴覚的な把握に貢献する中立的な音楽理論の必要性は高いといえる。このような状況を背景として、本報告では、量的に不協和度を算出する感覚的協和理論の作曲技法への三つの応用例が提示される。この12等分平均率を前提とする三つの例は、(1) 感覚的不協和度の差異による音高構成の設計、(2) 声部の澄明性の差異による音高構成の設計、そして (3)「R協和音列」に関する応用例である。R協和音列は、基準音を中心とした上下に対称的な音程構造を持ち、「和声二元論」を例証する音響現象である。Music today having a great variety of styles, new music theory that is based on auditory sense and able to apply to every musical style is needed. With the background of necessity for such new theory, three applications of sensory consonance theory to the design of pitch combination are presented based on the following three criteria. They are (1) difference of sensory dissonance, (2) the clearness of voice part in music, and (3) sensory consonance tone series, which consists of symmetrical interval structure centering around optional base tone and illustrates "Harmonic Dualism".
著者
服部 裕介 田中 彰人 星野 准一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告グラフィクスとCAD(CG) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.111, pp.85-90, 2007-11-13

格闘ゲームのような対戦型のアクションゲームにおいて,コンピュータが操作するキャラクタ(以下COM)の行動は変化に乏しく,プレイヤは繰り返しプレイすることによって COM の行動パターンを憶えてしまい,ゲームに飽きてしまうという問題がある.そこで,本稿ではプレイヤを模倣学習する手法を用いて,COM の行動パターンを拡張する手法を提案する.本手法では,プレイログを記録し,対戦相手であるプレイヤの行動パターンを分析し,そのプレイヤの行動パターンの一部を模倣することでCOMの行動パターンを拡張する.本手法を用いることで,試合ごとに行動パターンを拡張し,成長していけるCOMを生成することが可能となる.In action game, the computer's behavior lacks diversity and human players are able to learn how the computer behaves by playing the same game over and over again. As a result, human players eventually grow tired of the game. Therefore, this paper proposes technique to expand the behavior pattern of COM. To this end, we use imitation learning. In this technique, play log is recorded. And COM expands the behavior pattern by imitating a part of player's behavior pattern. In the result, COM is able to expand the behavior pattern every match and grow up.
著者
吉川 厚 斉藤康己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.1993, no.103, pp.41-53, 1993-11-24
被引用文献数
1

人間がいかに状況を認識し,それを使って行動を決めるかのモデルをつくるために,囲碁を題材として認知実験を行い,いくつかの現象を見いだした。実験は被験者を非対峙状況において自手を決定するまでの一連の思考を内省しながら対局してもらうことにした。また,片方にはアイカメラを装着し視線データをとった.このような方法で様々な角度からのプロトコルを入手し,それを分析した結果,境界の認識,先読み時の注目点や深さなどにいくつかの知見を得たのでこれを報告する。加えて、今後解明すべき認知的な課題を列挙する。We present an experimental analysis of several phenomena when subjects are playing Go, in order to investigate how people recognize the situation of a game and decide what to do next. Subjects were asked to reflect by themselves while playing a game. One subject wore an eye camera, and we recorded the eye movement data. We analysed those protocols, such as verbal protocol, eye movement, the record of the game and so on. We found out some interesting phenomena and a lot of future research directions.
著者
桑原 雄 稲垣 陽一 草野 奉章 中島 伸介 張 建偉
出版者
情報処理学会
雑誌
研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.18, pp.1-3, 2009-11-13
被引用文献数
11

近年,ブログや SNS 等,ユーザの生活体験が直接反映されたコンテンツが数多く配信されるようになってきている.我々は,これらのコンテンツを解析することで,ユーザの生活体験に基づいたシソーラスを半自動的に作成するシステムの研究開発を行っている.本稿では,このシステムを用いて作成したシソーラスを用いて,マイクロブログ上でユーザが発信した情報を分析し,特徴的なトピックやそれに対する感情を抽出することで,興味,志向が類似したユーザを発見する方法,及び類似ユーザを推薦する手法を提案する.Recently, the internet has experienced an explosion of personal media from social media sites such as blogs, Facebook, Twitter and so on. Much of this persona media describes a person's life experiences and events, ranging from the mundane to the intriguing. As it is such, we are developing a life experience thesaurus system which can automatically recognize the life experiences based upon textual analysis. In this paper, we describe the use of this thesaurus in our micro-blogging user recommendation system. This system analyzes user postings, extracting the topics and sentiments, and lastly recommends similar users.
著者
水野 淳太 緒方 淳 後藤 真孝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.46, pp.31-38, 2008-05-15

本稿では,エピソードと呼ばれる音声ファイルの集合から成るポッドキャスト(音声ブログ)を対象とした,類似エピソードの検索手法について述べる.動画共有サイト等で,あるコンテンツの再生後に関連・類似したコンテンツを提示する機能を持つものが多いが,それらは書誌情報やタダユーザの視聴履歴に基づいている.本稿では,エピソードを音声認識した結果に基づいて,音声認識結果を confusion network に変換し,そこからエピソードを特徴づけるキーワードセットを抽出して,キーワードセット間の類似度を計算することで,関連エピソードを検索・提示できる手法を提案する.単語正解率や話者数など,傾向の異なるいくつかのエピソードに対して実験を行い,本手法がどのような場合に有効であるかについて評価を行った.本成果は,音声認識に基づくポッドキャスト検索サービス PodCastle で,関連エピソードを提示するためにも利用できる.Given podcasts (audio blogs) which are sets of speech files called episodes, this paper describes a method for retrieving similar episodes. Although video sharing services usualy have a function of showing a set of relevant /similar content after playing back a piece of content, they are based on bibliographic information, tags, and users' playback behaviours. In this paper, we propose a method that extracts keywords from confusion networks converted from speech recognition results and then retrieves and shows relevant episodes on the basis of similarity between those keywords. We evaluated this method using several episodes including a variety of speech recognition accuracy and the number of speakers. This result can be applied to show relevant episodes on PodCastle, a podcast search service based on speech recognition.
著者
浅原 正幸 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. NL,自然言語処理研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.137, pp.39-46, 2000-06-01
参考文献数
9
被引用文献数
1

我々は日本語形態素解析器『茶筌』のための学習ツールを開発している。現在『茶筌』では階層構造をもった品詞体系を採用し、タグの種類は約500にもなっている。このため、通常の品詞tri-gramモデルの作成は困難で、品詞bi-gramモデルでも適当な量のタグづけコーパスを得ることは難しい。通常、このような細かいタグを取り扱うために、複数のタグを同値類へとグループ化することによってタグの数を減らすことが行われる。我々はこれを拡張し、マルコフモデルの条件付き確率計算について各件でタグの同値類を変更するようにした。さらに、例外的な現象によるデータスパースネスに対処するため、単語レベルまで品詞として見るモデルと、選択的tri-gramモデルを導入した。また、単語レベルまで品詞として見る場合には、単語-品詞間スムージングを導入した。『茶筌』にこれらのモデルを適用し、各拡張の評価を行った。
著者
上前田 直樹 橋田 浩一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. DD, [デジタル・ドキュメント] (ISSN:09196072)
巻号頁・発行日
vol.50, pp.23-30, 2005-05-27
参考文献数
11

合議におけるキーパーソンを見出すことは、議論の流れを把握したり議論を活性化したりする上で重要であるが、従来は議論の意味内容に立ち入って解析するのが困難だった。本稿では、セマンティックオーサリングに基づく電子会議において、修辞関係と対話関係によって明示された議論の意味的な構造を用いて各参加者の貢献度を評価しキーパーソンを同定する方法を提案する。実際の合議の記録に関してそのような意味構造を用いて貢献度を計算し、この方法の妥当性を示す。