著者
落合 友四郎 ウルフレオンハード ホセナチェル
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.85, pp.99-101, 2008-09-11

不可視装置 (透明マント) とは、光をうまく迂回させて、中にある物体を見えなくする技術であり、いわゆるハリーポッターの透明マントのことである。今回、左手系メタマテリアル (負の屈折率をもつマテリアル) を用いて、等方性媒質において完全な不可視装置 (透明マント) を理論的に設計した。この設計においては、完全な不可視性を実現でき、時間遅れと反射の両方をゼロにすることができる。The aim of an invisibility device is to guide light around any object put inside, being able to hide objects from sight. In this work, we propose a novel design of dielectric invisibility media based on negative refraction that creates perfect invisibility. In this device, both the time delay and the reflection are zero. These findings strongly indicate that perfect invisibility with optically isotropic materials is possible.
著者
本谷秀堅 来海暁 安藤 繁
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.74, pp.9-16, 1999-09-16
被引用文献数
5

我々の研究室では、画像の特徴量を直接計測することのできる固視微動型イメージセンサを開発している。固視微動型イメージセンサとは、画像を取得する際に微動することにより画像特徴を時間変調し、微動と同期した参照信号による復調により画像特徴を直接計測するセンサである。画像特徴をセンサの微動により変調しているため、量子化誤差を含むこと無く特徴量を計測することができる。また参照信号と無相関なノイズ成分も除去することができる。本稿では、センサを円運動させ、参照信号に三角関数を用いることにより、本センサが画像の微係数を直接計測できることを示す。試作した固視微動型イメージセンサを用いた実験およびシミュレーション実験により、本手法が直接画像微係数を計測できることを確認した。Our laboratory is developing a correlation image sensor which obtains time-domain correlation between an output signal of a photo-detector of the sensor and a reference signal. We proposed a feature extraction method which uses this correlation image sensor. The proposed method modulates the image features by vibrating the image, and demodulates the features with reference signals which synchronized with the sensor vibration. This method extracts image features free from quantized error and from noize which has no correlation with the reference signal. In this paper, we propose a method to extract differential coefficients by vibrating the image circularly and demodulating with trigonometric functions. Experimental results show that the proposed method detects differential coefficients successfully.
著者
坂本 俊介 須藤 崇志 丸山 広 中村 太一
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.17, pp.1-6, 2009-07-23

技術文章力を高めるには,個別に添削指導を受けることが有効であるが,時間的な制約により実現が難しい.この問題に対処するため,書き手自身が短時間で何度も文章の客観的な見直しを繰り返し行い,さらに指摘の重要性や修正例を提示する校正支援手法により,学生の文章作成能力の向上に寄与できることを示した.また,学生の実験レポート2,285編から,140,214件の誤りを指摘した結果,学生に多い誤りは句読点および体言止めで79.4%を占めた.同時に,技術文章作成のノウハウを課題やレポートを通じて習得させることの重要性を改めて確認できた.There has been discussion about improving technical writing skills. Individual tutoring which a mentor provides a trainee to correct a technical writing might be the most effective way to enhance the skills. However it is difficult to repeat the tutoring many times because of time consuming job. We propose a method that an author oneself can emend a manuscript repeatedly. The method is based on a recommendation system which implements Japanese grammar and technical writing grammar with a morphological analysis. This paper describes the experimental results obtained from 2,285 reports written by students. The proposing method detected 140,214 technical writing errors in their reports. 79.4% of 140,214 errors are a punctuation mark and the indication of the termination with a substantive and speak that it is effective to teach these errors.
著者
永野 秀尚 柏野 邦夫 村瀬 洋
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.82, pp.67-72, 2001-08-04
被引用文献数
2

本稿では、音や映像のメディア探索のための曖昧文字列照合法を提案し その類似音楽検索への適用を検討する. ここで類似音楽検索とは多重奏音楽の音響信号を検索キーとして 長時間の音楽から検索キーに類似する部分を探索することである. この探索においては 信号間の類似度と信号の伸縮を考慮しなければならないことと 探索に時間がかかることが問題である. そこで 符号間の類似度を表現する類似度行列を導入し これに基づき符号系列化された信号間で 伸縮を考慮した探索を 類似度行列のスパース性により高速に行う曖昧文字列照合法を提案し この類似音楽検索に適用した. 30曲の類似音楽サンプル用いた予備実験では 曖昧文字列照合法により 従来のDPマッチングを用いたずらし照合法と比べ 約4倍高速な探索が行えた.We propose a Similarity-Based String Matching method for media information retrievaland its application to similar-music retrieval.The media information retrieval is here defined as detecting all the segments that are similar to a specified audio or video segments on a long audio or video stream. In such a task, we must consider similarities between features, deal with temporal stretching or shrinking, and also realize quick searching. Thus, the proposed method introduces a similarity matrix with a similarity enhancement technique and the DP matching method with a newly developed acceleration technique. Experiments using 30 similar-music pieces show that the proposed method can retrieve similar music fragments approximately four times faster than the conventional DP matching method, maintaining the same accuracy.
著者
平賀 正基 水越 一貴 中井 真悟 八代 一浩 安藤 英俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告インターネットと運用技術(IOT) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.38, pp.55-60, 2007-05-10
参考文献数
6

近年,イベント中継や映画,アニメ,スポーツなどの動画像をインターネットでストリーミング配信することが多く行われてきている.そのような中でYahoo動画やYouTubeをはじめとしてWebページにストリーミングを埋め込んで配信することが一般的になりつつある.Webページ埋め込み型のストリーム配信においてはストリームに連動してWebページが更新されることが多い.しかし,この更新はソースファイルの変更時や一定時間を経過した時にしか行われない.これらの更新をストリームのシーンに応じて変更することができればストリームだけではなくwebページにも視聴者の注目を集めることが可能になる.本研究では,花火大会のWebページ埋め込み型ストリーミングにおいて花火の合間を検出しwebページを動的に変更するシステムの構築を行った.このシステムを実際に使用しその効果を検証した.Many kind of video contents is being delivered. For example, the movie, the animated cartoon, and sports, etc. often deliver the streaming in the Internet in recent years. Then, burying the streaming under the Web page, and delivering it including the Yahoo animation and YouTube are becoming popular. In the stream delivery of Web page burial type, it synchronizes with the stream and the Web page is updated. However, only when the change and the fixed time of the source file pass, this update is done. If these updates can be changed according to the scene of the stream, attracting the viewer's attention on not only the stream but also the Web page becomes possible. In this research, the interval of fireworks was detected in Web page burial type streaming of fireworks and the system that dynamically changed the Web page was constructed. The effect was verified by actually using this system.
著者
小方 厚
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.24, pp.47-50, 2004-03-05

オクターブを12ではない数で対数的に等分割した音律を用い,ジャズ・民謡風の旋律・グレゴリオ聖歌などの演奏を計算機上で試みた.ソフトウェアにはMAX/MSPを用いた.17音平均律は周波数比4/3 3/2に近いペアを含むため,違和感の少ない音楽ができる.これに対し16音平均律では構成音の周期数比はすべて無理数となり,不思議な音楽ができる.Musical pieces were composed and performed on a computer, which is based on equally-tempered scales with more than 12 notes. The scale with 17 notes includes the pairs with 4/3 and 3/2 frequency ratios and sounds less strange than the 16 notes scale, in which the frequency ratios are mostly irrational.
著者
林 剛史 福井 健太郎 宮田 章裕 重野 寛 岡田 謙一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告グループウェアとネットワークサービス(GN) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.49, pp.43-48, 2005-05-26

本稿では、簡易脳波測定によるリアルタイムな思考状態導出手法を提案する。簡易脳波計を用いて脳波情報より思考状態を推定する際には、ノイズや脳波の個人差を考慮しなければならないため、リアルタイム処理が困難である。また、思考を時間幅のあるプロセスと捉えて過去の思考の影響を考慮している手法が従来にはみられなかった。そこで、本提案ではノイズを除去し、個人差を考慮し、時間幅を考慮することにより簡易脳波計よりリアルタイムに思考状態をMS-Levelという独自の指標で数値化する手法を提案する。そして、提案概念を検証するためにMS-Levelを導出するプロトタイプシステムを用いた評価実験ではノイズの除去が確実に行われていること、時間幅を考慮して思考状態を有効に提示できることを確認した。In this paper,we propose a technique for estimating mental states in real-time from the EEG(electroencephalogram). When we estimate mental states from brain wave information by using an EEG in real-time,it is necessary to consider the noise and the individual variability of the brain wave. Also,there seemed to be no studies to consider thinking as time-width process which is affected by the past thinkings. To address these issues,we propose a method to quantify the mental state as the MS-Level(Mental State Level) in real-time by eliminating the noise,considering of the individual variability and treating the thinking as the process with the time width. We ran experiments to evaluate our proposition using a prototype system,and concluded that the noise have been removed surely and to present the mental state effectively using past EEG data.
著者
大海悠太 渋谷 慶一郎 江原 寛人 池上 高志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.102, pp.55-60, 2007-10-12
被引用文献数
2

ロジスティック写像の結合系やセルオートマトン、進化システムのシミュレーションなどを用いた複雑系の時間発展パターンによって制作する音響生成ソフトウェアの開発と、そのソフトウェアを用いたサウンドインスタレーションについて報告する。We report our development of music softwares using generators in complexity systems such as coupled logistic maps, cellular automaton and evolutionary system simulations. We also report sound installations produced with these music softwares.
著者
小山 照夫 影浦峡 竹内 孔一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.124, pp.55-60, 2006-11-22
参考文献数
7
被引用文献数
8

テキストコーパスからの用語抽出は、自然言語処理技術の重要な応用である。従来テキストコーパスから用語候補を抽出する方法として、主として候補出現に関わる統計的指標を用いて用語性を判定する方法が採用されて来たが、統計的手法では出現頻度の低い候補についての判定が困難であった。今回の発表では、複合語に注目し、用語性を損なう形態素出現パターンを排除する形での用語候補抽出を行うことにより、高い精度で複合語用語抽出が可能となることを示す。Term extraction is one of the most important application of natural language processing technologies. Statistic criteria are widely adopted to evaluate the termhood of the extracted candidates. However, it is difficult to evaluate the termhood of less frequent candidates. In this study we propose a method for Japanese composite term extraction in which unproper morpheme patterns are eliminated. Using the new method, high precision of term extraction can be attained for Japanese composite terms.
著者
武田 隆之 牛窓 朋義 山内 寛己 門田 暁人 松本 健一
出版者
情報処理学会
雑誌
研究報告ソフトウェア工学(SE) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.8, pp.1-8, 2010-03-11

本稿では,学生の演習課題のような小規模なソースコードを対象とした盗用の検出を目的とする.インデント,演算子などのコーディングスタイルに着目し,59 項目の特徴量として抽出し,盗用の発見に用いる.盗用関係にあるソースコード間において 59 項目の特徴量の差分を測定し,盗用関係にないソースコード間における特徴量の差分と比較したところ,28 項目の特徴量が盗用検出に有効であること,28 項目のうち 8 項目の特徴量はプログラムの内容によらず盗用検出に有効であること,8 項目のうち 3 項目の特徴量はソースコード整形ツールによるインデント整形に対して耐性を持つことが分かった.The goal of this paper is to detect software plagiarism in small-size source code like exercise assignments at school. This paper focused on coding style elements, such as indents and operators, and computed 59 quantitative measures from these elements. To evalute the usefulness of measures for plagiarism detection, we compared measures of suspected pairs (of plagiarism) and nonsuspected pairs. As a result, we found that 28 measures were effective to detect plagiarisms. Especially, 8 of 28 measures were effective for different program specifications, and 3 out of 8 measures were effective even after source code indentation tools were applied.
著者
勝治宏基 米澤拓郎 中澤仁 高汐一紀 徳田英幸
出版者
一般社団法人情報処理学会
雑誌
研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.17, pp.1-7, 2013-10-29

近年,センシングデバイスの小型化,低価格化により,ウェアラブルセンサを利用して人の行動を取得する事が容易になった.それにより,私達の日々の生活行動を自動的に取得,蓄積するライフログが幅広く研究される様になった.本研究では,自分と他人の一日の行動から二人の似た行動を類似行動として生成するシステム Synchrometer を提案する.生成した類似行動は行動改善や医療,介護,新しいコミュニケーションの生成など,様々な場で利用する事が可能である.Recently, because of miniaturization and low cost of the sensing devices, obtaining human behavior became more easier . Therefore, lifelog, which is getting and storing our daily life activities, became to be studied widely. In this study, we propose the system Synchrometer which create a similarity as similar-activity from two people's daily activity. Similar-activity have a possibility to use to behavioral improvements, medical, nursing, generating new communication and so on.
著者
岩本 拓也 小倉 加奈代 西本 一志
出版者
情報処理学会
雑誌
研究報告ヒューマンコンピュータインタラクション(HCI) (ISSN:09196072)
巻号頁・発行日
vol.2012, no.16, pp.1-8, 2012-10-25

恋人間の愛着行動 (いわゆる 「いちゃいちゃ」) は,幸福感を得るためや相手との関係をより良いものにするために重要な行為である.恋人達の多くは,常に愛着行動をとりたいと願っている.しかしながら公共空間では,目の前にパートナーがいるにもかかわらず愛着行動を行うことができない.従来の恋愛支援技術の研究は,遠距離恋愛者を対象に研究開発が進められてきたが,近距離恋愛者に対しても支援すべき課題が残されていると考える.そこで我々は,公共空間内での対面状況において,周囲に不快感を与えることなく愛着行動を行えるメディアの研究開発を進めている.本稿では,このメディアの実現に向け,どのような種類の行動を伝え合うことが有効かに関する基礎的検証を行う."Acting cozy" is important for lovers to feel happiness and to improve their relationships much better. Many lovers desire to always act cozy. However, it is actually difficult to act cozy in a public space although they are together there. Whereas the ordinary research efforts have attempted to mainly support long-distance lovers, there are also several issues to be solved even for short-distance lovers. Accordingly, we have been studying a medium that allows the short-distance lovers who stay together to convey cozy actions even in the public space without disgusting people around them. This paper investigates what kind of cozy actions should be transmitted between the lovers being together in the public space.
著者
鯨津 宏樹 河野將人 植村 匠 内村 圭一 胡振程
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告高度交通システム(ITS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.83, pp.33-38, 2008-09-03
参考文献数
5

現在,デジタル地図はカーナピゲーションシステムやインターネットなどの地図情報サービスなど様々な状況で用いられている.これらのデジタル地図は,用途によって様々な縮尺のものが用いられている.これらの尺度の異なる地図データは,詳細な地図データから人間に見やすい簡略化地図データを作成することが計算速度や精度の問題により難しいため,全て手作業で作成されている.これらの問題を解決するため,詳細な地図データから簡略化地図データを自動生成する方法の研究を行っている.本論文では,簡略化地図作成の一環として,道路や河川などの幅を持つポリゴンデータのラインデータ化,及びデータの構成点間引き手法の提案と検討を行っている.In these days, we use digital maps in various situation. For example, it is a car navigation system or map information service on internet. Then, the digital maps are different scale by those situation. However, all these maps are made with manual labor in the problem of the processing speed and inaccuracy. Therefore, we examined a method to produce a simplified map from a detailed map automatically. In this paper.we propose the method of making line data with polygon data and making a simple data from a detailed data by removing the constitution point in order to make simplified maps automatically.
著者
佐々木 宣介
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.70, pp.53-60, 2006-06-30
参考文献数
6
被引用文献数
1

本研究の大きな目標は,世界の全将棋種を対象に,ルールの変遷が各将棋種に対してどのような質的影響を与えたかを探ることである.これまで計算機による自動プレイによって将棋とその変種のデータを調べ,質的類似度についての評価を行ってきた.また,自動プレイ実験で使われる思考アルゴリズムでは駒価値の評価を利用しているが,既に廃れてしまった将棋種の駒価値の学習を強化学習の一種であるTD 学習法を適用することを提案し,実験を行ってきた.本論文では,実験対象とする変種に桂馬の働きを八方桂にする変則将棋を加えた実験を行った.また,将棋とその変種の面白さに関係する特徴として,ゲーム進行に際しての形勢逆転の頻度に着目して,自動プレイ実験によってこの頻度を調べ,比較した結果を報告する.This study explores how the evolutionary changes of the rules affect the characteristics of the games in the Shogi species. The author proposed the self-play experiment to obtain the statistical game data and analysed the similarity of Shogi variants. In this paper, the author analysed the variant of "Happoukei" (the piece KEIMA can move to all directions like the Knight of Chess). Next, the author observed the frequency of reversal on the games of Shogi variants and compared the characteristics of these variants.
著者
朱文傑 武内 雄太 羽生 武史 吉田 脩二 石川 孝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告グループウェアとネットワークサービス(GN) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.31, pp.1-6, 2008-03-21

ウェブ検索から取得する情報量の増大に伴って、一度見つけたウェブページをもう一度見つけることが困難になる。ブックマークはウェブページ再検索のためによく利用されるが、ブックマークの数の増加につれて、ブックマーク自体の再検索が問題になる。本論文は、ウェブページの検索に使われたキーワードをコンテキストとしてブックマークを構造化することで,ブックマークの再検索を効率化するブックマークシステムの設計と評価について報告する。With the increase of information gained by web search, it becomes difficult to re-find the web pages found before. Though bookmarks are used frequently to help re-find web pages, re-finding bookmarks itself becomes difficult as the number of bookmarks increases. The paper reports on the design and evaluation of a bookmark system which makes the re-finding of bookmarks more efficient by organizing bookmarks by keywords as search context in web search.
著者
藤井 叙人 橋田 光代 片寄 晴弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告エンタテインメントコンピューティング(EC) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.26, pp.9-16, 2008-03-07

市販テレビゲームにおいては,CPU の人間らしさというリアリティに,プレイヤの意識が高まりつつある.従来研究では,将棋や仮想空間における CPU の人間らしさの検討はなされているものの,市販テレビゲームのような戦略型ゲームにおいて,人間らしい行動や戦略を AI 技術を用いて実現した例はほとんどない.本稿では,CPU の「人間らしさ」の実現を目標とし,戦略型カードゲームの戦略を自動的に獲得する機構を提案した.戦略学習における困難性として,部分観測に起因した巨大な状態空間が挙げられるが,サンプリング,相手の行動予測,ゲームの特徴を考慮した次元圧縮により克服した.また,戦略学習機構によって得た戦略を,ルールベースの戦略と対戦させ,有効性を評価した.The computer (CPU) like a human has lately attracted considerable attention in the video game. The past studies report strategy-acquisition scheme for the board game such as shogi. However, there are few studies about these scheme applied in the video game. We aim at the acquisition of strategy like a human, we present an automatic strategy-acquisition scheme for strategic card game. Because of this card game includes many unobservable variables in a large state space, we suggest a sampling technique, action predictor, and value function. To evaluate our method, we carried out computer simulations where our agent played against a rule-based agent.
著者
多田 好克
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.16, pp.25-32, 2005-02-22
参考文献数
6

本文章では、裸のIBM-PC上で稼働するUtiLisp処理系について議論する。汎用計算機上にLisp Machineのような専用処理系を動かすことにより、a) OSのオーバヘッドを無くし高速の処理系を作成する、b) Lispを中心とした汎用のOSを構築する、ことが最終目標である。今回の発表では、取り敢えずヨタヨタと動き出したLisp処理系の構築法、並びに、裸の計算機上で動かすために要した作業を総括し、報告する。In this paper, we discuss a UtiLisp interpreter which runs on a bare IBM-PC machine. The final goal of the research is going to make 1) a fast interpreter without the overheads of operating system, and 2) a Lisp-based operating system such as the Symbolics Lisp Machine. This time, we present the current status of our implementation, especially the porting methodology from a Unix to a bare machine environment.
著者
鳥谷部 桜 原口 雄一郎 村田 大 稲蔭 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. GN, [グループウェアとネットワークサービス] (ISSN:09196072)
巻号頁・発行日
vol.2001, no.98, pp.43-47, 2001-10-18
参考文献数
5
被引用文献数
1

私達は友達など自分と近い関係を持つ人の近況を知ることで、行動や考え方に刺激を受けることが多い。しかし、日常生活では、友達とそれを共有する機会や、友達の友達と出会う機会はあまりない。そこで、ネットワーク上で知人と近況を共有するシステム「友達の友達は友達」(以下TTT)を実装した、本システムは、ユーザの近況を個々にデータとして蓄積し、知人に限定して公開し、さらに、ユーザに対しフィードバックを促しコミュニケーションを活性化させることで、継続的に多数の知人との近況の共有を支援する。また、ユーザが友達との会話に別の友達を呼ぶ仕組みを導入することで、初対面のユーザのコミュニケーションを共通の知人が仲介する、信頼感のある未知の人との出会いを支援する。
著者
若月 祐介 築地 立家
出版者
一般社団法人情報処理学会
雑誌
研究報告アルゴリズム(AL) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.9, pp.43-50, 2009-01-23

DNA コンピュータを用いれば,ナノスケールの計算素子として DNA 分子を利用することにより,超並列計算を実現することができる.実際, Adleman らは, DNA コンピュータが DES 暗号を効率的に解読できることを示した.そこで,本論文では, AES 暗号を効率的に解読するような,複数の DNA アルゴリズムを示す.ところで, AES は DES よりもはるかに解読が難しい暗号として知られている.実際, Adleman らの DES 解読アルゴリズムを単純に拡張した AES 解読アルゴリズムでは, DNA メモリコンプレックスの長さが 7 倍以上になってしまう.我々のアルゴリズムを用いれば, DNA を切り離すための制限酵素を使用することにより,高々 1.3 倍の長さのメモリコンプレックスで AES コードが解読できることが示される.DNA computer utilizes DNA molecules as nanoscale computational elements to provide efficient computations for currently intractable problems. Actually, Boneh, Dunworth, Lipton showed that a DNA computer can efficiently decrypt DES encryption codes. In this paper, we show a couple of algorithms decrypting given AES codes by a series of parallel DNA operations. Since AES is known as much harder than DES to be decrypted, e.g. AES uses 128 bits, while DES uses 64 bits, of the hidden key, a simple extension of their algorithm requires DNA memory complexes of 7 times longer than the previous ones. One of our results shows that, by inserting restriction enzyme DNA cutting operations, much shorter memory complex is enough to decrypt given AES codes.
著者
東 藍 浅原 正幸 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.53, pp.67-74, 2006-05-19
被引用文献数
5

本稿では,日本語形態素解析において問題となる未知語処理に対して条件付確率場(ConditionalRandomFields CRF)を適用する手法を提案する.提案手法では,形態素解析と同時に入力文中の部分文字列に対して未知語候補を追加することにより,形態素解析と未知語処理を同時に行う.また,従来最大エントロピーマルコフモデル(MaximumEntropyMarkovModelMEMM)などを適用した手法で指摘されてい0たlabelbiasあるいはlengthbiasの影響は,単に既知語の解析において問題になるだけではなく,未知語処理においても重要な問題となることを示し,CRFを適用することによりこれらの問題が解決されることを示す.そして大規模な正解タグ付コーパスを用いて実験し,本稿の提案手法の有効性を検証したThis paper proposes a new method forJapanese morphological analysis with unknown word (i,e out-of vocabularyword)processing The Japanese morphological analysis is based on conditional random fields(CRF)on a word trells.In the word trellis,the analyzer expands not only knownwords(i・ein-vocabularyword)but also substrings in a sentence as word candidates Kudo(Kudo 2004)discussed an issue that maximum entropy Markov model(MEMM)has label as well as length bias problems in known word processing and CRFs have potential to cope with them.We discuss the same issue in unknown word processing.Evaluation experiments on large-scale corpora show the effectiveness and impact on the proposed method.