著者
坂野 鋭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.66, pp.41-44, 2003-07-03
被引用文献数
1

本報告は世界各国で推進されている顔画像認証技術標準に関する報告である.9.11以降,顔画像認識技術を含むバイオメトリック個人認証技術は,カウンターテロリズムのためのセキュリティ技術としてにわかに注目を集めているが,共通するプラットフォームがないなどの問題で実用化が遅れている.本報告は,こうした標準化活動のうち精度評価方法にフォーカスし,ISO,INSITSなどの動きを報告し,日本からの提案への助言をお願いする.The article describes the progress of the standardization activities for evaluation methodology about facial image recognition system in this globe. From the impact of 9.11 biometric technology as facial image recognition technology is focused to security technology for counter terrorism. However, the evaluation method of face image recognition system in each system supplier was inconsistent and the standard method for accuracy evaluation was never defined. So consumer needs the standardization of the evaluation method. In this article, we report the standardization activity in ISO and we expect useful discussion for the standardization for proposition for international standard.
著者
坂東 宏和 佐藤仁美輩 大即洋子 馬場 康宏 澤田 伸一 小野 和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータと教育(CE) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.74, pp.41-48, 2006-07-08
被引用文献数
3 1

本稿では,パーソナルコンピュータを活用することにより,幼稚園の先生方の負担軽減,および 遊びの拡張を図ることを目的とした 幼稚園における活動的な遊びを支援するツールの設計と試作について述べる.具体的に,本稿では 従来から保育に取り入れられている遊びの一つである,様々な形で提供されるヒントを基に宝物を探し出す「宝探しゲーム」を支援するツールについて述べる.試作した支援ツールを幼稚園で試用した結果 園児の意欲的な行動や発言が多く見られるとともに,先生方からも好意的な意見を得ることができ,本ツールの有用性が示唆されたと考える.同時に,園児へのヒントの与え方,宝物を隠す場所など,先生方が事前に行う設定に関して,今後検討すべき課題が明らかになった.This paper describes about the design and trial production of a tool for active playtime in preschools, which by applying a personal computer will achieve pressure reduction of preschool teachers and will aim to expand the sphere of playing activity. Tb be specific, this paper describes about the educational supporting tools of the game "treasure hunt", which provides various hints about finding the treasure, often played by the traditional nursery system. The tool produced as an experiment was tried out at a preschool. As a result, there were many motivated, initiative actions and statements from the preschoolers observed. Also we received favorable remarks from the teachers as well. This suggests the usefulness of this tool. At the same time, it was found out problems to be solved when setting beforehand by teachers, for example how to give preschoolers hints and where to hide the treasure.
著者
鈴木 知道
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.20, pp.41-47, 2007-03-05

スポーツやゲームなど様々な競技において,プレーヤーの順位づけを行うにあたって様々なトーナメントが実施されている.競技は,マラソンやボーリングのように競技の結果に対してタイムや採点など個々のプレーヤー(あるいはチーム)ごと数値化が可能な競争や採点競技と,サッカーやレスリングのように1対1の直接対決の結果が得られる対人競技に大別される.本研究は後者を対象とする.トーナメントシステムはトーナメントの規模や期間に依存するが,主要な目的はプレーヤーの競技の結果(成績,出来)に応じて適切な11項位付けを行うことである.多くのトーナメントシステムが提案されているが,それらを的確に評価するのは難しいのが現状である.本研究では,統計的な視点からトーナメントシステムをとらえ,評価するにあたって考慮すべき観点に関する考察を行った.Various tournament systems are run in order to rank the players who participated in a competition of sports or games. There are competitions that all teams or players compete for time or score such as marathon or ski jumping. There are also competitions that teams or players face each other in a match such as soccer or wrestling. In this paper, the latter is considered. The tournament system to be used depends on the size and the period of the competition. In any case, one major objective the tournament is to appropriately rank the players according to the result of the competition. Today, many tournament systems are proposed, yet we do not have the methodology to evaluate their effectiveness. In this paper, various aspects are discussed from statistical point of view on how to evaluate the tournament systems.
著者
李晃伸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.129, pp.307-312, 2007-12-21
被引用文献数
7 1

大語彙連続音声認識エンジン Julius は 2007年 12月にバージョン ver. 4 がリリースされた.7年ぶりのメジャーバージョン更新となる ver. 4 では,内部構造のモジュール化およびソースの全面的な再構成が行われ,可搬性と柔軟性が大幅に向上された.その結果,エンジン本体がライブラリ化された他のアプリケーションに組み込めるようになったほか,コールバック・プラグイン等の外部との連携の仕組みが整備され,機能の拡張や構成の変更が容易に行えるようになった.言語モデルも単語 N-gram および文法を単一バイナリで同等に扱えるようになり Julian は Julius に統一された.さらに,複数の言語モデルと音響モデルを任意に組み合わせて,1エンジンで並列認識を行うマルチデコーディングも可能となった.また,基本性能についても拡張と強化が行われた.言語モデルとして孤立単語認識が新たに追加されたほか,4-gram 以上の任意長 N-gram への対応、ユーザ関数による外部言語制約の組込み、GMM-based VAD およびデコーダベース VAD、confusion network の生成など大幅な機能強化が行われた。性能は従来バージョンと同等を維持しており、かつメモリ量の削減も行われている。The new version 4.0 of large vocabulary continuous speech recognition engine "Julius" has been released at December 2007, as a major version up from version 3.0. An anatomical analysis and data stcuture re-organization has been accomplished for the whole codes to improve its modularity and flexibility. Its improved structure now enables Julius to be compiled as a external library to be incorpolated into various user applications. A simple callback API and plugin facilities are newly built to be controlled directly and lively from outer applications, which enables easy but tight integration with other applications. Also, grammar-based recognizer Julian has been incorpolated into Julius and the N-gram and grammar can be treated at the same executable. Furthermodre, It supports fully multi-decoding using multiple LMs, AMs and their arbitral combinations. It now supports long N-gram (N unlimited), user-defined LM function, GMM-based and a newly proposed decoder-based VAD, confusion network generation, and many other new functions. The memory requirement has also been improved, while keeping the same accuracy.
著者
権藤広海 瀬川 典久 中本 泰然 村山 優子 宮崎 正俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告グループウェアとネットワークサービス(GN) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.6, pp.31-35, 2000-01-20
被引用文献数
3

本研究では,新しい非同期コミュニケーションシステムとして戸口伝言板を提案し,実装してきた.本稿では,プロトタイプシステムUni Boardの運用について報告するとともに,今後の課題について述べる.We have proposed a message boeard system for on-door communication as a novel tool for asynchronous communication, and implemeted its prototype, the Uni Board system. We have been running the system for several months. This paper reports the results from our operation of the Uni Board as well as some issues to be dealt with in future.
著者
丸岡 弘和 杉浦 敏文 西垣 正勝
出版者
情報処理学会
雑誌
情報処理学会研究報告コンピュータセキュリティ(CSEC) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.26, pp.203-208, 2006-03-17

近年,内部不正者による情報漏洩が社会問題となっている.我々は,ユーザが不正を行う際に不審な挙動が現れることに着目し,内部不正者のリアルタイム検知を実現する方式を検討している.これまでに「横目で周囲を確認する(チラ見)」という行動の検出による内部犯検知の可能性を探ったところ,被験者は実験を重ねる内に徐々に自分の体の制御の仕方を覚え,チラ見を発生させずに不正を行うことができるようになることが判明した.そこで本稿では,不正を行う際のユーザの心理状態の変化をダイレクトに検出できる心拍数の変化を内部犯検知に利用する手法を導入する.心拍数を自分で制御することは基本的には難しいため,訓練を重ねた内部不正者であっても不正の検知を回避することはより困難になると考えられる.本手法について,新たに基礎実験を行うことによりその有効性を確かめる.We proposed a real-time detection of internal fraud by sensing insider's suspicious behavior in our previous work, but in which we found that experimented insiders could be able to control their behavior and avoid detection of their fraud. Therefore, in this paper, we introduce to detect heartbeat interval of insiders. It is well known that when human being gets nervous, his/her heartbeat interval will immediately change. Since it is impossible for human being to control heartbeat, it is expected that using heartbeat interval as a suspicious behavior makes it more difficult for even experienced insiders to avoid detection. By conducting some experiments, we evaluate its effectiveness.
著者
林 邦彦 斎藤 英雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.173-180, 2006-05-18
被引用文献数
3

近年、スポーツ映像などで自由な視点からの映像の要求が高まっている。従来手法[5]では、サッカースタジアムのような大規模な空間で、カメラの中間視点画像しか合成できなかった。この従来手法は、空間の3次元モデルを復元をせずに、入力画像間の対応点を算出することで自由視点画像を生成している。そこで、本稿では、サッカーシーンを幾何的な特徴に応じて、動的領域と静的領域に分割し、各領域を平面近似して、それぞれ3次元モデルを簡易的に復元することによって、中間視点画像に限らない自由視点画像を生成する手法を提案する。本手法では、対象の3次元モデルを復元するために、まず、カメラキャリブレーションを行う。その際、サッカーグラウンドにマーカーを置く事はできないので、グラウンド面の平面パターンを利用してカメラキャリブレーションを行う。分割された各領域のうち、選手やボールである動的領域がグラウンドに垂直に立つ1枚の板(ビルボード)で表されるものとして3次元モデルを復元する。一方、静的領域に対しては、複数の平面領域に分割し、各平面の3次元モデルをあらかじめ復元する。本手法をサッカーシーンに適用し、従来生成できなかった中間視点以外の自由視点画像を生成することで有用性を示す。We propose a new method for synthesizing free-viewpoint images from multiple view videos in soccer stadium. The previous method[5] can synthesize virtual viewpoint images at intermediate viewpoint between real cameras. The previous method estimates only pixel-wise correspondences between input images for synthesizing virtual viewpoint images without a 3D reconstruction. In this paper, we propose a new method that can synthesize virtual viewpoint images at free-viewpoints which are not limited at intermediate viewpoint by reconstructing simple 3D models after dividing a soccer scene into static regions and dynamic regions. To reconstruct the object soccer scene, we perform camera calibration without marker objects because we can't put such objects on the soccer ground. For reconstructing of dynamic regions, we employ a billboard representation of dynamic regions. The billboard representation can realize a simple 3D reconstruction and transform textures into the appropriate appearance of the aspect of dynamic regions at virtual viewpoint. For reconstructing of static regions, we divide two planes that are a ground region and a background region. We reconstruct 3D models in each region beforehand. By applying our method to a soccer scene, we can synthesize free-viewpoint images which are not limited at intermediate viewpoint by employing only pixel values of real images.
著者
服部 雄一 中澤 篤志 町田 貴史 竹村 治雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.145-150, 2006-05-18
被引用文献数
1

時系列3次元データは、応用範囲が広く今後の発展が期待される研究分野である。この時系列3次元データはデータサイズが非常に大きく、これらを伝送および保存する際は圧縮処理が必要不可欠となる。本稿では、データの時間的冗長性を削減することを目的として、3次元に拡張したHuモーメント不変量を用いた時系列ブロックマッチングによる圧縮法を提案する。この手法では、従来手法では考慮されていなかった物体の回転運動を検出することで、圧縮率の向上を図っている。Time sequence 3D data has a broad range of application and is a research area expected for the future development. The time sequence 3D data has such a huge data size that data compression is essential when it is transmitted and saved. This paper proposes a compression method by using the time sequence block-matching with extended 3D Hu invariant moment for the purpose of reduction of the data time redundancy. In this method, the data compression ratio is improved by detecting the rotational motion of an object that is not considered in the existing method.
著者
岩山 真 藤井 敦 高野 明彦 神門 典子
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.74, pp.49-56, 2001-07-24
参考文献数
1
被引用文献数
12 6

NTCIR-3において特許コーパスを用いた検索タスクを提案する。提案するタスクでは、「公開特許公報」「JAPIO妙録」「PAJ(Patent Abstracts of Japan)」などの特許コーパスを用い、「基本検索タスク」「自由タスク」の二種類のタスクを実施する。基本検索タスクは、ある製品に関する一般的な記述からそれを支える特許を検索するタスクであり、具体的には新聞記事から関連特許を検索する。自由タスクは、特許コーパスを対象に、参加者が自由に課題を設定し評価する実験的なタスクである。In NTCIR-3 workshop, we propose a new task of "Patent Retrieval Challenge" using patent corpora. The main task is "cross DB search" whose purpose is to find a set of patent documents relevant to a news paper article described on some products. We will also try an experimental task, in which participants themselves can propose, execute and evaluate their own tasks. This free-styled task intends to explore future directions of patent information processing.
著者
那須川 哲哉 金山 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.73, pp.109-116, 2004-07-16
参考文献数
15
被引用文献数
12 5

組織・製品などに関して好不評を示す表現,及びそれが好評を示すか不評を示すかの極性を,文書データから教師なし学習で獲得する手法を示す.ある対象に関して評価を述べる内容を記述する際には,好評もしくは不評の意見を列挙することが多く,好不評の極性を反転させる際には「けれども」「しかし」といった接続表現で明示することが多い.本手法では,この『評価表現の文脈一貫性』を利用し,「満足する」「不満だ」などの種表現の周辺文脈から評価表現の候補とその極性を抽出し,各候補の文書データ全体における分布から評価表現としての妥当性を判定する.得られた評価表現を種表現に追加する操作を再帰的に実行することで,好不評の極性付きの語彙を,少数の種表現から自動構築することが可能になる.デジタルカメラと映画に関する掲示板のデータで実験したところ,各々の分野に特徴的な評価表現を高い精度で抽出することができた.This paper presents an unsupervised learning method to acquire sentiment expressions that indicate either favorable or unfavorable opinion toward a specific subject. Our approach is based on a characteristic of sentiments that multiple sentiment expressions often appear near each other in texts with the same polarity of favorability, unless the change is explicitly indicated by a clue term such as an adversative conjunction. By taking advantage of this characteristic, our unsupervised method extracts sentiment expressions and their polarities from a corpus starting from a very small set of seed expressions and analyzing their neighboring expressions in the corpus. In our experiment on discussion board messages about digital cameras and movies, we could acquire a good set of sentiment expressions relevant to each domain.
著者
中道 上 木浦 幹雄 山田 俊哉
出版者
一般社団法人情報処理学会
雑誌
研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2012, no.10, pp.1-4, 2012-09-06

本研究では,医療情報システム利用時の薬剤師の薬剤処方確認行動を分析し,ヒューマンエラーの防止策,電子カルテチェックの効率化ついて検討を進める.本論文では薬剤師の薬剤処方確認行動における視線の動きやマウス操作に着目し,それらのインタラクションデータを記録する実験プロセスについて検討した.記録されたインタラクションデータに基づき,薬剤師間の個人差や頻出するインタラクションパターンについて分析をすすめ,標準的な処方監査における確認パターンについても検討していく予定である.We analyze pharmacists' behavior of prescription checking with a medical information system. And we consider ways and means to prevention of human errors. In this paper, we focus interaction data such as eye movement and mouse operation, and we propose experimental processes for recording interaction data. We will analyze difference with each pharmacist and frequently-appearing behavioral pattern using interaction data.
著者
鎌田 真人 松坂 昇子 松原 仁
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.17, pp.35-42, 2005-03-01
被引用文献数
1

棋力認定問題によるコンピュータ囲碁の評価(その1)においては,上級レベル(6級~1級),有段レベル(初段~六段)の棋力認定問題を用いて,代表的な市販対局囲碁ソフトの評価を行った。今回,別の2つの囲碁専門誌の棋力認定問題で,同じ囲碁ソフトの評価をした。すなわち,級位者向けの専門誌における初級・中級レベル(15級~6級)と上級レベル(5級~初段),発行所の違う専門誌の上級~有段レベル(4級~七段)である。3つの囲碁専門誌の棋力認定問題を比較すると共に,6つの対局囲碁ソフトの評価を行った。最高で3級の評価が得られた。In our previous paper titled "Evaluation of computer Go by skill evaluation test (no.1)", we evaluated typical commercial Go programs by a skill evaluation test of middle class (6kyu to 1kyu) and upper class (1dan to 6dan). In this paper we have evaluated the same programs by two different skill evaluation tests in some Go magazines: one test is for novice and middle class players (15kyu to 6kyu, 5kyu to 1dan ) and the other is for upper class players (from 4kyu to 7dan). We have compared the results of three different tests and have evaluated six commercial Go programs. The strongest program's skill is 3kyu from our evaluation.
著者
桜井 都衣 山根 順子 小林 健太 山根木 康嗣 谷口 丈晃 加藤 有己 藤渕 航
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.5, pp.1-2, 2014-09-12

2006 年に iPS 細胞が発見されて以降,実際に幹細胞由来の人工組織が医療の現場で活用されるという時代の到来が現実味を帯びて来た.それと同時にこれまで以上に細胞というものを熟知し,個々の細胞の性質の判断基準を明らかにする必要性も著しく高まっている.当研究室では,以前公開された SHOGoiN というヒト細胞解析データのためのデータベースの延長として,細胞というシステムを科学的な解析結果と知識に基づき明確に定義するためのデータベース (Stem Cell Informatics Database) の構築を行っている.現在の Stem Cell Informatics Database は,近年盛んに行われ始めているシングルセル技術を用いたトランスクリプトーム解析やメチローム解析データ及び実験条件などのメタデータ,ヒト組織画像とそこから抽出された細胞形態解析データ,そして解剖学的な位置情報に対応させたヒト細胞の分類表などを格納している.また今後は,細胞という複雑な概念のモデル化,語彙・知識の統合管理を可能にするためのオントロジーの構築や細胞情報解析のためのツールなども行い,搭載する予定である.Researchers have actively investigated potential applications of the induced pluripotent stem cell (iPS cell) for disease modeling, drug screening, and regenerative medicine since its discovery in 2006, and now it is about to start one of the projects for clinical trials. In parallel with the medical practice, there has been arising a need of more precise knowledge of the cell of its disposition, while facing a lack of the information system that enables us to store such complex biomedical knowledge regarding cells in well-organized way. Here we introduce our cell knowledge repository called "Stem Cell Informatics Database" that is an extended work of the previous SHOGoiN database. It has been designed to integrate information comprehensively for defining cells with diverse knowledge and scientific data from biomedical research. In the Stem Cell Informatics Database, there are several indispensable contents, such as gene expression profiles and images of cells, curated assay metadata, and the cell taxonomy associated with anatomical location information. Stem Cell Informatics Database is now under development, and we are currently working on i) creating our own ontology to formally describe/model knowledge about the cells, and ii) developing analysis tools for gene expression data produced in single cell experiments. Depositing all of those in one database, this will provide a framework of integrative system for cell knowledge dictionary.
著者
近藤 宏行 角谷 和俊 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. DBS,データベースシステム研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.119, pp.419-424, 1999-07-21
被引用文献数
11

本稿では,データベースへの問い合わせの結果表示のための新たな提示方式として,番組メタファー表示を提案する.番組メタファーで表示することで,単なる文字の羅列であるよりも,よりユーザの求めているものを的確にかつ魅力的に表現する提示を実現する.番組メタファーは,既存のテレビ番組にそって作成した擬似テレビ番組スタイルである.検索結果をあたかもテレビで放送してるように見せることで,ユーザにとってより効果的で,親しみやすい表現を行うことができる.適当な番組メタファーを動的に選択することにより,単に検索結果を提示するだけでなく,検索された結果の特徴に応じて提示スタイルを変更することが可能になる.提示スタイルの決定には検索結果のデータ集合の分布状態,結果の内容,注目する属性とメタファーの関係を考慮する.更に,提案した方式をもとに,番組記述言語TVMLを用いて実現したプロトタイプシステムWaffleについて述べる.プロトタイプシステムは,入力インタフェース部,メタファー決定部,スクリプト作成部,結果提示部から構成される.
著者
森勢将雅 中野 皓太 西浦 敬信
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.5, pp.1-8, 2010-07-21
被引用文献数
2

我々は,実時間で歌唱力を補正することにより「誰が」「どんな曲でも」「簡単に」歌える新たなエンタテインメントについて研究を進めている.これまで使われてきたカラオケは,歌唱力の高い使用者は楽しめるが,歌唱力の低い使用者が楽しめるものでは無い.本稿では,事前に収録されたプロ歌手の歌声から歌唱力に相当するデータを抽出し,使用者の歌唱にリアルタイムで転写することにより,実時間歌唱力補正を実現するシステムについて述べる.本システムにより,歌唱力の低い使用者は歌唱力補正機能により楽しむことができ,歌唱力の高い使用者にとっても,他者に自らの歌唱力を提供するという新たな楽しみを与える利点がある.ここでは,実時間歌唱力補正を実現するための基盤技術,および計算速度を指標とした客観評価により有効性について論じる.A new Karaoke entertainment to happily sing any music is proposed based on the real-time singing style correction. Although the conventional Karaoke application has entertained the skilled user, the unskilled user cannot enjoy it. The proposed system can solve the problem by the real-time singing style correction based on a professional singer's singing. In this paper, the method to extract the parameter about singing style is proposed to correct the singing style of the user. The entertainment for both the skilled users and unskilled users is also discussed.
著者
堀内 靖雄 三井 卓 財津 茜 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.74, pp.103-108, 1998-08-07
被引用文献数
4

本論文では人間二人の演奏およびテンポ一定で演奏を行なう計算機と人間による演奏を収録し、人間の演奏制御がどのように行なわれているのかということを調査する。相手に合わせるように教示された演奏者(伴奏者)は、ずれに敏感に反応し、テンポを修正して合わせようとすることが示された。また、テンポを早くしたいという欲求があるとき、その分をバイアスしてテンポ変化を行なうということが示唆された。相手をリードするように教示された独奏者は、伴奏者ほど敏感にテンポ変化をせず、テンポをキープしようとする意図がみられた。さらにずれが小さい場合には、ずれとはあまり相関のないテンポ変化を行なうことが観察された。We recorded several performances where two performers play together or one performer plays with a computer which can play with a fixed tempo. We analyzed the timing information of these performances. The result shows a performer who is instructed to be an accompanist changes her tempo according to the time lag between her and another performer (soloist). A performer who is instructed to be a soloist does not change her tempo according to the lag so much in order to keep their tempo. When the lag is very short, they change their tempo regardless of their time lag.
著者
田村 晃裕 高村 大也 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.124, pp.17-24, 2006-11-22
被引用文献数
1

係り受け解析を符号化・復号化問題として解く手法を提案する.従来は,2文節間の係りやすさ,つまり係り受け木でいう親子関係になるかを基に係り受けを解析している.この従来の考えに従うと,親子関係の情報を表した符号を用いた符号化・復号化問題を解くことになる.係り受け解析を符号化・復号化問題と捉えると,符号化・復号化問題における,誤りがある程度生じても訂正できるように,符号に冗長な情報を加え,使用する符号間の距離を大きくする手法を係り受け解析に援用できる.そこで,本研究では,親子関係の情報の他に,祖先子孫関係になるかという情報を冗長な情報として符号に加えることで精度の向上をはかった.実際に本手法で係り受け解析をし,高い精度が得られたことを報告する.We propose a novel method for Japanese dependency analysis. In deterministic approaches to this task, dependency trees are constructed by actions of attaching a bunsetsu chunk to one of the nodes in the trees. Therefore the task is reduced to deciding the node for the new bunsetsu chunk to be attached.We propose to encode each decision with a sequence of binary values, that is, a code. This representation of decisions enables the model to incorporate ancestor-descendant relations between nodes in addition to parent-child relations. We also propose to concatenate the code of parent-child relation and the code of ancestor-descendant relation, so that the added redundancy in codes helps errors be corrected. Experimental results show that the proposed method achieves higher accuracy in the task of Japanese dependency analysis.
著者
注連隆夫 士屋雅稔 松吉俊 字津呂武仁 佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.7, pp.63-70, 2007-01-26

本稿では,SupportVectorMadline(SVM)を用いたチャンカーYamOhaを利用して,日本語機能表現検出器を学習し,その性能評価を行った機能表現を構成している形態素の数の情報,機能表現中における形態素の位置情報を素性として参照することにより,F値で約94という高精度の検出器を実現できることを示した.また,京都テキストコーパスに対して,機能表現の情報を人手で付与した後,SVMに基づく統計的係り受け解析器OaboOhaの学習を行い,その性能を評価した.機能表現を考慮して係り受け関係の学習をすることによって,機能表現を含む文節の係り受け解析の性能が改善することを示す.This paper proposes to learn a detector of Japanese functional expressions using the chunker YamCha based on Support Vector Machines (SVMs), and presents the result of evaluating the performance of the detector. Through experimental evaluation, we achieve the F-measure as 94. We then manually annotate parsed sentences of Kyoto Text Corpus with functional expressions, which are used for training dependency an alyzer CaboCha based on SVM. The dependency analyzer CaboCha of this paper is modified so that it can cope with annotation of functional expressions in the training corpus. We experimentally show that the modified version of the dependency analyzer improves the performance of the dependency analysis of functional expressions.
著者
岸本 貴之 高橋 治久 堀田 一弘
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.2, pp.27-32, 2009-01-15

本稿では,日本語形態素解析の精度を,条件付確率場 (CRF) による係り受け解析を用いて,改善する方法を提案する.従来の確率モデルによる形態素解析は,一般的に,1 個または 2 個前までの単語の品詞情報の相関関係によって,最適な候補を絞り込むというやり方を行っていた.しかし,それだけでは解析できない事例が存在しており,もっと広い範囲での単語の相関や,構文関係などを考慮に入れたモデルを考える必要がある.本稿では,形態素解析結果の候補に対し,係り受け解析を行い,その尤度を最大にする形態素解析結果により係り受け解析を選択する方法が,精度改善に有効であることを,従来法との比較実験により示す.This paper presents a method of improving Japanese morphological analysis via Conditional Random Fields (CRFs) using the dependency analysis. Many existing probabilistic methods select a correct tokens by the correlation analysis between adjoining words and their part-of-speech. However, some instances cannot be correctly analyzed only with the correlation between adjoining words. In order to improve the accuracy, it would be needed to take into account correlation of words in wider range as well as syntactical features. We show that maximizing the likelihood of the dependency analysis for candidates of correct tokens improves the accuracy by computer experiments.
著者
山本 悠二 増山 繁
出版者
情報処理学会
雑誌
研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-8, 2010-09-09

日本語係り受け解析の手法は大きく分けて,1. 決定的な解析方法と,2. 係り先候補の確信度に基づく解析方法がある.前者は係り先候補間の比較が行えないことから,特に長距離依存の係り先を同定するときに誤りを生じやすいという傾向がある.また,後者は係り先候補集合のすべての要素を探索するため,計算時間の点で問題がある.提案手法では,係り先候補の確信度に基づく解析方法での解析時間を減らすために,決定的な解析が容易な文節について先に係り先を定めた後に,相対的な比較による係り先の同定する方法を示す.京都テキストコーパス 4.0 を用いて提案手法を評価したところ,係り先候補の確信度に基づく解析方法の 1 つである相対モデルと比較してほぼ同等の解析性能を持ち,かつ,実行時間が 2.4 倍程度高速であることが確認された.Japanese dependency parsers fall into two main methods, 1) deterministic parsing and 2) parsing based on dependency certainties among modifee candidates. The former methods tend to make errors especially for identifying long-distance dependencies because these methods do not opt the candidate by comparing candidates. On the other hand, the latter methods have difficulty with their parsing speed due to searching the most preferable candidate from all modifee candidates. The proposed method identifies easily-analyzable dependencies by deterministic parsing and identifies the rest dependencies by parsing based on dependency certainties among modifee candidates later. Experiments using the Kyoto Text Corpus show that the proposed method runs 2.4 times faster than the relative-model parser while the dependency accuracy of the proposed method is nearly comparable with the relative-model's.