著者
安岡 孝一 ウィッテルン クリスティアン 守岡 知彦 池田 巧 山崎 直樹 二階堂 善弘 鈴木 慎吾 師 茂樹
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.2, pp.323-331, 2018-02-15

古典中国語(漢文)の解析手法として,MeCabを用いた形態素解析手法を提案する.本手法では,漢文の動賓構造を表現すべく,4階層の「品詞」からなる新たな品詞体系を構築し,それに基づくMeCab漢文コーパスを設計した.合わせて,MeCab漢文コーパスを入力するための専用ツールとして,XEmacs CHISEをベースとしたコーパス入力ツールを開発した.また,MeCab漢文コーパスを効果的に管理し,さらには品詞体系のリファクタリングを行うべく,MeCab漢文コーパスのLinked Data化を行い,WWW上で公開した.さらに,MeCabを用いた漢文形態素解析の応用として,漢文における固有表現の自動抽出に挑戦した.結果として,地名の自動抽出は高精度に行うことができたが,官職・人名の自動抽出はそれぞれに課題が残った.
著者
安岡 孝一 クリスティアン ウィッテルン 守岡 知彦 池田 巧 山崎 直樹 二階堂 善弘 鈴木 慎吾 師 茂樹
出版者
情報処理学会
雑誌
情報処理学会研究報告 : 人文科学とコンピュータ(CH) = IPSJ SIG Technical Report (ISSN:21888957)
巻号頁・発行日
vol.2018, no.20, pp.1-8, 2018-01-28

第116回人文科学とコンピュータ研究発表会古典中国語(漢文) の解析手法として,Universal Dependencies の古典中国語への適用に挑戦した.言語横断的な依存構造記述であるUniversal Dependencies は,ニューラルネットを用いた言語解析ツール(特にSyntaxNet) 等に採用されていることから,係り受け解析への応用が容易だと考えられる.しかしながら,古典中国語の文法構造は,Universal Dependencies とは必ずしも相性が良くなく,いくつかの点で齟齬が生じている.この点を含め,現時点での古典中国語Universal Dependencies の検討状況を,他言語UniversalDependencies との比較も含め,大まかに報告する.
著者
安岡 孝一 ウィッテルン クリスティアン 守岡 知彦 池田 巧 山崎 直樹 二階堂 善弘 鈴木 慎吾 師 茂樹
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.2, pp.323-331, 2018-02-15

古典中国語(漢文)の解析手法として,MeCabを用いた形態素解析手法を提案する.本手法では,漢文の動賓構造を表現すべく,4階層の「品詞」からなる新たな品詞体系を構築し,それに基づくMeCab漢文コーパスを設計した.合わせて,MeCab漢文コーパスを入力するための専用ツールとして,XEmacs CHISEをベースとしたコーパス入力ツールを開発した.また,MeCab漢文コーパスを効果的に管理し,さらには品詞体系のリファクタリングを行うべく,MeCab漢文コーパスのLinked Data化を行い,WWW上で公開した.さらに,MeCabを用いた漢文形態素解析の応用として,漢文における固有表現の自動抽出に挑戦した.結果として,地名の自動抽出は高精度に行うことができたが,官職・人名の自動抽出はそれぞれに課題が残った.A method to analyze classical Chinese texts is proposed. In the method, we use our original morphological analyzer based on MeCab. We propose a new four-level word-class system to represent the predicate-object structure of classical Chinese. In order to make a corpus for classical Chinese on MeCab, we have constructed a MeCab-corpus editor based on XEmacs CHISE. In order to control the corpus effectively, and to refactor our four-level word-class system, we have converted it into Linked Data on WWW. As an applied study for our morpholgical analysis of classical Chinese texts, we have tried to extract named entities: names of places, job titles, and names of people. As a result we are able to extract names of places from classical Chinese texts almost perfectly. But we have found some difficulties to extract job titles or names of people.
著者
安岡 孝一 ウィッテルン クリスティアン 守岡 知彦 池田 巧 山崎 直樹 二階堂 善弘 鈴木 慎吾 師 茂樹 藤田 一乘
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.63, no.2, pp.355-363, 2022-02-15

Universal Dependenciesに基づいて,『孟子』『論語』『禮記』『十八史略』の依存構造(係り受け)コーパスを製作した.さらに,このコーパスを用いて,古典中国語の文切り・形態素解析・係り受け解析を統合的に行う解析システムも開発した.Universal Dependenciesは,書写言語における品詞・形態素属性・依存構造(係り受け情報)を,言語に依存せず記述する手法である.Universal Dependenciesの係り受け記述は,いわゆる動詞中心主義であり,言語横断的であると同時に,古典中国語における動賓終構造の記述にも適している.ただし,Universal Dependenciesにおけるコピュラ文の記述方法は,古典中国語のコピュラ文との間で微妙に齟齬があり,結果として,補語が節であるようなコピュラ文(約1.6%)に関しては,記述は行えるものの記法上の問題が残った.
著者
安岡 孝一 山崎 直樹 二階堂 善弘 師 茂樹 Wittern C. 池田 巧 守岡 知彦 鈴木 慎吾
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
2017-04-01

古典漢文における動詞の作用域、すなわち「動詞の後に置かれる項」のまとまりを、自動抽出する手法の開発をおこなった。具体的には、Universal Dependenciesと呼ばれる文法記述手法を用いて、いわゆる四書(『孟子』『論語』『大學』『中庸』)の係り受けコーパスを制作し、これを用いて、古典漢文の形態素解析と依存文法解析(係り受け解析)をおこなうツールUD-Kanbunを作成した。さらに、このツールを発展させて、動詞の作用域を元に返り点の自動生成をおこない、日本語の活用語尾と助詞を自動で付加することで、自動的に訓読をおこなうツールUD-Kundokuを試作した。
著者
鈴木 慎吾 上原 孝紀 生坂 政臣
出版者
一般社団法人 日本内科学会
雑誌
日本内科学会雑誌 (ISSN:00215384)
巻号頁・発行日
vol.106, no.12, pp.2568-2573, 2017-12-10 (Released:2018-12-10)
参考文献数
10
被引用文献数
1

外来診療における診断を目的とした医療面接は,問診票をみた段階で疾患を想起することから始まる.患者の話を頭のなかで映像化しながら,まずはopen questionで概要と問題点,患者ニーズを把握し,続いてclosed questionで想起した疾患仮説の妥当性を検証する.器質的疾患の見逃しを防ぐには精神疾患の除外が重要であり,代表的な精神疾患の特徴を理解し,積極的に診断する訓練が欠かせない.
著者
池田 証壽 鈴木 慎吾 永崎 研宣 大槻 信 斎木 正直
出版者
北海道大学
雑誌
基盤研究(A)
巻号頁・発行日
2019-04-01

日本の平安時代に僧侶の手によって編纂された漢字字書である高山寺本『篆隷万象名義』、天治本『新撰字鏡』、図書寮本『類聚名義抄』、観智院本『類聚名義抄』の四書は当時の日本人による漢字研究の優れた成果であり、人文学研究の基礎資料となっている。しかし、いずれも古写本であるため、崩し字や異体字が多く、解読に困難が多い。上記の四書のうち観智院本『類聚名義抄』は、収録の和訓が『日本国語大辞典』等に多数収録される重要資料であるが、これまでに全文の活字翻刻はなかった。本研究では観智院本『類聚名義抄』の全文翻刻と注釈を作成して、その内容をインターネット上に公開し、自在に検索できるようにすることを目指す。
著者
生坂 政臣 大平 善之 野田 和敬 鋪野 紀好 塚本 知子 鈴木 慎吾 上原 孝紀 池上 亜希子
出版者
千葉大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2013-04-01

医学生のProblem-based learning (以下PBL) テュートリアルにおいて、患者再現VTRを用いることにより、プライマリ・ケアの実臨床に即した幅広い領域での診断推論が行われるか否かを、従来の紙媒体を用いたPBLテュートリアルとの比較において検討した。その結果、患者再現VTRを利用しても鑑別疾患数は増加しなかったが、心理・社会面を含めた多方面からアプローチする診療が意識づけられ、さらにテューターへの負担も少ないなど、患者再現VTR利用のメリットを明らかにすることができた。作成コストは小さくないが、このような患者再現VTRは今後の卒前の医学教育に大きく資するものと期待される。
著者
安岡 孝一 山崎 直樹 二階堂 善弘 師 茂樹 クリスティアン ウィッテルン 池田 巧 守岡 知彦 鈴木 慎吾
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
2010

古典漢文の白文(句読点や区切りや返り点のない単なる漢字の列)に対し、形態素解析をおこない、品詞情報つきの形態素に分解するシステムを構築した。また、形態素解析に必要な古典漢文コーパスと古典漢文辞書を、汎用の形態素解析エンジンMeCabに即した形式で作成し、WWWで公開した。これらと合わせ、古典漢文コーパスを構築するためのツール群も作成し、同じくWWWで公開した。