著者
小山 照夫 影浦峡 竹内 孔一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.124, pp.55-60, 2006-11-22
参考文献数
7
被引用文献数
8

テキストコーパスからの用語抽出は、自然言語処理技術の重要な応用である。従来テキストコーパスから用語候補を抽出する方法として、主として候補出現に関わる統計的指標を用いて用語性を判定する方法が採用されて来たが、統計的手法では出現頻度の低い候補についての判定が困難であった。今回の発表では、複合語に注目し、用語性を損なう形態素出現パターンを排除する形での用語候補抽出を行うことにより、高い精度で複合語用語抽出が可能となることを示す。Term extraction is one of the most important application of natural language processing technologies. Statistic criteria are widely adopted to evaluate the termhood of the extracted candidates. However, it is difficult to evaluate the termhood of less frequent candidates. In this study we propose a method for Japanese composite term extraction in which unproper morpheme patterns are eliminated. Using the new method, high precision of term extraction can be attained for Japanese composite terms.
著者
金子 昌生 岡和田 健敏 高井 通勝 佐藤 一雄 田中 博 高橋 元一郎 宮崎 洋二郎 深谷 哲昭 小山 照夫 内藤 真明
出版者
浜松医科大学
雑誌
一般研究(A)
巻号頁・発行日
1986

本研究は、デジタル画像の圧縮・蓄積・転送など、画像の持つ情報管理の一面があり、アナログ情報をデジタル化して保管する方法を模索する研究も含まれている。4年間の研究期間中に、この分野の電子工学的発展はめざましく、研究のカバ-すべき範囲が広いため、X線撮影時からデジタル化される Computed Radiography(CR)は紹介するだけに留めた。従来から取り組んできたフィルムのアナログ的な保管方法であるマイクロ化システムを、いかにして効率よくデジタル化して活用するかについて新知見を得た。すなわち、テレビ・カメラのレンズ系をズ-ミングによりマイクロ・フィルム情報を直接拡大して電気信号に変換し、A/Dコンバ-タ-によりデジタル化する方法を開発した。CCD方式とレ-ザ-・スキャン方式のデジタル化も基礎的臨床的に比較検討した。デジタル画像の読影、報告書作製に関する適合性を評価するため、読影結果のレポ-ト作製の方法を比較検討するとともに、音声入力の方法の有用性を実際にテストした。Radiology Information System(RIS)の一環として放射線オ-ダリングやリファリングを実現させる反面で、その見返りとしてのレポ-ティングはやはりデジタル情報としてコミュニケ-ションされるべきであろう。しかし、有用なレポ-ト作製には臨床医から充分な臨床情報を得ることが必須条件である。このためのRISの臨床情報伝達ソフトウェア開発を行っているところである。画像管理・保管と読影業務すべてを包含するTotal Information System(TIS)をより高度化するために、実現可能性の高いMini-PACSやCase Information System(CIS)を実現させ、理想的なImage Management and Communication Systems(IMACS)を完成させるべきバック・グラウンドを研究した。
著者
竹内 孔一 小山 照夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.108, no.283, pp.19-22, 2008-11-03
参考文献数
12
被引用文献数
2

公開されている動詞項構造シソーラスに基づく動詞の意味分類ならびに項に対する意味役割を京都大学コーパスに付与することで動詞の語義曖昧性を解消する基礎データを構築したい.動詞の語義はその動詞が項としてとる名詞との関係を明確化するために意味役割を付与しているが,どういう意味役割集合を作成すればどの程度の意味処理が可能なのかについて,言語処理の観点ならびに言語表現の観点からどのぐらいの種類の意味役割が必要となるのかについての決着は見られていない.本論文では処理とタグ付与実現性の観点からどのように意味役割を付与するかその方針を提案し,知識処理を指向した場合の限界について議論する.
著者
池田 彰吾 松本 章代 小西 達裕 高木 朗 小山 照夫 三宅 芳雄 伊東 幸宏
出版者
情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.34, pp.31-38, 2008-03-28
被引用文献数
2 2

Web ページは適切に構造化されていることが少ないため、計算機がその構造を把握するのは容易ではない.そこで本論文では繰り返し構造を発見することで,より正確に Web ページ中の見出しの階層構造を解析する手法を提案する.そして,評価実験を行い,提案手法の性能を実験的に検証し,その結果を報告する.In this paper, we propose a method to analyze a hierarchy of headlines in Web pages by detecting repeated structure. Our method can analyze the structure of Web pages that is not well structured. We show an experimental evaluation of our method.
著者
竹内 孔一 内山 清子 吉岡 真治 影浦峡 小山 照夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.5, pp.1446-1456, 2002-05-15
被引用文献数
8

本研究では,主辞がサ変名詞である複合名詞の語構成において,構成する単語間の係り関係を支配する語彙的性質に着目し,それに基づく複合名詞解析モデルの作成を試みる.主辞がサ変名詞の複合名詞内の係り関係の解析は,並列関係の場合を除くと,主辞であるサ変名詞の項関係なのか修飾なのかを同定することが解析の第1歩である.項関係とは名詞が動詞の目的語や主語といった関係であることを意味している.本論文では,この関係をとらえる方法として,語彙概念構造を利用した動詞の分類と,その構造を利用した名詞の分類に基づく複合名詞解析手法を提案する.情報処理関連の専門用語と新聞記事中の一般的な複合名詞に対してテスト的な実験を行った.その結果,平均で1231語の複合名詞対して約99.4%の複合名詞を正しく解析する結果を得た.In this paper,we describe a principled approach for analyzing relations between constituent words of compound nouns,specifically those whose heads are deverbal nouns,based on the classification of deverbal nouns by their lexical conceptual structure (LCS) and the classification of nouns in modifier position vis-a-vis LCS of head deverbal nouns.There are two kinds of relations of compounds with head deverbal nouns.The one is that a modifier noun becomes an argument of deverbal head and the other is that a modifier becomes an adjunct.It is an important starting point for analyzing relations to disambiguate the two kinds of relations.Through the qualitative analysis of the data and the experimental evaluation of 1231 compound nouns, we show that the use of LCS as the theoretical basis is very promising for constructing compound analyzer.
著者
内山 清子 竹内 孔一 吉岡 真治 影浦 峡 小山 照夫
出版者
国立情報学研究所
雑誌
学術情報センター紀要 (ISSN:09135022)
巻号頁・発行日
vol.11, pp.49-57, 1999-03
被引用文献数
1

専門分野における複合名詞を分析する時に、複合名詞を構成している語構成要素の情報が必要となってくる。本研究では、語構成要素の文法情報だけでどこまで複合名詞の性質を分析することができるかどうかを見きわめるために、語構成要素を文法情報である品詞相当カテゴリーに分類するための検討を行った。語構成要素においては、従来の文/単語関係で定義された品詞カテゴリーをそのまま適用することは難しい。そこで本研究では、従来の品詞カテゴリーを参照しつつ、新たに語構成用の品詞相当カテゴリーとその定義を設定することを試みた。