著者
中川 裕 佐野 洋 鈴木 玲子 降幡 正志 上田 広美 匹田 剛 望月 源 田原 洋樹 原 真由子
出版者
東京外国語大学
雑誌
基盤研究(A)
巻号頁・発行日
2008

聴覚・音響音声学的な事実と音韻論的構造との相互関係を理解するために、広範囲の言語事例を使い、言語横断的比較の手法を用いながら、聴覚実験や音響分析によって新知見をもたらした。さらにその新知見を音韻構造との関連で解釈した。解釈の過程で、音韻素性理論に聴覚・音響的特性をどう位置づけるかという理論的問題を探求するための、多くの具体的手がかりを得ることができた。それと同時に、このプロジェクトで蓄積した、聴覚音声学的な新手法と新知見を用いて、言語学習の過程における第2言語(L2)の発音の諸問題に取り組み、実り多い議論を発展させることができた。
著者
中川 裕 佐野 洋 望月 源 高田 明
出版者
東京外国語大学
雑誌
基盤研究(A)
巻号頁・発行日
2016-04-01

本研究は言語音の多様性を探求する分野「音韻類型論」における未開拓の重要な問題、「言語音の限界縁はいかなるものか?」と「その限界縁をなす稀少特徴はどのように説明できるか?」に取り組んだ。そのために次の3つの新接近法を導入した:(i)世界中に遍在する「ありふれた音韻特徴」を重視する従来の手法を逆転させて、地理的に偏在する「めずらしい音韻特徴」を重視する点;(ii)極度に複雑な音類を多用するコイサン諸語の精査によって、言語音の複雑度の限界範囲の解明に挑戦する点;(iii)音素目録に基づく頻度調査に依存しがちだった従来の研究に対し、語彙内における頻度調査を体系的に実施する点である。
著者
望月 源 岩山 真 奥村 学
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.6, no.3, pp.101-126, 1999
被引用文献数
7

計算機上の文書データの増大に伴い, 膨大なデータの中からユーザの求める文書を効率よく索き出す文書検索の重要性が高まっている. 伝統的な検索手法では, 文書全体を1つのまとまりとして考え検索要求との類似度を計算する. しかし, 実際の文書, 特に長い文書では様々な話題が存在し, 文書中の各部分によって扱われる話題が異なる場合も多く見られる. そのため, 最近の文書検索では, ユーザの入力した検索要求と関連の高い文書の一部分を取り出して類似度を計算するパッセージレベルの検索が注目されている. パッセージ検索におけるパッセージとは, 文書中で検索要求の内容と強く関連する内容を持つ連続した一部分のことを言う. パッセージ検索では, このパッセージをどのように決定するかが問題となる. 良いパッセージを決定するためには, パッセージ自体が意味的なまとまりを形成し, パッセージの位置やサイズが検索要求や文書に応じて柔軟に設定される必要があると考えられる. 本稿では, 文書中の文脈情報である語彙的連鎖を利用し, 検索要求と文書の適切な類似度を計算できるパッセージ決定手法について述べる. また, このパッセージを使用し, 検索精度を向上させる検索手法について述べる.
著者
望月 源 岩山 真 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1998, no.82, pp.39-46, 1998-09-17

計算機上の文書データの増大に伴い,膨大なデータの中からユーザの求める文書を効率よく索き出す文書検索の重要性が高まっている.最近の文書検索では,ユーザの入力したクエリーと関連の高い文書の一部分を取り出して類似度を計算するパッセージレベルの検索が注目されている.パッセージ検索におけるパッセージとは,文書中でクエリーの内容と強く関連する内容を持つ連続した一部分のことを言う.パッセージ検索では,このパッセージをどのように決定するかが問題となる.良いパッセージを決定するためには,パッセージ自体が意味的なまとまりを形成し,パッセージの位置やサイズがクエリーや文書に応じて柔軟に設定される必要があると考えられる.本稿では,文書中の文脈情報である語彙的連鎖を利用し,クエリーと文書の適切な類似度を計算できるパッセージ決定手法について述べる.また,このパッセージを使用し,検索精度を向上させる検索手法について述べる.The importance of document retrieval systems which can retrieve relevant documents for user's needs is now increasing with the growing availability of full-text documents. The passage-level document retrieval has been received much attentions in the recent document retrieval task. The definition of a passage is considered as a sequent part of document which contain a relating content to a content of a query. In the passage retrieval, it is a problem how to decide the passages. It is considered that the passages which form meaning coherent units are effective in the improvement of the accuracy. Furthermore, it is also effective that the size and location of each passage is calculated flexibly with each query and document. In this paper we describe a definition of a passage calculation which can be able to calculate a similarity between each content of user's query and each part of document, using lexical chains which denote local document contexts. We also present a passage-level document retrieval method which improve the accuracy.
著者
望月 源 本田 岳夫 奥村 学
雑誌
全国大会講演論文集
巻号頁・発行日
vol.51, pp.37-38, 1995-09-20
被引用文献数
2

語義曖昧性解消などに使用される代表的な機械可読の日本語シソーラスには、国立国語研究所の分類語彙表[4](以下、[分類])と、角川書店の角川類語新辞典[5](以下、[角川])が挙げられる。これらは人手により、異なる語彙分類基準で構築されている。本稿では我々の語彙的結束性[1]に基づいた語義曖昧性解消アルゴリズム[3]を両シソーラスそれぞれを用いて実装し、実際のテキストで曖昧性解消の実験を行なう。その結果から、語彙的結束性に基づく語義曖昧性解消の観点からシソーラスの比較を行なう。
著者
望月 源 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.86, pp.17-24, 2000-09-21
被引用文献数
4

本研究では,genericでinformativeな要約の作成を目指し,「指定された要約率の範囲で,元のテキストの情報をできる限り含めること」と「作成された要約が文章として自然で読みやすいこと」の実現のための重要個所抽出による要約作成を行なう.本稿では,重要個所抽出の際に,構文情報と語彙的結束性の情報を考慮して,同じ内容を表わす語の繰り返しによる冗長性を抑える手法,文としての意味を維持するために必要な他の部分を補完する手法,内容的に一貫性のある読みやすい要約を作成する手法について述べる.また,指定された要約率の範囲で内容がどの程度保持できているかを人間による重要個所抽出型要約との比較で評価する.In this research, we aim to develop a summarization system which is capable of making an informative and generic summary. We require the system to have two abilities; to include as much information as possible on the original text in the summary of the specified rate, and to produce natural sentences with higher readability which can be exchanged for the original text. We adopted the method of extracting important parts of sentences for our first summarization system. Since important parts are smaller than important sentences, it can be considered that a fine-grained summary can be produced by using these parts. In this paper, we describe an automatic summarization method of extracting important parts which result in an improvement of readability and an exclusion of redundancy. We also make a content-based summary comparison by measuring the similarities between the summaries extracted by some automatic summarization methods and those extracted by human subjects.