著者
田辺 利文 吉村 賢治 首藤 公昭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.188, pp.65-72, 2008-11-19
参考文献数
15

本論文では、深層格の種類が比較的多いとされる格助詞「に」を対象にし、格助詞「に」を介した係り受け関係にある名詞と述部によって深層格を推定する1モデルを提案する。予備的実験の結果、設定した深層格は43種と多種であるにもかかわらず、再現率は約95%に達し、提案する格助詞「に」の深層格推定モデルはおおむね妥当であることが示された。
出版者
情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.78, no.9, pp.65-72, 1990-07-19

最も簡単な表現形式をもつ名詞述語文の意味解釈手続きを具体的に提案する.名詞述語文を理解する際には,モジュール的ではあるが,適用順序に柔軟性のある数個の手続きが適用されると考える.また,各手続きごとに,適用時に参照するいくつかの知識源も想定している.このうち,語彙知識には,ネットワーク的表現を採用している.このような手続きを考えることで,既知の名詞から作られる名詞述語文すべての意味解釈の分岐を考えることができる.とくに,"文字通り"の解釈や隠喩的解釈,"うなぎ"文的解釈などの違いを明確に区別できる.なお,これらの手続きの内容や適用方法は,文脈を存在を考慮し,一般化されている。We propose semantic procedures in understanding Japanese noun-predicate sentences.These procedures have module-like characteristics but their adpoted order is flexible. Each procedure uses specific knowledge basis such as lexical knowledge. The lexical knowledge is represented in a network fashion. Using such procedures and knowledge basis, we can allocate all of the interpretations of Japanese noun-predicate sentences into "literal" interpretations, "metaphorical" interpretations, "UNAGI-BUN" interpretations, and so on.
著者
得丸 公明
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.2014, no.5, pp.1-28, 2014-01-30

ヒ卜の言語は脊髄反射であるようだ.その生物物理的・分子生物学的基盤は他の脊椎動物の記号反射と同じ脳室内の脳脊髄液中の免疫細胞ネットワークである.およそ 7 万 7 千年前から 6 万 6 千年前にかけて,いまの南アフリカ共和国の東・西ケープ州に属する海岸線の近くで,ヒトは音素とアクセントを獲得したことによって無限の語彙とそれらを連接する文法を獲得して,論理的音節を一次元配列した音声波形を使ってデジタル通信を開始した.話し手から聞き手に送られる音声波形は,すぐに消える音声から,記録の残る文字,遠くに伝わる電話や放送のアナログ電気通信,双方向のオートマトンであるコンピュータ・ネットワークへと進化をとげた.一方,脳内の音声記号の形態は,一貫して免疫細胞ネットワークのままで,(i) 二分法論理によるパターン認識を行う抗原抗体反応と,(ii) 文法と思考を操作するための二元論論理による信号伝達系であり,音節の音素性とモーラ性がもつ論理性が,免疫細胞の二分法・二元論論理に対応する.脊髄反射が生理的基盤であるために,言葉の意味は常に過去の経験や思考に基づく反射であり,新しい単語にはすぐには対応できないほか,じっくり考える前に反射的対応をとってしまう.また,知能は過去の経験に基づいた均衡状態にあるために,自分が知らない事象や現象を耳にすると,無意識のうちにそれを拒否して門前払いするかあるいは否定的に受容してしまう.言語記憶を司ると思われる脳脊髄液中の B リンパ球のまったく同じ細胞の免疫ネットワーク構造が,五官記憶にもとづいて構成される具象概念にも,論理記憶にもとづいて構成されるさまざまな抽象概念にも適用されるために生じている混乱は,これまでほとんど検討されてこなかった.脳内免疫記憶ネットワークである言語と知能が正しく作用するためには,同じ B リンパ球の生理メカニズムが,五官記憶や論理記憶や言語記憶とネットワークしている事実に注目して,明快で段階的で可逆的な思考を重ねることによって,概念装置を正規化する必要がある.経験の裏付けのないアプリオリな数式や概念は,人類文明の知的発展のためには排除されなければならない.
著者
谷垣 宏一 徳本 修一 撫中 達司 匂坂 芳典
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.2015, no.5, pp.1-8, 2015-01-12

語彙を限定しない語義曖昧性解消 (all-words WSD) のための新しい教師なし学習モデルを提案する.all-words WSD は,辞書知識を言語処理に活用する基礎技術として実用化が期待されるが,識別対象である語義は種類が膨大でかつ分布がドメインに強く依存する性質があり,ラベル付きコーパスの構築を前提とする教師あり学習では実用化を見込むことが難しい.提案法は,ラベルなしコーパスの語と膨大な語義の間に自然な対応を推定するため,2 つの制約をモデル化する: 1) 類似した文脈に出現する語群の語義は,互いの語義からの外挿に従う.2) 同じ語の各出現における語義は,単語タイプ毎の事前分布に従う.これらの相補的制約を単一の階層ベイズモデルに統合し,教師なし all-words WSD を実現する.SemEval データセットを用いた実験結果より提案法の有効性を示す.
著者
丹羽 芳樹 新田 義彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.94, no.63, pp.49-56, 1994-07-21
被引用文献数
3

実用的な自然言語処理に求められる頑健性を確保するためには,ルールに基づく解析を補う数値計算的手段が有効である.単語ベクトルとは単語の意味を反映した座標表現であり,文脈の類似度計算や単語例からの学習など幅広い応用が期待される.本研究では2種類の単語ベクトルを用い,多義語の意味推定問題での効果を比較した.一つは大規模テキストから共起統計により得られる共起ベクトル,もう一つは辞書の語義から計算される単語間距離を用いる定義距離ベクトルである.9種類の多義語に関する実験結果では共起ベクトルの方が高い正解率が得られた.従って文脈の類似度に基づく多義性解消問題に関しては共起ベクトルを用いた方が有利である.
著者
甲斐 郷子 中村 順一 吉田 將
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.95, no.27, pp.79-84, 1995-03-09
参考文献数
10
被引用文献数
4

科学技術論文などの論理的文章にとって,論旨展開が明確であること,事実,主張,根拠などがバランスよく述べられていることは重要である.しかし初心者にとってこれらの適切さを認識することは容易ではない.本稿では,このような論文作成の初心者に論文改訂作業を支援するシステムの試作と改訂実験によるシステムの評価について述べる.本プロトタイプシステムでは,表層的な情報を基に改訂対象の文章構造を解析し,その結果を筆者に提示することにより支援を行う.改訂実験により明かになった本プロトタイプシステムの有効性と限界についても論じる.
著者
佐藤 理史 佐々木 靖弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.153, pp.57-64, 2003-01-20
参考文献数
9
被引用文献数
10 9

与えられた専門用語に対して、その用語と関連する用語をウェブテキストを利用して収集する方法を提案する。提案方法は、コーパス作成、重要語抽出、フィルタリングの3ステップから構成される。コーパス作成では、サーチエンジンを利用して、与えられた用語を説明するテキストをウェブから収集し、その用語に対するコーパスを作成する。次の重要語抽出では、このコーパスから、中川の方法を利用して重要語を抽出する。最後のフィルタリングでは、得られた重要語の中から、関連用語としてふさわしいものを、ウェブのヒット数を利用して、選択する。
著者
森田 一 奥村 学 東中 竜一郎 松尾 義博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.2012, no.3, pp.1-6, 2012-11-15

Twitter 上の対話はチャットのログ等とは異なり,発話にはリプライやリツイートといった明示的な形で他の発話と関連していることを示す情報が含まれる場合がある.そのため,これらの情報を積極的に利用することが Twitter 上の発話間の関係を同定する際には重要となる.関係の同定によく用いられている Markov Logic Network (MLN) 上で Twitter 特有の情報を利用し,発話間の関係の有無とその種類の同定を行うモデルを提案する.一方,発話系列には長さに制限がなく非常に長い対話となることもしばしば存在する.このような長い発話に MLN を適用する際に, MLN が大きな問題に対しては計算が困難であることが問題となる.本稿では MLN に対して SVM における動的素性に対応する動的述語を導入することにより,分割した系列に対して近似的に推論が行えるように MLN に対して拡張を行う.
著者
梅木 定博 後藤 智範
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.187, pp.1-6, 2008-09-17
参考文献数
9
被引用文献数
1

日本語のテキストにおいて、主要な概念・テーマは漢字熟語または漢字熟語を含む名詞句に表現されることが多い。特に数文字以上の漢字熟語は、より短い漢字熟語、すなわち語基(word base)から構成され、統語的、意味的構造を有している。大規模な漢字熟語集合について、これらの構造を分析することは、漢字熟語の造語特性・形態素解析・関連語の選定など様々な自然言語解析およびオントロジーの開発に有用な基礎データを提供するものと考えられる。本研究は、一般辞書および専門用語辞書の見出し語から8文字の漢字熟語を対象に、構成語基の観点から品詞列パターンおよび構成語基の係り受けパターンについて調査・分析した。