著者
佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.108, pp.33-40, 2004-11-04
被引用文献数
1

境界認定は、語(単位)を認定するのではなく、境界とその種別を認定する。本稿では、境界認定という考え方が生まれてきた背景と、境界認定の背後にある思想について述べる。This paper describes background and philosophy of boundary identification, which identifies boundaries and their types between linguistic units in a given sentence. The proposal of boundary identification aims to restucture Japanese sentence analysis method.
著者
高木 大生 佐藤 理史 駒谷 和範
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

我々は、既存の短編小説から会話文を抜き出し、その一部を他作品の会話文と置換することにより、新たな超短編小説を自動生成することに取り組んでいる。このプロセスを機械的に実行するための準備として、我々はまず、星新一のショートショートに含まれる会話文に対し、発話者を特定する方法を実装した。この方法は、発話者を特定する手がかりとして、会話文の文体的特徴と、会話文の前後の地の文を利用する。
著者
緒方 健人 佐藤 理史 駒谷 和範
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

本研究では、既存の短編小説を模倣利用した、超短編小説の自動生成を目指す。最も単純な模倣は、完全な複製である。しかしながら、複製した文章の一部を改変することで、単純な模倣から脱却し、創作に近づけていくことができると考えられる。本発表では、星新一のショートショート作品からいくつかの文を抜き出し、その一部を変化させたり、置換したりすることで、新たなる超短編小説が生成できる可能性を示す。
著者
佐藤 理史 加納 隼人 西村 翔平 駒谷 和範
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2013, no.5, pp.1-9, 2013-07-11

大学入試センター試験 『国語』 の現代文で出題される,いわゆる 「傍線部問題」 を解く方法を定式化し,実装した.実装した方法は,「評論」 の 「傍線部問題」 の半数を正しく解くことができた.We have formalized and implemented a method for solving questions about underlined segments in contemporary Japanese language, National Center Test for University Admissions. The method can solve a half of these questions in "critical essay" correctly.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.108, pp.25-32, 2004-11-04
参考文献数
3
被引用文献数
1

形態素解析に代わる新しい日本語文解析の第1ステップとして、「境界設定」という枠組を提案する。境界設定では、語(単位)を認定するのではなく、境界とその種別を認定する。本稿では、その考え方と表現法について述べる。This paper proposes boundary identification, a new framework of the first step of Japanese sentence analysis. Boundary identification identifies boundaries and their types between linguistic units in a given sentence. This paper describes the concept and an implementation of the framework.
著者
佐藤 円 佐藤理史 篠田 陽一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.36, no.10, pp.2371-2379, 1995-10-15
参考文献数
6
被引用文献数
40

現在、電子ニュースを通じて多くの情報が流通し、多くの人々がその情報を利用している。この電子ニュースは、新しいマスメデイアであり、従来のテキスト情報マスメデイアにはない、優れた特徴を持っている。しかしながら、現在のニュースリーダは、その特徴や利用者の要求に合致した、適切な機能を提供しておらず、読者にとっては、必ずしも利用しやすい情報メディアとはなっていない。我々は、電子ニュースを利用しやすい情報メデイアにするためには、そのダイジェストを提供することが不可欠であると考える。ダイジェストとは、元になる情報をコンパクトにまとめ編集したものであり、情報全体の俯瞰やエッセンスの把握、情報の取捨選択の際に、優秀なナビゲータとして機能する。本研究では、電子ニュースに対して、このようなダイジェストを自動生成することを提案し、その一つのプロトタイプとして、会告記事用ニュースグループfj.meetingsダイジェストを自動生成する方法を示す。ダイジェストの自動生成を実現する中心的な技術は、サマリーの自動摘出技術であり、会告記事にみられるスタイル上の特徴、言語表現バターンを利用することにより、実用に十分な精度でサマリーを抽出できることを示す。本方武で自動生成されたダイジェストは、WWWのクライアントプログラムで読むことができる。
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-515, (Released:2015-12-15)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
佐藤 理史
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.3, pp.253-254, 2018-06-15 (Released:2018-09-15)
著者
高木 大生 佐藤 理史 松崎 拓也
雑誌
第77回全国大会講演論文集
巻号頁・発行日
vol.2015, no.1, pp.171-172, 2015-03-17

われわれは、コンピュータにショートショートを自動生成させることを目指している。ショートショートの自動生成には、プロットやキャラクター、時間、場所、文法知識など様々な背景知識が必要になる。われわれは、プロットとそれらの背景知識を持ち、ショートショートを自動生成するシステムを実装した。このシステムは、プロットを穴埋め式のテンプレートとして保持し、背景知識を用いてこの穴を埋め、物語を生成する。さらにこの時、一つ穴を埋める要素を変更することで、連鎖的に他の穴を埋める要素も変わり、一つのプロットから複数の物語を生成できる。
著者
加納 隼人 佐藤 理史 松崎 拓也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.32, no.1, pp.C-G61_1-11, 2017-01-06 (Released:2017-01-13)
参考文献数
20

This paper reports progress from 2014 to 2015 on development of solvers of Japanese comprehension questions in university entrance exam. Target questions are the multiple-choice questions in the essay section (Question No.1) in Japanese Language (Kokugo) of National Center Test. In 2014, we introduced a new scoring function using clause boundaries, which are automatically detected by our newly developed tool. The score of a choice is calculated as the average clause-similarity between the choice and a selected part of text body. In 2015, we developed a machinelearning based method, which uses seventeen features to determine the answer. They includes surface-similarity based features, clause-similarity based features, and choice-discriminative features. In addtion to the first formal run of Torobo Project in 2013, we participated in the two formal runs in 2014 and 2015; We were only a participant who submitted the result in Contemporary Japanese Language until now. After the 2015 formal run, we conducted an experiment using 276 questions to compare all developed solvers with various parameters. The best performance was obtained by a 2015 solver, which produced 117 (42%) correct answers. For the subset of 56 previous official questions in National Center Test, a 2014 solver was the best, which produced 32 (57%) correct answers. However, there is no statistical significance between the best 2015 solver and our first solver developed in 2013.
著者
佐藤 理史 加納 隼人 西村 翔平 駒谷 和範
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.21, no.3, pp.465-483, 2014-06-16 (Released:2014-09-16)
参考文献数
6
被引用文献数
2

大学入試センター試験『国語』の現代文で出題される,いわゆる「傍線部問題」を解く方法を定式化し,実装した.本方法は,問題の本文の一部と 5 つの選択肢を照合し,表層的に最も類似した選択肢を選ぶことにより問題を解く.実装した方法は,「評論」の「傍線部問題」の半数以上に対して正解を出力した.
著者
大槻 洋輔 佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.3, pp.165-172, 2000-01-12
被引用文献数
1 6

本論文では,地域情報ディレクトリを自動編集するシステムを提案する.本システムの中心技術は,情報源の自動収集と,ページの自動分類である.情報源の自動収集では,地域情報サイトに見られる典型的なURLパターンを利用して既存の地域情報リンク集を発見し,そこから情報源となるサイトのURLを収集する.この方法により,日本の全地域(3427自治体)の80%以上に対して,情報源を収集することができる.また,ページの自動分類では,収集した情報源サイト内のページを8つの種類のカテゴリに分類する.この分類は,それぞれのカテゴリに固有な表現が,ページのタイトルやアンカ文字列に現れるかどうかによって決定する.本ディレクトリは,地域別に情報を表示する地域モードと,カテゴリ別に情報を表示するカテゴリモードの両方を提供する.This paper proposes a system that edits a web directory of regional information automatically. The directory provides two views: regional view and category view. Two key technologies are automatic collection of regional web sites and automatic classification of web pages. The former finds existing link collections by using the URL prototypes of regional web sites, and extracts unknown regional web sites' URLs. This method can collect one or more web sites of 80 percent of all regions in Japan. The latter classifies the pages in the regional web sites into eight categories by using the category-specific expressions.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.1, pp.DSF-E_1-9, 2016-01-06 (Released:2016-01-08)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
豊辻 宏旨 松崎 拓也 佐藤 理史
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.3G11, 2017 (Released:2018-07-30)

センター試験「化学」の正誤問題に対する自動解答システムを開発した。選択肢に対し意味解析を行い、生成された中間表現に基づき正誤判定を行う。まず、化学物質の知識と状態や操作を表す用言に関する知識をオントロジーとしてまとめた。さらに、並列や連体修飾など分野に非依存な言語現象を処理するため形式文法を実装した。形式文法にオントロジーに基づく意味表示を組み込むことで、誤った解析を防ぎつつ、意味解析を行える。
著者
松原 仁 佐藤 理史 赤石 美奈 角 薫 迎山 和司 中島 秀之 瀬名 秀明 村井 源 大塚 裕子
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.2D11, 2013 (Released:2018-07-30)

人工知能の新しいグランドチャレンジとしてコンピュータに星新一のようなショートショートを創作させるプロジェクトを開始した。知性を理性と感性とに分けるとこれまでの人工知能はもっぱら理性を対象としていたが、ある程度理性はコンピュータに扱えるようになってきた。芸術作品の創作ができればコンピュータにも感性が扱えると示せたことになると考える。ここでは本プロジェクトの概要について述べる。
著者
加納 隼人 佐藤 理史 松崎 拓也
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2015, no.8, pp.1-7, 2015-01-12

本年度新たに実装した,大学入試センター試験 『国語』 評論傍線部問題を解くソルバーについて報告する.実装したソルバーは,傍線部問題の本文と選択肢に対して節境界検出による節分割を行い,その結果を用いて類似度計算を行うことで,解答を選択する.本ソルバーをセンター試験の過去問 40 問に適用したところ,昨年度のソルバーを上回る最大 28 問の正解数を示した.This paper describes a new solver that solves comprehension questions in Contemporary Japanese of the National Center Test. A target question consists of a text body, a question sentence, and five choices. Our solver divides the text body and the choices into clauses by using clause-boundary detection and selects a choice based on clause similarity. Our solver correctly solved 28 questions in 40 previous questions of the National Center Test.
著者
鈴木 啓輔 佐藤 理史
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

本研究では文章生成の研究の一つとして、回文の自動生成を取り上げる。本稿では、その第一段階として、文法的に可能な構造を持つ回文の生成法を提案する。この手法は、出発点となる文節の前後に新たな文節を接続することで、回文を生成する。この過程で、文法的な接続の可否をチェックする。同時に、複数個の文節を接続して回文となる可能性があるかどうかをチェックすることで、効率的に回文を自動生成する。
著者
佐藤 理史
出版者
北陸先端科学技術大学院大学
雑誌
一般研究(C)
巻号頁・発行日
1995

本研究では、電子ニュースにおける、いわゆる「掲示型」と呼ばれるニュースグループ(例えば、fj. wantedやfj. forsale等)のダイジェストを自動作成する方法について検討し、fj. wantedのダイジェストの自動生成システムを実現した。本システムの中心技術は、ニュース記事からその記事のカテゴリを判定し、その記事の内容を端的に表すサマリ文を抽出する技術である。本研究で開発した方法は,言わば「斜め読みを模擬した処理」であり、まず、表層的な表現を手がかりとして、42の特徴を抽出する。次に、それらの特徴を利用したルールによって、記事のカテゴリとサマリ文を抽出する。ブラインドデータに対する実験において、本方法は、カテゴリ判定正解率81%、サマリ文抽出正解率76%という値を示した。抽出されたサマリ文はカテゴリ毎に整理され、HTML形式のダイジェストとして出力される。このとき、元の記事へのポインタは、ハイパーテキストのリンクとして埋め込まれる。作成されたダイジェストは、WWWのクライアントプログラムによって読むことができる。本研究で開発した方法は、fj. wantedを対象としたものであるが、他の掲示情報型ニュースグループや質問応答型のニュースグループのダイジェスト作成にも、同様な手法が適用できると考えられる。また、本方法をさらに発展させることによって、FAQの自動作成も可能になると考えられる。