著者
佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.108, pp.33-40, 2004-11-04
被引用文献数
1

境界認定は、語(単位)を認定するのではなく、境界とその種別を認定する。本稿では、境界認定という考え方が生まれてきた背景と、境界認定の背後にある思想について述べる。This paper describes background and philosophy of boundary identification, which identifies boundaries and their types between linguistic units in a given sentence. The proposal of boundary identification aims to restucture Japanese sentence analysis method.
著者
高木 大生 佐藤 理史 駒谷 和範
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

我々は、既存の短編小説から会話文を抜き出し、その一部を他作品の会話文と置換することにより、新たな超短編小説を自動生成することに取り組んでいる。このプロセスを機械的に実行するための準備として、我々はまず、星新一のショートショートに含まれる会話文に対し、発話者を特定する方法を実装した。この方法は、発話者を特定する手がかりとして、会話文の文体的特徴と、会話文の前後の地の文を利用する。
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
緒方 健人 佐藤 理史 駒谷 和範
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

本研究では、既存の短編小説を模倣利用した、超短編小説の自動生成を目指す。最も単純な模倣は、完全な複製である。しかしながら、複製した文章の一部を改変することで、単純な模倣から脱却し、創作に近づけていくことができると考えられる。本発表では、星新一のショートショート作品からいくつかの文を抜き出し、その一部を変化させたり、置換したりすることで、新たなる超短編小説が生成できる可能性を示す。
著者
佐藤 理史 加納 隼人 西村 翔平 駒谷 和範
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2013, no.5, pp.1-9, 2013-07-11

大学入試センター試験 『国語』 の現代文で出題される,いわゆる 「傍線部問題」 を解く方法を定式化し,実装した.実装した方法は,「評論」 の 「傍線部問題」 の半数を正しく解くことができた.We have formalized and implemented a method for solving questions about underlined segments in contemporary Japanese language, National Center Test for University Admissions. The method can solve a half of these questions in "critical essay" correctly.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-515, (Released:2015-12-15)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.108, pp.25-32, 2004-11-04
参考文献数
3
被引用文献数
1

形態素解析に代わる新しい日本語文解析の第1ステップとして、「境界設定」という枠組を提案する。境界設定では、語(単位)を認定するのではなく、境界とその種別を認定する。本稿では、その考え方と表現法について述べる。This paper proposes boundary identification, a new framework of the first step of Japanese sentence analysis. Boundary identification identifies boundaries and their types between linguistic units in a given sentence. This paper describes the concept and an implementation of the framework.
著者
鈴木 啓輔 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第24回 (2010)
巻号頁・発行日
pp.3D43, 2010 (Released:2018-07-30)

本研究では文章生成の研究の一つとして、回文の自動生成を取り上げる。本稿では、その第一段階として、文法的に可能な構造を持つ回文の生成法を提案する。この手法は、出発点となる文節の前後に新たな文節を接続することで、回文を生成する。この過程で、文法的な接続の可否をチェックする。同時に、複数個の文節を接続して回文となる可能性があるかどうかをチェックすることで、効率的に回文を自動生成する。
著者
佐藤 円 佐藤理史 篠田 陽一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.36, no.10, pp.2371-2379, 1995-10-15
参考文献数
6
被引用文献数
40

現在、電子ニュースを通じて多くの情報が流通し、多くの人々がその情報を利用している。この電子ニュースは、新しいマスメデイアであり、従来のテキスト情報マスメデイアにはない、優れた特徴を持っている。しかしながら、現在のニュースリーダは、その特徴や利用者の要求に合致した、適切な機能を提供しておらず、読者にとっては、必ずしも利用しやすい情報メディアとはなっていない。我々は、電子ニュースを利用しやすい情報メデイアにするためには、そのダイジェストを提供することが不可欠であると考える。ダイジェストとは、元になる情報をコンパクトにまとめ編集したものであり、情報全体の俯瞰やエッセンスの把握、情報の取捨選択の際に、優秀なナビゲータとして機能する。本研究では、電子ニュースに対して、このようなダイジェストを自動生成することを提案し、その一つのプロトタイプとして、会告記事用ニュースグループfj.meetingsダイジェストを自動生成する方法を示す。ダイジェストの自動生成を実現する中心的な技術は、サマリーの自動摘出技術であり、会告記事にみられるスタイル上の特徴、言語表現バターンを利用することにより、実用に十分な精度でサマリーを抽出できることを示す。本方武で自動生成されたダイジェストは、WWWのクライアントプログラムで読むことができる。
著者
松原 仁 佐藤 理史 赤石 美奈 角 薫 迎山 和司 中島 秀之 瀬名 秀明 村井 源 大塚 裕子
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第27回全国大会(2013)
巻号頁・発行日
pp.2D11, 2013 (Released:2018-07-30)

人工知能の新しいグランドチャレンジとしてコンピュータに星新一のようなショートショートを創作させるプロジェクトを開始した。知性を理性と感性とに分けるとこれまでの人工知能はもっぱら理性を対象としていたが、ある程度理性はコンピュータに扱えるようになってきた。芸術作品の創作ができればコンピュータにも感性が扱えると示せたことになると考える。ここでは本プロジェクトの概要について述べる。
著者
加納 隼人 佐藤 理史 松崎 拓也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.32, no.1, pp.C-G61_1-11, 2017-01-06 (Released:2017-01-13)
参考文献数
20

This paper reports progress from 2014 to 2015 on development of solvers of Japanese comprehension questions in university entrance exam. Target questions are the multiple-choice questions in the essay section (Question No.1) in Japanese Language (Kokugo) of National Center Test. In 2014, we introduced a new scoring function using clause boundaries, which are automatically detected by our newly developed tool. The score of a choice is calculated as the average clause-similarity between the choice and a selected part of text body. In 2015, we developed a machinelearning based method, which uses seventeen features to determine the answer. They includes surface-similarity based features, clause-similarity based features, and choice-discriminative features. In addtion to the first formal run of Torobo Project in 2013, we participated in the two formal runs in 2014 and 2015; We were only a participant who submitted the result in Contemporary Japanese Language until now. After the 2015 formal run, we conducted an experiment using 276 questions to compare all developed solvers with various parameters. The best performance was obtained by a 2015 solver, which produced 117 (42%) correct answers. For the subset of 56 previous official questions in National Center Test, a 2014 solver was the best, which produced 32 (57%) correct answers. However, there is no statistical significance between the best 2015 solver and our first solver developed in 2013.
著者
佐藤 理史
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.3, pp.253-254, 2018-06-15 (Released:2018-09-15)
著者
宮崎 千明 佐藤 理史
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.26, no.2, pp.407-440, 2019-06-15 (Released:2019-09-15)
参考文献数
21

「こりゃひでえ」(元の形:「これはひどい」)のような音変化表現は,対話エージェントの発話や小説のセリフの自動生成において,話者であるキャラクタを特徴付けるための強力な手段となると考えられる.音変化表現を発話のキャラクタ付けに利用するために,本研究では,(i) キャラクタの発話に現れる音変化表現を収集し,(ii) それらを基に,音変化表現を人為的に発生させるための知識を整理した.具体的には,収集した音変化表現を現象と生起環境の観点で分類し,137 種類のパターンとして整理した.そして,これらのパターンが小説やコミックで用いられる音変化表現の 80% 以上をカバーすることを確認した.さらに,(iii) 音変化表現がキャラクタらしさを特徴付ける手段になるという仮説を検証するために,小説やコミックにおける発話文の話者(キャラクタ)を推定する実験を行い,音変化表現のパターンの情報を利用することで,推定性能が向上するキャラクタが存在することを確認した.
著者
高木 大生 佐藤 理史 松崎 拓也
雑誌
第77回全国大会講演論文集
巻号頁・発行日
vol.2015, no.1, pp.171-172, 2015-03-17

われわれは、コンピュータにショートショートを自動生成させることを目指している。ショートショートの自動生成には、プロットやキャラクター、時間、場所、文法知識など様々な背景知識が必要になる。われわれは、プロットとそれらの背景知識を持ち、ショートショートを自動生成するシステムを実装した。このシステムは、プロットを穴埋め式のテンプレートとして保持し、背景知識を用いてこの穴を埋め、物語を生成する。さらにこの時、一つ穴を埋める要素を変更することで、連鎖的に他の穴を埋める要素も変わり、一つのプロットから複数の物語を生成できる。
著者
佐藤 理史 加納 隼人 西村 翔平 駒谷 和範
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.21, no.3, pp.465-483, 2014-06-16 (Released:2014-09-16)
参考文献数
6
被引用文献数
2 1

大学入試センター試験『国語』の現代文で出題される,いわゆる「傍線部問題」を解く方法を定式化し,実装した.本方法は,問題の本文の一部と 5 つの選択肢を照合し,表層的に最も類似した選択肢を選ぶことにより問題を解く.実装した方法は,「評論」の「傍線部問題」の半数以上に対して正解を出力した.
著者
大槻 洋輔 佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.3, pp.165-172, 2000-01-12
被引用文献数
1 6

本論文では,地域情報ディレクトリを自動編集するシステムを提案する.本システムの中心技術は,情報源の自動収集と,ページの自動分類である.情報源の自動収集では,地域情報サイトに見られる典型的なURLパターンを利用して既存の地域情報リンク集を発見し,そこから情報源となるサイトのURLを収集する.この方法により,日本の全地域(3427自治体)の80%以上に対して,情報源を収集することができる.また,ページの自動分類では,収集した情報源サイト内のページを8つの種類のカテゴリに分類する.この分類は,それぞれのカテゴリに固有な表現が,ページのタイトルやアンカ文字列に現れるかどうかによって決定する.本ディレクトリは,地域別に情報を表示する地域モードと,カテゴリ別に情報を表示するカテゴリモードの両方を提供する.This paper proposes a system that edits a web directory of regional information automatically. The directory provides two views: regional view and category view. Two key technologies are automatic collection of regional web sites and automatic classification of web pages. The former finds existing link collections by using the URL prototypes of regional web sites, and extracts unknown regional web sites' URLs. This method can collect one or more web sites of 80 percent of all regions in Japan. The latter classifies the pages in the regional web sites into eight categories by using the category-specific expressions.
著者
佐藤 理史
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.27, no.2, pp.411-444, 2020-06-15 (Released:2020-09-15)
参考文献数
18

本論文では,日本語文を合成するためのドメイン特化言語 HaoriBricks3 (HB3) について述べる.HB3 では,ブリックコードと呼ぶ Ruby コードで,どのような日本語文を合成するかを記述する.このブリックコードを評価すると,ブリック構造と呼ばれる Ruby オブジェクトが生成され,さらに,これに表層文字列化メソッド to_ss を適用すると,表層文字列が生成される.本論文では,HB3 の設計思想,実装のための工夫について説明し,HB3 で何ができるのかを示す.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.1, pp.DSF-E_1-9, 2016-01-06 (Released:2016-01-08)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.