著者
山崎 天 坂田 亘 川本 稔己 小林 滉河 Nguyen Tung 上村 卓史 中町 礼文 李 聖哲 佐藤 敏紀
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 93回 (2021/11) (ISSN:09185682)
巻号頁・発行日
pp.113-118, 2021 (Released:2021-11-20)

本稿では、対話システムライブコンペティション4のオープントラックに提出した対話システムについて述べる。本システムはTransformerをベースとした言語モデルの「HyperCLOVA」を用い、ユーザの発話に応じて選択するFew-Shotプロンプトを利用して応答候補の生成を行う。プロンプトは4種類あり、一般的な応答生成、知識応答生成、ペルソナ一貫性を考慮した応答生成、短文抑制のための応答生成を目的としたものをそれぞれ用意し、組み合わせて利用する。後に、不適切な発話を除去するフィルタリングを行うことで、最終的な出力を得るシステムとなっている。予選の結果では1位を獲得し、大規模言語モデルが雑談応答生成に有効であることを示したが、攻撃的な応答生成をはじめとしたいくつかの課題が顕在化した。本稿では、大規模言語モデルを用いた雑談応用における現存の課題や今後の方向性を議論する。
著者
佐藤 敏紀 橋本 泰一 奥村 学
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2016-NL-229, no.15, pp.1-14, 2016-12-14

SNS やニュース記事で発見される新語や未知語の継続的な採録は,分かち書き用の辞書を作成して更新する際の課題のひとつである.我々は,固有名詞や複合語に対する高い網羅性と分かち書き精度を実現し続ける際に,コーパスではなく辞書として言語資源を追加することを選択した.そして,形態素より長い固有名詞や複合語を単一の見出し語として分かち書きし,品詞情報や読み仮名などを付与できる辞書を生成するためのシステムを構築した.さらに辞書生成システムを運用して短い周期での更新を長期間継続した.我々は,形態素より長い固有名詞や複合語を一語として分かち書きすること,及び,辞書生成システムを運用して短い周期で更新することの各効果を,ニュース記事を複数のカテゴリに分類する実験を通じて確認した.
著者
川本 稔己 山崎 天 坂田 亘 佐藤 敏紀
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 93回 (2021/11) (ISSN:09185682)
巻号頁・発行日
pp.131-136, 2021 (Released:2021-11-20)

本稿では、対話システムライブコンペティション4のシチュエーショントラックに提出した対話システムについて述べる。本システムはTransformerをベースとした言語モデルの「HyperCLOVA」を用いて応答生成を行った。言語モデルには対話履歴だけでなく、状況や発話者のペルソナをFew-Shotのプロンプトとして入力することでシチュエーションに沿った応答生成を可能にした。また、シチュエーションに沿わない応答を生成した場合に備えて、応答開始語句を指定した後に再度生成を行う機構を備えている。その結果、本システムは予選で2位の成績を収め、日本語の大規模言語モデルがシチュエーションに沿ったタスク指向対話の応答生成に有用であることを確認した。一方で、生成文には時折Hallucinationが起こることにより、発話の信頼性や対話の一貫性に未だ課題が残る。本稿では、予選の対話ログを参照し課題の議論を行う。
著者
内海 慶 小町 守 町永 圭吾 前澤 敏之 佐藤 敏紀 小林 義徳
出版者
情報処理学会
雑誌
情報処理学会研究報告 (ISSN:18840930)
巻号頁・発行日
vol.2010, no.4, pp.1-7, 2010-12

我々は,クエリ訂正を統一的に行う手法として,検索クエリログとクリックスルーログを用いたグラフに基づく手法を提案する.提案手法では,クリックスルーログを用いたラベル伝播により,入力されたクエリで検索を行った場合と同一のページに到達するクエリを獲得し,これをクエリの訂正候補とした.次に,獲得した訂正候補に対して,検索クエリログから生成した言語モデルを用いて尤度を計算し,ラベル伝播時のスコアとあわせて候補のランキングを行った.これによって,人手による学習コーパスを必要とせずに,入力されたクエリと高く関連し,かつクエリとして適切な候補をログから抽出できることを示す.In this paper, we propose a new method to refine web search queries. This method is based on a graph theoretic label propagation and uses web search query and clickthrough logs. Our method first enumerates query candidates with common landing pages with regard to the given query. Then it calculates likelihoods of the candidates, making use of language model generated from web search query logs. Finally the candidates are sorted by their scores calculated from the likelihoods and the label propagations. As a result, we are able to extract appropriate candidates from web search query and clickthrough logs, without using hand-crafted training data.
著者
佐藤 敏紀 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.94, pp.7-14, 2007-09-25
被引用文献数
7

本稿では日本語の比較表現に対する知見から得られたルールと 構文情報とセンタリング理論を用いることで blog 記事中に含まれる比較表現から比較関係を抽出する手法を提案する.比較関係は〈対象 基準 属性 評価〉の4つ組 または属性が非明示な〈対象 基準 評価〉の3つ組で構成される.提案手法では4つ組と3つ組の両者の抽出を試みる.提案手法ではこれらの組を抽出する.比較関係は構成する要素が全て単文中に存在する場合と複数文にまたがって存在する場合がある.提案手法は両方の場合に対応する.実験により提案手法は blog 記事中の単文または複数文にまたがる比較表現から比較関係の4つ組を高い精度で抽出できることがわかった.In this paper, we propose a new method for extracting comparative relations from comparative expressions in Japanese Weblogs. A comparative relation is expressed with <object, criteria, attribute, evaluation>, or <object, criteria, evaluation> when the attribute is not explicitly shown. Our proposed method extracts relations of both types. We can observe the fact that all elements of a comparative relation are in a simple sentence or range over multiple sentences. Our proposed method can apply to both cases. Experimental results show that our proposed method can extract the comparative relation with high precision.