著者
関根 聡 乾 健太郎
雑誌
情報処理
巻号頁・発行日
vol.57, no.1, pp.3-5, 2015-12-15

本稿では,2014年春から2015年春にかけて自然言語処理の研究者らによって行われたProject Next NLPというプロジェクトを紹介する.本プロジェクトではエラー分析を通じて自然言語処理技術の方向性を考える目的で,ボランティアベースで100名を超える研究者が参加して行われた.自然言語処理で重要な基礎技術,要素技術,応用技術について18個の技術に分け,それぞれの研究している研究者を集い,協調的にそれぞれの分野の技術の分析を行った.分析の方法は各グループに委ねたところ,さまざまな方法での分析が行われ,エラー分析の方法論の研究という側面も持っている.本プロジェクトの紹介により,自然言語処理以外の情報処理分野に対して,エラー分析を通した研究やグループによるエラー分析の重要性が伝わると存外の喜びである.
著者
内元 清貴 関根 聡 井佐原 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.9, pp.3397-3407, 1999-09-15
被引用文献数
21 22

本論文ではME(最大エントロピー法)に基づくモデルを利用した統計的日本語係り受け解析手法について述べる. 一文全体の係り受け確率は 一文中のそれぞれの係り受けの確率の積から求められると仮定し それぞれの係り受けの確率はMEによって学習した係り受け確率モデルから計算する. この確率モデルは 学習コーパスから得られる情報を基に 2つの文節が係り受け関係にあるか否かを予測するのに有効な素性を学習することによって得られる. 我々が素性として利用する情報は 2つの文節あるいはその文節間に観測される情報 たとえば 文節中の表層文字列 品詞 活用形 括弧や句読点の有無 文節間距離およびそれらの組合せなどである. 本論文では 我々が用いた素性のそれぞれを削除したときの実験結果を示し どの素性がどの程度係り受け解析の精度向上に貢献するかについて考察する. また 学習コーパスの量と解析精度の関係についても考察する. 我々の手法による係り受けの正解率は 一文全体や係り受けを文末から文頭へ向かって決定的に解析した場合 京大コーパスを使用した実験で87.1%と高い精度を示している.This paper describes an analysis of the dependency structure in Japanese based on the maximum entropy models. Japanese dependency structure is usually represented by the relationships between phrasal units called bunsetsu. We assume that the overall dependencies in a sentence can be determined based on the product of the probabilities of all dependencies in a sentence. The probabilities of dependencies between bunsetsus are estimated by a statistical dependency model learned within a maximum entropy framework. This model can be created by learning the features that are useful for predicting the dependency between bunsetsus from the training corpus. We are using information about a bunsetsu itself as features, such as character strings, parts of speech, and inflection types. We are also using information between two bunsetsus as features, such as the existence of brackets or punctuation and the distance between bunsetsus. We compare the performance of our method with and without each feature and discuss the contribution of each feature. And we discuss the effect of the size of the training corpus on the performance of our method. The accuracy of our method for obtaining the dependency of bunsetsus is 87.1% using the Kyoto University corpus when we parse a sentence deterministically from its end to the beginning.
著者
新里 圭司 益子 宗 関根 聡
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.4, pp.1305-1316, 2015-04-15

本稿では商品の使用感を記述した文を商品レビューから抽出する手法について述べる.オンラインショッピングサイトでは,実店舗で買い物するときのように商品に触れたり,試したりしてから購入することができない.そのため,ユーザがいだく商品のイメージと実際に届く商品の間に,質感や食感などの使用感に関して不一致が生じることがあり,顧客満足度低下の原因となっている.購入前のユーザに対して,商品の使用感に関する情報を提供することはオンラインショッピングサイトの普及のために重要である.提案手法は,「オノマトペを含む文に出現しやすい表現は商品の使用感を記述する際に用いられやすい」という仮説に従い,単語とオノマトペのレビュー文中での共起の強さを計算し,得られた語の共起の強さを用いてレビュー中の文が使用感を記述しているかどうか判定する.実験の結果,F1値で65.9ポイントの精度で使用感を記述した文を抽出できることが分かった.This paper describes an automatic methodology for extracting sentences that contain product impressions (the description about "how a purchased product was after obtaining and using it") from review data in an e-commerce site. E-commerce users cannot grasp such information before purchasing the product. This can be regarded as one of the shortcomings of e-commerce. It is important to convey this information to the users in order to prevent them from having a bad shopping experience. First, we investigate product review sentences that contain onomatopoeias, and reveal that these sentences tend to contain product impressions. Through this finding we assume that words frequently co-occurring with onomatopoeias are likely to be used for describing product impressions. According to this assumption, the proposed method calculates scores for given sentences using co-occurrence strength between words and onomatopoeias, and extracts the sentences that exceed a threshold value. The co-occurrence strength for each word is calculated from sentences in product reviews beforehand. The experimental results show that the performance of our method achieves an average F1 score of 65.9 points and that the method outperforms its alternatives.
著者
小林 暁雄 増山 繁 関根 聡
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2597-2609, 2010-12-01

日本語語彙大系や日本語WordNetといったシソーラスは,自然言語処理の分野における様々な研究に利用可能なように構築されている.これらのシソーラスはその精度を保持するために,人手により,よく吟味されて構築されている.このため,新たな語を追加する際にも,よく検討する必要があり,容易に更新することはできない.一方,Wikipediaはだれでも参加・閲覧できるオンラインの百科事典構築プロジェクトであり,日々更新が行われている.日本語版のWikipediaでは,現在100万本以上の項目が収録されており,非常に大規模な百科事典となっている.このWikipediaのもつ膨大な語彙を,既存のシソーラスの名詞意味体系に分類することができれば,非常に大規模な言語オントロジーを構築することができると期待できる.そこで,本研究では,Wikipediaを構成する構造の一つであるカテゴリーを,Wikipediaの記事の冒頭文を使用し,既存の言語オントロジーの意味クラスの分類階層と連結することで,大規模な言語オントロジーを構築する手法を提案する.
著者
福田 美穂 関根 聡
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.30, no.2, pp.800-815, 2023 (Released:2023-06-15)
参考文献数
35

一般ドメインでの固有表現抽出が高い精度を実現するようになった今,研究の目標は化学や医療,金融などさまざまなドメインでの固有表現抽出技術の精緻化へとシフトしている.そこで本論文では,ドメイン依存の固有表現抽出技術応用に関する近年の国内研究動向を報告したい.技術に重点を置いた分析は他文献に譲り,具体的な問題を抱えるさまざまなドメインの読者を念頭に「どのようなドメインでどのような対象に対してどのように固有表現抽出が行われているか」を調査した.4 つの学会大会論文および3つの学会論文誌からドメイン依存の固有表現抽出技術に関する論文を調査したところ,該当する論文のうち約半数が,化学ドメインにおける新規商品開発等支援のための化学物質名・化学物質間関係抽出を主題としていた.その他のドメインは,医療,金融,機械加工,文学,食など多岐にわたり,多様な抽出目的・抽出対象を確認できた.技術的には機械学習を使った手法が主流となっており,とくに本論文の調査期間では BiLSTM-CRF および BERT を使う事例が大勢を占めているが,それらを補完する目的で辞書等の言語資源を組み合わせる手法も多く見られている.
著者
森川 祐介 仁禮 和男 福田 悠貴 関根 聡 松本 裕治 古崎 晃司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2022, no.SWO-056, pp.05, 2022-03-11 (Released:2022-03-24)

The automobile industry is in a VUCA world called "era of revolution once in 100 years". To respond to the VUCA world, development sections require to concentrate human resources on development of future main products and accelerate development. Therefore it is required to manage existing business and ensure the quality of products with fewer human resources than ever before. To resolve this problem we considered to use accumulated knowledge of expert engineers to assist development. A part of the knowledge of expert engineers is that concerning failures occurred during development such as causes and solutions of the failures. A failure ontology proposed in this paper helps to extract the knowledge concerning failures from accumulated documents. In this paper we introduce how to construct the failure ontology and use it.
著者
上村ゼミナール 上村 信幸 小池 真央 遠藤 楓也 新井 崚太 高田 雄太郎 山杢 海 滝澤 樹 東 美菜萌 七尾 玲音 安曽 晃平 吉沢 瞳 関根 聡志
出版者
国士舘大学政経学部附属政治研究所
雑誌
国士舘大学政治研究 (ISSN:18846963)
巻号頁・発行日
no.12, pp.109-126, 2021-03

目 次1 はじめに2 スタディツアーの概要3 スタディツアー初日の活動4 パヤタスでのフィールドワーク5 路上教育フィールドワーク6 むすびにかえて
著者
安藤まや 関根 聡 石崎 俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.98, pp.77-82, 2003-09-29
参考文献数
6
被引用文献数
7

高度な自然言語処理を行なう際には、構文情報のみならずさまざまな語と語の関連情報が重要となってくる。我々は「トマトなどの野菜」といった定型表現を用いて、新聞記事から、名詞の下位概念を自動的に抽出する手法を提案する。7種の定型表現を作成し、6年分の新聞記事をコーパスとして下位概念を抽出した。その結果、ほぼ6割以上の正解率で下位概念が得られた。また、抽出した下位概念と、人間が連想した下位概念との比較をおこない、2人以上の被験者が連想した下位概念のうち、平均85%の下位概念をコーパスから自動抽出することができた。Not only syntactic information but also semantic relationships between words are important in advanced natural language processing. We describe a method to automatically extract hyponyms from newspaper. First, we discover patterns which can extract hyponyms of a noun, such as "A nado-no B (B such as A)", then we apply the patterns to the newspaper corpus to extract instances. The precision is 60-90 percent depending on the patterns. We compare the extracted hyponyms and those associated by human. 85 percent of the words associated by more than 1 person are extracted automatically.
著者
佐藤 里江子 界 義久 関根 聡 東盛 裕一 井上 靖之 首藤 啓三 柳澤 雅弘 山田 泰文 鈴木 安弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EMD, 機構デバイス
巻号頁・発行日
vol.97, no.232, pp.31-36, 1997-08-22

波長変換回路は、将来の光波ネットワークにおける光クロスコネクトや光処理回路等への適用が期待されている。今回、我々はパッシブアライメント技術を用いて、スポットサイズ変換付き半導体アンプ(SS-SOA)アレイをプレーナ光波回路(PLC)プラットフォーム上に搭載し、ハイブリッド集積波長変換モジュールを実現した。パッシブアライメントにおいては、マーカの赤外反射像を多値画像認識処理し自動位置調整を行う。本方法では、赤外反射光を用いることによって観測するマーカのコントラストが向上し、搭載精度の向上が可能である。作製したモジュールでは、低損失(4.2dB)、低駆動電流(<15mA)の波長変換特性を実現した。また、622Mb/sへの信号入出力特性においても良好なアイパターンを確認した。
著者
佐藤 里江子 界 義久 関根 聡 東盛 裕一 井上 靖之 首藤 啓三 柳澤 雅弘 山田 泰文 鈴木 安弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPM, 電子部品・材料
巻号頁・発行日
vol.97, no.234, pp.31-36, 1997-08-22

波長変換回路は、将来の光波ネットワークにおける光クロスコネクトや光処理回路等への適用が期待されている。今回、我々はパッシブアライメント技術を用いて、スポットサイズ変換付き半導体アンプ(SS-SOA)アレイをプレーナ光波回路(PLC)プラットフォーム上に搭載し、ハイブリッド集積波長変換モジュールを実現した。パッシブアライメントにおいては、マーカの赤外反射像を多値画像認識処理し自動位置調整を行う。本方法では、赤外反射光を用いることによって観測するマーカのコントラストが向上し、搭載精度の向上が可能である。作製したモジュールでは、低損失(4.2dB)、低駆動電流(<15mA)の波長変換特性を実現した。また、622Mb/sへの信号入出力特性においても良好なアイパターンを確認した。