著者
神 雄太 西山 亮 小金井 雄太 木村 大輝 青山 純也 中野 容 今井 俊一 下河原 達也 山田 暢 江川 智久
出版者
一般社団法人 日本肝臓学会
雑誌
肝臓 (ISSN:04514203)
巻号頁・発行日
vol.64, no.12, pp.641-648, 2023-12-01 (Released:2023-12-11)
参考文献数
25

50代男性.未治療B型慢性肝炎の既往があり,人間ドックで肝腫瘤を指摘され,精査の結果肝細胞癌(Hepatocellular carcinoma:HCC)の診断に至った.病変はS8に2カ所あり,開腹肝前区域切除を行い,病理組織診断でvp2を認めた.術後2カ月で施行した造影CT検査で門脈左枝に門脈腫瘍栓(Portal vein tumor thrombosis:PVTT)を認めた.術後早期再発したPVTTであり再肝切除後の再発のリスクが高いと考え,観察期間を設けるためLenvatinib(LEN)投与を開始した.PVTTは放射線定位照射したが,術後9カ月に肝右葉微小転移が指摘された.LEN投与下にPVTTと微小転移は増悪を認めず,AFP値が正常化したため,再発後11カ月で再肝切除を行った.その後,微小転移に対してサイバーナイフを施行し完全寛解した.現在,初回術後43カ月無再発生存中である.
著者
三村 正人 河原 達也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.30, no.1, pp.88-124, 2023 (Released:2023-03-15)
参考文献数
55

従来の音声認識システムは,入力音声に現れるすべての単語を忠実に再現するように設計されているため,認識精度が高いときでも,人間にとって読みやすい文を出力するとは限らない.これに対して,本研究では,フィラーや言い誤りの削除,句読点や脱落した助詞の挿入,また口語的な表現の修正など,適宜必要な編集を行いながら,音声から直接可読性の高い書き言葉スタイルの文を出力する新しい音声認識のアプローチについて述べる.我々はこのアプローチを単一のニューラルネットワークを用いた音声から書き言葉への end-to-end 変換として定式化する.また,音声に忠実な書き起こしを疑似的に復元し,end-to-end モデルの学習を補助する手法と,句読点位置を手がかりとした新しい音声区分化手法も併せて提案する.700 時間の衆議院審議音声を用いた評価実験により,提案手法は音声認識とテキストベースの話し言葉スタイル変換を組み合わせたカスケード型のアプローチより高精度かつ高速に書き言葉を生成できることを示す.さらに,国会会議録作成時に編集者が行う修正作業を分類・整理し,これらについて提案システムの達成度と誤り傾向の分析を行う.
著者
河原 達也
雑誌
情報処理
巻号頁・発行日
vol.63, no.2, pp.77-78, 2022-01-15

高等学校で「情報I」が2022年度から必修化されることとなり,さらにその3年後から大学入試共通テストに導入されることが決定された.その意義と期待について,入学者選抜の観点,大学の情報教育の観点,および初等中等情報教育充実の観点から述べる.
著者
山本 賢太 井上 昂治 河原 達也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 93回 (2021/11) (ISSN:09185682)
巻号頁・発行日
pp.09-14, 2021-11-20 (Released:2021-11-20)

ロボットなどの音声対話システムにおいて人間らしい対話を実現するために重要な要素としてキャラクタ表現がある.状況やユーザに応じてキャラクタを使い分けることで,ユーザの対話に対する満足感が向上することが期待される.先行研究では,システムのキャラクタは事前に設定されている.本研究では,ユーザのパーソナリティに応じてシステムのキャラクタを使い分けるユーザ適応の実現を目指す.キャラクタはパーソナリティ尺度を用いて定義する.はじめに,WOZ法で収録したロボットと人間との1対1対話のデータに対する印象評定実験を実施した.対話動画を視聴して,ロボットと人間に対してそれぞれのパーソナリティと両者の相性の印象評定をしてもらった.パーソナリティの評定結果をクラスタリングし,分類結果と相性評定結果との関係を分析した.その結果,ユーザのパーソナリティに対して相性のよいキャラクタの組み合わせがいくつか確認された.
著者
笹田 鉄郎 森 信介 山肩 洋子 前田 浩邦 河原 達也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.22, no.2, pp.107-131, 2015-06-16 (Released:2015-09-16)
参考文献数
32
被引用文献数
2 5

自然言語処理において,単語認識(形態素解析や品詞推定など)の次に実用化可能な課題は,ある課題において重要な用語の認識であろう.この際の重要な用語は,一般に単語列であり,多くの応用においてそれらに種別がある.一般的な例は,新聞記事における情報抽出を主たる目的とした固有表現であり,人名や組織名,金額などの 7 つか 8 つの種別(固有表現クラス)が定義されている.この重要な用語の定義は,自然言語処理の課題に大きく依存する.我々はこの課題をレシピ(調理手順の文章)に対する用語抽出として,レシピ中に出現する重要な用語を定義し,実際にコーパスに対してアノテーションし,実用的な精度の自動認識器を構築する過程について述べる.その応用として,単純なキーワード照合を超える知的な検索や,映像と言語表現のマッチングによるシンボルグラウンディングを想定している.このような背景の下,本論文では,レシピ用語タグセットの定義と,実際に行ったアノテーションについて議論する.また,レシピ用語の自動認識の結果を提示し,必要となるアノテーション量の見通しを示す.
著者
松浦 孝平 三村 正人 河原 達也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.3, pp.824-846, 2021 (Released:2021-09-15)
参考文献数
49

本稿では,アイヌ民話(ウウェペケㇾ)の音声認識に関する我々の取り組みについて述べる.まず,2 つの博物館から提供されたアイヌ語アーカイブのデータを元に,沙流方言を対象としたアイヌ語音声コーパスを構築した.次に,このコーパスを用いて注意機構モデルに基づく音声認識システムを構成し,音素・音節・ワードピース・単語の 4 つの認識単位について検討した.その結果,音節単位での音声認識精度が最も高くなることがわかり,話者クローズド条件と話者オープン条件のそれぞれについて,音素認識精度で 93.7% と 86.2%,単語認識精度で 78.3% と 61.4% を実現した.音声認識精度が話者オープン条件において大幅に低下する問題に対して,CycleGAN を用いた教師なし話者適応を提案した.これは,学習データ内の話者の音声から認識対象話者の音声への写像を CycleGAN に学習させ,学習データ内の音声を全て認識対象話者風の音声に変換するものである.本手法によって最大で相対 60.6% の音素誤り率の改善を得た.さらに,日本語とアイヌ語が混合した音声における言語識別についても検討を行い,音素認識と単語認識を用いた構成で一定の識別性能を達成できることを示した.
著者
石田 真也 井上 昂治 中村 静 高梨 克也 河原 達也
雑誌
第79回全国大会講演論文集
巻号頁・発行日
vol.2017, no.1, pp.239-240, 2017-03-16

本稿では,傾聴対話システムにおける多様な応答の種類の選択や内容について述べる.近年,人間がロボットやエージェントと対話する機会が増えており,その中でも人間と自然な雑談を行えるシステムの研究が盛んである.本研究では,より自然な傾聴対話システムを構築するため,音声状態のユーザの発話を入力として,それに対する「掘り下げ質問」,「繰り返し応答」,「語彙的応答」,「自分語り」,「評価応答」の全ての応答を生成し,そのうちから文脈や先行発話の特徴を基に,統計的に適切な応答を1つ選択し,出力するシステムを提案する.
著者
河原 達也 筧 捷彦 和田 勉 久野 靖 辰己 丈夫
出版者
情報処理学会 ; 1960-
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.57, no.3, pp.270-277, 2016-02-15

2015年8月末,本会の元会長であり,現在は日本学術振興会理事長である安西祐一郎先生へのインタビューが行われた.安西先生は,現在は文部科学省に設置された高大接続システム改革会議の座長である.本会からは,河原達也(教育担当理事/京都大学),筧捷彦(教育委員会委員長/早稲田大学),和田勉(初等中等教育委員長/長野大学),久野靖(会誌編集委員/筑波大学),辰己丈夫(会誌編集委員/放送大学),および事務局から後路が参加した.
著者
井上 昂治 原 康平 ララ ディベッシュ 中村 静 高梨 克也 河原 達也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.5, pp.D-K43_1-10, 2020-09-01 (Released:2020-09-01)
参考文献数
32

A spoken dialogue system that plays the role of an interviewer for job interviews is presented. In this work, ourgoal is to implement an automated job interview system where candidates can use it as practice before the real interview.Conventional job interview systems ask only pre-defined questions, which make the dialogue monotonous andfar from human-human interviews. We propose follow-up question generation based on the assessment of candidateresponses and keyword extraction. This model was integrated into the dialogue system of the autonomous androidERICA to conduct subject experiments. The proposed job interview system was compared with the baseline systemthat did not generate any follow-up questions and selected among pre-defined questions. The experimental resultsshow that the proposed system is significantly better in subjective evaluations regarding impressions of job interviewpractice, the quality of questions, and the presence of the interviewer.
著者
李 清宰 河原 達也 Rudnicky Alexander
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2011-SLP-87, no.9, pp.1-6, 2011-07-14

Amazon Mechanical Turk (MTurk) を用いて効率的に音声データを収集する方法について述べる。音声検索の評価用セットのための音声データを収集するタスク (HIT)、及び収集されたデータの品質を検証するタスクを設計した。1000 以上の発話をきわめて効率的に収集することができた。そのうち 90% 以上は正しい書き起こしがある有用なデータであり、妥当な音声認識精度が得られた。このデータを用いて、音声により書籍を検索するシステムの評価を行った。その結果、意味スロット毎に用意したベクトル空間モデルを組み合わせる提案手法が、従来の単純なベクトル空間モデルに比べて、高い検索性能を実現することを確認した。
著者
駒谷 和範 上野 晋一 河原 達也 奥乃 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.75, pp.59-64, 2003-07-18
参考文献数
12
被引用文献数
7

各ユーザに応じた協調的な応答を行うユーザモデルについて述べ,これを実装した音声対話システムの評価実験について報告する.従来のユーザモデルの研究では,ユーザの知識に重点を置いたものや典型的なユーザを想定したものがあるが,我々はより包括的なユーザモデルを提案する.具体的には,システムに対する習熟度,ドメインに関する知識レベル,性急度の3つの次元を定義する。これらのモデルは,決定木学習により自動的に得ることができる.実際の対話データを用いたユーザモデルの判別実験では,3つの次元それぞれに対して妥当な判別制度を得た.これらのユーザモデルに基づく対話戦略を,我々の研究室で開発している京都市バス運行情報案内システムに実装した.評価実験により,各ユーザに適応した協調的応答が,熟練したユーザに対する対話時間を増加させることなく,初心者に対して適切なガイダンスとなることが示された.We address appropriate user modeling in order to generate cooperative responses to each user in spoken dialogue systems. Unlike previous studies that focus on user's knowledge or typical kinds of users, the user model we propose is more comprehensive. Specifically, we set up three dimensions of user models: skill level to the system, knowledge level on the target domain and the degree of hastiness. Moreover, the models are automatically derived by decision tree learning using real dialogue data collected by the system. We obtained reasonable classification accuracy for all dimensions. Dialogue strategies based on the user modeling are implemented in Kyoto city bus information system that has been developed at our laboratory. Experimental evaluation shows that the cooperative responses adaptive to individual users serve as good guidance for novice users without increasing the dialogue duration for skilled users.
著者
根本 雄介 秋田 祐哉 河原 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.73, pp.63-68, 2006-07-08
被引用文献数
6

広範な話題からなる会議音声を話題単位に自動分割し,得られた話題ごとに単語辞書と言語モデルの適応を行う手法を提案する.音声認識結果に対してPLSA(Probabilistic Latent Semantic Analysis)を適用して,話題を表す特徴ベクトルに変換し,その類似度に基づいて話題分割を行う.そして,話題ごとに類似したテキストを収集して,単語辞書を更新するとともにN-gram 言語モデルの適応を行う.衆議院予算委員会の音声で評価を行った結果,提案手法により単語辞書・言語モデルの適応を行うことで,ベースラインから未知語率を約25%,テストセットパープレキシティを約9%削減することができた.We address a vocabulary and language model adaptation method based on topic segmentation of meetings that include various topics. The ASR result is segmented based on the similarity among the feature vectors that were extracted with PLSA (Probabilistic Latent Semantic Analysis). The relevant texts (newspaper articles) for each topic segment are retrieved. The vocabulary and N-gram language model are updated with this retrieved texts. Experimental evaluation on a meeting of the Lower House Budget Committee showed that the proposed model adaptation based on topic segmentation reduced the test-set OOV rate and perplexity.
著者
河原 達也
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.43, no.1, pp.85-105, 2016 (Released:2016-09-09)
参考文献数
33

Advertising investment risk has become high due to the explosive information increase and the commoditization evolution. In order to reduce such risk, it is important to understand the relation between advertising elements and consumer responses, and apply the knowledge to decision making process of advertising production. There have been lots of efforts to develop a set of scales to measure the advertising perceptions and relate it to the consumer responses. However, that is not adequate when we assume to support the actual practices of the advertising production. Although the advertising perceptions are helpful to understand the reasons of the consumer responses, they don't directly lead the way to the advertising production.In this study, we analyze the effects of 28 elements of TV advertisements on the advertising perceptions and the consumer responses. The elements adopted in this study are controllable by advertisers so that they can apply the research findings to the advertising production. Empirical analyses using a dataset of the advertising perceptions and the consumer responses to more than 800 TV advertisements clarified not only the important advertising elements which had high impacts on the consumer responses but also how and why they affect consumer responses. Simultaneously, simulation of the consumer responses using random forests was found to be helpful to explore the effective combination of the advertising elements.
著者
翠 輝久 河原 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.73, pp.69-74, 2006-07-08
参考文献数
5
被引用文献数
7

音声が主要なモダリティである環境において,自然言語で記述された文書を知識源として,インタラクティブにユーザに情報を提供する枠組みを提案する.これは,音声ガイドのように,システム側から一方的に情報を提示するのではなく,ユーザ・システム双方が対話の主導権をとりながら,対話的に情報検索・提示するものである.そのために,ユーザ主導の検索・質問応答(pull)モードと,システム主導の提示(push)モードを用意して,ユーザの状態に応じてこれらを切り替える.検索・質問応答モードでは,漠然とした検索要求のみではなく,特定の情報・事実を求める質問応答機能も実現する.また,提示モードにおいてシステム側から,ユーザにとって有用な話題を知識ベースの中から動的に選択して(質問形式を含めて)提示する.以上の枠組みを京都の観光案内システムとして実装し,京都大学博物館の企画展示において運用を行っている.We propose a speech-based interactive guidance system based on document retrieval and presentation. Unlike conventional audio guidance systems, we prepare two modes of information retrieval (pull mode) and presentations (push mode), and switch them according to the user's state. In the information retrieval mode, the user can ask questions about specific facts in the documents. In the presentation mode, the system actively provides information the user would be interested in. The system was implemented as a sightseeing guidance system and is running since June 2006 at the special exhibition of the Kyoto University Museum.
著者
伊藤亮介 駒谷 和範 河原 達也 奥乃 博
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2003, no.14(2002-SLP-045), pp.107-112, 2003-02-07

ロボットとの音声対話をより円滑にするためには,言語的情報だけでなく話者の心的状態感情を取り扱う必要がある.本研究では,親近感,喜び,困惑の感情を対象として,WOZ 方式によって収集された子供とロボットとのリアルな対話データを用いて,韻律的特徴に基づく分析・判別を行う.特に,対話であるという状況を考慮して,それらの特徴量の発話ごとの変化量や,発話間の時間間隔を利用する.これにより,事前学習を必要としないリアルタイムな判別を可能にする.判別にはSVM 及びC により学習した決定木を用い,困惑で,喜びで,親近感での判別精度を得た.この感情判別を導入した音声対話機能を実ロボットRobovie に実装し,動作の確認を行った.