著者
近江 龍一 西原 陽子 山西 良典
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

Web上に投稿される情報の中には青少年にとって有害な情報,特に猥褻な意味を持つ言葉は直接記述されず暗喩により表現されることが多い.本研究の目的は暗喩を用いて表現されている有害な文に対してフィルタリングを行うことである.提案手法では有害表現が含まれる文をドメインごとに機械学習し有害表現の分類器を作り,有害表現をフィルタリングする.提案手法の有用性を評価する実験をR-18指定の小説を使い行った.
著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
Japan Society of Kansei Engineering
雑誌
日本感性工学会論文誌 (ISSN:18845258)
巻号頁・発行日
vol.15, no.1, pp.31-37, 2016 (Released:2016-02-26)
参考文献数
16
被引用文献数
1

This paper describes linguistic features of generally unreadable person names, which are defined as “KIRAKIRA names,” and proposes a method to detect KIRAKIRA names based on the features. Through the discussions, the following eight features are founded as the linguistic features of KIRAKIRA names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, KIRAKIRA names are automatically detected by using Support Vector Machine. The experiments to detect KIRAKIRA names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
西原 陽子
出版者
立命館大学
雑誌
若手研究(B)
巻号頁・発行日
2017-04-01

本研究の目的は、ネットいじめに関わる不適切な表現を自動判定する方法を構築し、ネットいじめを減少させることである。本年度は以下の2点を実施した。1点目は、ネット上のいじめに関わる不適切な表現を収集したことである。2点目は、不適切な表現の言語特徴を明らかにし、不適切な表現を自動判定するための言語モデルを作成したことである。1点目の実施の詳細を述べる。ネット上のいじめに関わる不適切な表現が掲載されることが多いWebサイトから、掲載されている文を自動収集するプログラムを作成し、収集を行なった。その後、人手により不適切な表現が含まれる文と、それ以外に分類した。さらに、不適切な表現が含まれる文については4種類に分類した。2点目の実施の詳細を述べる。全ての文に対してその種類を表すラベルを付与した。具体的には不適切な文の4種類に対してと、不適切な表現が含まれない文に対してラベルを付与した。ラベルの系列をLong Short Term Memoryにて学習し、言語モデルを作成した。これにより、文を構成する単語の情報と、文書を構成する文の並びの情報の両方から、次にくる文が不適切な表現を含む文か否かが評価可能となった。今年度の成果の意義は、不適切な表現を含む言語モデルを作成したことにより、隠語や造語を含む不適切な表現の文も判定できるようになったことである。今年度の成果の重要性は、文脈を考慮したことによりある文脈では不適切表現であっても、別の文脈では不適切表現とならないものを判定できる可能性が生まれたことである。
著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
pp.TJSKE-D-15-00030, (Released:2015-10-09)
参考文献数
16
被引用文献数
1 1

This paper describes linguistic features of generally unreadable person names, which are defined as “KIRAKIRA names,” and proposes a method to detect KIRAKIRA names based on the features. Through the discussions, the following eight features are founded as the linguistic features of KIRAKIRA names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, KIRAKIRA names are automatically detected by using Support Vector Machine. The experiments to detect KIRAKIRA names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
Shan Junjie 西原 陽子 山西 良典 福本 淳一
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

近年、アニメを代表とする日本のポップカルチャーが世界中に発展するに従い、日本語を勉強する人が増えている。学習者が増加すると共に、二つの問題が現れる。一つは教材が足りない事。二つ、伝統的な教材にはコミュニケーション能力への訓練が足りない事。 本研究は、豊かな音声や対話を含む日本アニメを新しい日本語勉強素材として、アニメの台詞を日本語各レベルとの内容を合わせ分析し日本語勉強者に向いて活用可能とする。
著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
vol.15, no.1, pp.31-37, 2016
被引用文献数
1

This paper describes linguistic features of generally unreadable person names, which are defined as "<I>KIRAKIRA</I> names," and proposes a method to detect <I>KIRAKIRA</I> names based on the features. Through the discussions, the following eight features are founded as the linguistic features of <I>KIRAKIRA</I> names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, <I>KIRAKIRA</I> names are automatically detected by using Support Vector Machine. The experiments to detect <I>KIRAKIRA</I> names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
山西 良典 鍵田 里沙子 西原 陽子 福本 淳一
出版者
日本感性工学会
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
vol.14, no.1, pp.29-35, 2015 (Released:2015-02-10)
参考文献数
19

This paper proposes a method to detect attractive phrases from musical lyrics. The method considers not only acoustic but also lyrical features which attract human attention. Through the interview on impression for lyrics, we have found that “uniqueness of co-occurred terms” and “repetition” significantly influence human attraction. Therefore, we modeled these linguistic expressions as mathematical features. The proposed method detected attractive phrases using support vector machine with the modeled features. The results of the model evaluation experiments showed the 69% accuracy and 86% precision. Moreover, the results were compared and discussed with the key sentences detected by the existing summarization methods. As the result of comparison, it is confirmed that the proposed method detected attractive phrases more accurate than the existing summarization methods.
著者
山西 良典 大泉 順平 西原 陽子 福本 淳一
出版者
Japan Society of Kansei Engineering
雑誌
日本感性工学会論文誌 (ISSN:18840833)
巻号頁・発行日
2015
被引用文献数
1

This paper describes linguistic features of generally unreadable person names, which are defined as "<I>KIRAKIRA</I> names," and proposes a method to detect <I>KIRAKIRA</I> names based on the features. Through the discussions, the following eight features are founded as the linguistic features of <I>KIRAKIRA</I> names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, <I>KIRAKIRA</I> names are automatically detected by using Support Vector Machine. The experiments to detect <I>KIRAKIRA</I> names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
著者
西原 陽子 砂山 渡
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.51, no.8, pp.1478-1486, 2010-08-15

研究会や国際会議などの研究発表の場を通じて,研究者は聴講者をはじめとする多くの研究者と議論を交わす.発表の場においては数多くの研究発表があり,各聴講者はプログラムに書かれた多くの研究発表の中から,自分の専門分野を中心とした聴講の計画を立てる.しかし研究の発表者にとっては,自分の専門分野に限らないより多くの聴講者を集めることができれば,より多様な意見を得ることが期待できる.このことから,異なる専門分野の聴講者を引きつけられる研究発表のタイトルを作成することが望まれるが,そのような研究発表タイトルの特徴は明らかになっていない.そこで本稿では,専門分野の素人(専門分野が異なる人)に選択されやすい研究発表タイトルを推定する選好タイトル推定システムを提案する.本システムは,研究発表タイトルをその分かりやすさと面白さをもとに,素人による選択のされやすさを評価する.実験の結果,本システムは多くの人に選ばれやすいタイトル中のキーワードを重視する比較システムよりも,高い精度で素人に選ばれやすいタイトルを推定した.
著者
西原 陽子 平塚 義宗 村上 晶 大澤 幸生 熊川 寿郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

我が国では難病に苦しむ人が多数存在する。難病の診断には時間がかかることが多いが、効率的な診断、診断に至る時間の短縮方法については検討が進められていない。特に診断の難しい疾患の場合、正確な診断が得られるまでに多くの病院を渡り歩くようなケースもみられる。患者の視点からも早期に診断がなされることのニーズは大きい。そこで本論文では、難病を早期発見するための新しい診断アプローチについて提案する。
著者
西原 陽子 田中 祐次 大澤 幸生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第23回 (2009)
巻号頁・発行日
pp.2A31, 2009 (Released:2018-07-30)

我々は信頼関係を築くためのコミュニケーションについて研究を進めている。本発表では白血病の患者家族から医療者に寄せられたメール相談のデータを用いて、患者家族と医療者の間に信頼関係が生まれていく様子を分析し、両者の発言の特徴を調査した結果を報告する。
著者
Shan Junjie 西原 陽子 山西 良典 福本 淳一
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2017, pp.4F14, 2017

<p>近年、アニメを代表とする日本のポップカルチャーが世界中に発展するに従い、日本語を勉強する人が増えている。学習者が増加すると共に、二つの問題が現れる。一つは教材が足りない事。二つ、伝統的な教材にはコミュニケーション能力への訓練が足りない事。 本研究は、豊かな音声や対話を含む日本アニメを新しい日本語勉強素材として、アニメの台詞を日本語各レベルとの内容を合わせ分析し日本語勉強者に向いて活用可能とする。</p>
著者
西原 陽子 岩佐 一樹 福本 淳一 山西 良典
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2014, pp.1H4NFC01a3, 2014

<p>spamメールに代表される有害文書のフィルタリングでは、文書内の単語に有害なものがあれば有害文書とする方法が多く提案されている。しかし、ある文書が無害に見える単語だけで構成されていても、特定の文脈では有害文書となることがある。本研究では有害文書として電子掲示板に投稿され他者を誹謗中傷するコメントを取り上げ、誹謗中傷をするコメントを抽出するシステムを提案する。</p>
著者
平岡 誉史 山西 良典 西原 陽子
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

本稿では,コミックのコマの重要度を推定する手法を提案する.提案手法はPage-Rankのアイデアを応用したものであり,コマ同士のリンク関係を用いてコマの重要度を推定する.コマ同士のリンク関係はキャラクターの画像情報や台詞情報などのコマ中に含まれるメタデータをもとに構築される。各コマの重要度はコマのリンク数によって求められる。実際のコミックに対して提案手法を適応し,どのようなコマが高い重要度を持つと推定されるのか検証を行った.また実験結果より提案手法の有用性を検討した.
著者
辻野 雄大 山西 良典 西原 陽子 福本 淳一
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.11, pp.1953-1964, 2018-11-15

ダンスゲームは,幅広いユーザから親しまれている代表的な音楽ゲームの1つである.幅広いユーザがダンスゲームを楽しめる環境を用意するためには,初級者でも容易に遊ぶことができる低難易度の譜面を充実させることが必要である.しかし,低難易度の譜面を作成するためには,楽曲の特徴をとらえつつ容易なリズムに調整するという,高難易度譜面の作成にはない課題が存在する.本稿では,ダンスゲームには同じ曲に対して難易度が異なる複数の譜面が存在することに着目し,難易度が高い譜面から得られる音楽的特徴を入力,難易度が低い譜面を出力とする時系列深層学習モデルを構築した.学習させた提案モデルに高難易度のダンス譜面を入力し,低難易度の譜面において指示符を配置すべき発音タイミングを推定させることで,難易度の自動調整を実現した.性能評価の結果,時刻決定タスクにおいて提案手法は0.693のF値が確認され,既存手法のF値をおおよそ1.8倍上回った.向き選択タスクについて指示符の2-gram出現頻度を集計したところ,提案手法の生成譜面とデータセット内の低難易度譜面との相関係数が0.972となり,人手で作成された低難易度のダンス譜面の特性をとらえた譜面を自動生成可能であることが確認された.
著者
田中 祐次 西原 陽子
出版者
東京女子医科大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2009

いくつかの患者、家族そして医師の間の会話文を解析した。そして、データを分析するためのいくつかのデータマイニングを組み合わせることができる統合環境のプロトタイプを完成させた。
著者
山西 良典 古田 周史 福本 淳一 西原 陽子
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.27, no.1, pp.501-511, 2015
被引用文献数
1

インターネットの発展に伴って普及したWebレビューには,有用な情報が含まれている一方で不要な情報も含まれている.そのため,対象の評価視点および評価視点間の関係を捉えることは難しく,レビュー全文を閲覧することはユーザにとって大きな負担となる.本稿では,自由記述形式のレビューにおける評価視点とその評価視点間の関係が不明瞭という問題点を,レビュー構造の俯瞰によって解決可能であると考えた.提案手法では,評価視点の出現頻度とレビュー中の構文特徴を用いることで,レビュー構造の俯瞰に有用な呈示評価視点として,頻出の評価視点と頻出する評価視点に意味的に関連した評価視点を採択する.評価視点抽出実験の結果,評価対象の種別によらず,採択された呈示評価視点には高い適合率が確認された.そして,呈示評価視点採択時に用いた構文特徴を参照することで,獲得する評価視点間の関係の呈示を実現した.