著者
江原 遥 田中 久美子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.15, no.5, pp.151-167, 2008-10-10 (Released:2011-03-01)
参考文献数
14

近年, 国際化に伴い, 多くの言語を頻繁に切り替えて入力する機会が増えている.既存のテキスト入力システムにおいては, 言語が切り替わるたびに, ユーザーが手動で, テキスト入力ソフトウェア (IME) を切り替えなければならない点が, ユーザーにとって負担になっていた.この問題を解決するために, 本論文では, 多言語を入力する際にユーザーの負担を軽減するシステム, TypeAnyを提案する.TypeAnyは, ユーザーが行うキー入力からユーザーが入力しようとしている言語を判別して, IMEの切り替えを自動で行う.これによって, ユーザーがIMEを切り替える操作量が減るため, 複数の言語をスムーズに切り替えながら入力することが可能になる.本研究では, 隠れマルコフモデルを用いて言語の判別をモデル化し, モデルにおける確率をPPM法を用いて推定することでTypeAnyを実装し, その有用性を評価した.その結果, 人工的なコーパスにおける3言語間の判別において, 96.7%の判別精度を得た.また, 実際に多言語を含む文書を用いて実験したところ, 切り替えに必要な操作の数が, 既存の手法に比べて93%減少した.
著者
江原 遥
出版者
東京学芸大学
雑誌
基盤研究(C)
巻号頁・発行日
2022-04-01

Webの発達等により、特に英語では幅広い解説テキストが入手可能になり、これらで学習者の知識を拡充する機会が増えている。こうしたテキストを入力とし、テキストのどの部分が学習者にとってどの程度難しいか(リーダビリティ)を自動判定する技術は、教材推薦や自動作問など様々な学習支援の応用の基盤技術である。しかし、従来のリーダビリティ判定技術は「表現の難しさ」の判定が中心であった。本研究提案では、「表現の難しさ」に加えて、深層機械学習により文脈や意味を考慮することで、テキストの「知識の難しさ」をも判定できるリーダビリティ判定技術を研究する。
著者
江原 遥
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.2D1GS902, 2020 (Released:2020-06-19)

外国語学習において、語彙学習は時間的コストが高いうえ、読解力をはじめとする全般的な語学力と相関が高い。語彙学習の支援においては、学習者が適切な語の使い方を学べるよう、ある語が母語話者の作文や発話を集めたコーパス中でどのような使われ方をしているか、語の用例(コーパス中の出現)を提示したいニーズがある。この時、単にコーパス中の当該単語の出現箇所を羅列するのではなく、多義語については語義を考慮し、類似した語義はまとめ、さらに、覚えるべき主要な出現と例外的な出現を分けて提示してくれると、より語彙学習に有用であると思われる。しかし、このように、語の出現ごとに語義を付与したり、覚えるべきかどうかを判定する作業を、人手で行うことは、アノテーションコストが高すぎて非現実的である。そこで、本研究では、文脈化単語埋め込み(BERT)と教師なし深層異常検知に基づき、人手のアノテーション情報なしで、こうした語彙学習に有用な用例情報を提示する手法を提案する。
著者
江原 遥 馬場 雪乃 内山 将夫 隅田 英一郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

クラウドソーシング上の翻訳で高品質な訳を得るためには,同一文を複数の翻訳者に発注する必要がある.本研究では,高品質な訳が見込まれる翻訳者に優先的に作業を発注するため,翻訳品質を翻訳前に予測するモデルを提案する.提案モデルは言語テスト理論に基づき,原文中の単語を用いた単語テストを通じて翻訳者の語彙力を推定し予測に活用する.実験の結果,翻訳品質の予測精度と正しい訳文を得るまでの発注数が有意に改善した.
著者
江原 遥 田中 久美子
出版者
言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.15, no.5, pp.151-167, 2008-10

近年,国際化に伴い,多くの言語を頻繁に切り替えて入力する機会が増えている.既存のテキスト入力システムにおいては,言語が切り替わるたびに,ユーザーが手動で,テキスト入力ソフトウェア(IME)を切り替えなければならない点が,ユーザーにとって負担になっていた.この問題を解決するために,本論文では,多言語を入力する際にユーザーの負担を軽減するシステム,TypeAnyを提案する.TypeAnyは,ユーザーが行うキー入力からユーザーが入力しようとしている言語を判別して,IMEの切り替えを自動で行う.これによって,ユーザーがIMEを切り替える操作量が減るため,複数の言語をスムーズに切り替えながら入力することが可能になる.本研究では,隠れマルコフモデルを用いて言語の判別をモデル化し,モデルにおける確率をppM法を用いて推定することでTypeAnyを実装し,その有用性を評価した.その結果,人工的なコーパスにおける3言語間の判別において,96.7% の判別精度を得た.また,実際に多言語を含む文書を用いて実験したところ,切り替えに必要な操作の数が,既存の手法に比べて93%減少した