著者
相田 慎 新堂 安孝 内山 将夫
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.20, no.3, pp.405-422, 2013-06-14 (Released:2013-09-14)
参考文献数
46
被引用文献数
1

東日本大震災初期,Twitter に寄せられた膨大なツィートには,緊急性の高い救助要請候補が多数含まれていたものの,他の震災関連ツィートや「善意のリツィート」によって,通報されるべき情報が埋もれてしまった.この様な状況を解消するために,筆者らは 2011 年 3 月 16 日,Twitter 上の救助要請情報をテキストフィルタリングで抽出し,類似文を一つにまとめ一覧表示する Webサイトを開発・公開した.本論文では,本サイト技術のみならず,通報支援活動プロジェクト #99japan との具体的な連携・活用事例についても詳述する.なお #99japan は,救助状況の進捗・完了報告を重視する Twitter を用いた活動であると共に,発災 2 時間後に 2 ちゃんねる臨時地震板ボランティアらによって立ち上げられたスレッドに由来する.
著者
西垣 知佳子 中條 清美 内山 将夫 隅田 英一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.109, no.297, pp.35-38, 2009-11-14

iPhoneとiPod touchをインターフェイスとする英語語彙学習用教材の開発を行った。iPhoneとiPod touchは発売以来急速に普及し,大学での英語学習への活用も始まっている。開発した語彙学習教材は,学校英語教科書で取り扱われることが少ないために,日本人英語学習者に不足している生活語彙を補強するための教材である。教材は1)コーパス言語学の手法を使って客観的に選定された生活語彙を学ぶことができる,2)教材に採用された指導法は指導実践を経て,指導効果が高いことが確認されている,3)初級学習者から上級学習者まで,また子どもから成人まで様々なレベルの学習者が活用できるという特徴を持つ。
著者
松田 繁樹 林 輝昭 葦苅 豊 志賀 芳則 柏岡 秀紀 安田 圭志 大熊 英男 内山 将夫 隅田 英一郎 河井 恒 中村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.96, no.10, pp.2549-2561, 2013-10-01

本論文では,独立行政法人情報通信研究機構(NICT)が開発した世界初のスマートフォン用多言語音声翻訳アプリケーション"VoiceTra"を用いた大規模実証実験に関して,VoiceTraシステムの概要,クライアントサーバ間の通信プロトコル,本システムで用いられた多言語音声認識,多言語翻訳,多言語音声合成の詳細を述べる.また,本実証実験中に収集された約1000万の実利用音声データの一部について,聴取による利用形態の分析,更に,実験期間中に行った音声認識用音響モデル,言語モデルの教師無し適応,言語翻訳用辞書の追加に対する音声認識,音声翻訳性能の改善について述べる.
著者
村田 真樹 内山 将夫 井佐原 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.11, pp.181-188, 2000-01-27
参考文献数
19
被引用文献数
38

質問応答システムの研究は,TREC8やAAAIにおいても重要な問題として位置づけられている.本研究では,自然言語で書かれた知識データと質問文を,類似度に基づいて照合することにより,全自動で解を取り出すシステムを作成した.このシステムの有効性を確かめるために,TREC8のホームページや英検の問題から取ったサンプルデータで実験したところ,良好な結果を得た.Research on question-answering systems is now considered to be extremely important in TREC8 and AAAI. In this paper, we constructed a question answering system which matches a question with knowledge-based data written in natural language and automatically selects the answer. We tested this system using sample data taken from TREC8's homepages and Eiken textbooks, and obtained good results.
著者
山本 英子 内山 将夫 井佐原 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.104, pp.101-106, 2002-11-12

本研究では,文字認識の分野で用いられている補完類似度をテキストコーパスから事物間の関係を推定する問題に適用する際に,事物が持つ各文書における頻度を考慮した場合を考える.補完類似度は,ベクトルで表された文字の画像パターンの類似度を測ることによって劣化印刷文字を認識するために経験的に開発された尺度である.この扱うベクトルをコーパス中の事物の出現パターンに置き換えると,補完類似度は事物間関係の推定に適用できる.そこで,これまでに二値ベクトルを対象として事物間関係の推定を行った.しかし,二値ベクトルでは,Document Frequency しか考慮しておらず,Term Frequency(文書内頻度)を考慮していない.そこで,Term Frequencyを考慮した多値ベクトルを対象とした補完類似度を用いて事物間関係の推定を行った.その結果,Term Frequencyを考慮した補完類似度のほうが推定能力が高かったことを報告する.In this paper, we applied CSM (Complementary Similarity Measure) considering term frequency to estimate relationship between entities. Here, term frequency is times that certain entity appears in a document. CSM was developed experientially for robust character recognition. This measures inclusion degree of vectors expressing character image pattern. We have even estimated relationship between entities by replacing the image pattern to occurrence pattern of entity in corpus. However, we have considered only document frequency and have not considered term frequency. From experimental results, we reported that CSM considering term frequency obtained higher performance than original CSM.
著者
江原 遥 馬場 雪乃 内山 将夫 隅田 英一郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

クラウドソーシング上の翻訳で高品質な訳を得るためには,同一文を複数の翻訳者に発注する必要がある.本研究では,高品質な訳が見込まれる翻訳者に優先的に作業を発注するため,翻訳品質を翻訳前に予測するモデルを提案する.提案モデルは言語テスト理論に基づき,原文中の単語を用いた単語テストを通じて翻訳者の語彙力を推定し予測に活用する.実験の結果,翻訳品質の予測精度と正しい訳文を得るまでの発注数が有意に改善した.
著者
小作 浩美 内山 将夫 井佐原 均 河野 恭之 木戸出 正継
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.19, no.4, pp.225-233, 2004 (Released:2004-05-07)
参考文献数
15
被引用文献数
3 4

We have been developed a support system to interactively search certain articles of users' interest on the World Wide Web (WWW) without their hesitating over query choices. Especially we have been implementing an effective application system to enable tourists to easily find special event information of their interest and to enjoy their own tours. This system also enables developers of each system to provide them with the means of easily constructing an initial database and automatically updating it. As events are generally held cyclically, we have assumed events or keywords related to the events will appear in each term. If we can extract keywords that appear cyclically in a corpus including date information, we can obtain event keywords easily. The system can extract event information using the event keywords as queries for WWW information retrieval systems, and update the database automatically. In this paper, we introduce our support system with a focus on a concept to extract event keywords and event information through the appearance of keywords periodically. We found our approach effective by some experiments.
著者
越川 満 内山 将夫 梅谷 俊治 松井 知己 山本 幹雄
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.51, no.8, pp.1443-1451, 2010-08-15

フレーズベース統計的機械翻訳では,連続する単語列(フレーズ)を翻訳の最小単位とした確率的規則に基づいて翻訳候補の順位付けを行い,最も確率の高い候補を出力とする.しかし,入力文のフレーズ区切りや翻訳前後の訳語関係(フレーズ対応)の組合せ数は膨大である.そのため,従来の統計的機械翻訳システムは,翻訳候補およびフレーズ区切り・対応に対して大胆な近似を行うことで探索空間を狭めており,厳密な確率の最大化をしていない.本稿では,フレーズ対応・区切りに関する厳密な確率最大化を行う問題を,フレーズベース翻訳において広く用いられているすべての素性を考慮可能な形式で整数線形計画問題として定式化し,それを翻訳候補のリランキングに応用する手法を提案・実装する.評価実験の結果,提案手法は有意に翻訳精度を改善することが示されると同時に,フレーズベース翻訳における探索の課題は,フレーズ対応ではなく翻訳候補文についてより多くの候補を評価することにあるという示唆が得られた.
著者
中條 清美 西垣 知佳子 内山 将夫 内堀 朝子 西垣 知佳子 内山 将夫 内堀 朝子
出版者
日本大学
雑誌
基盤研究(C)
巻号頁・発行日
2007

日英パラレルコーパスを利用した英語指導法と教材開発を行い, 指導実践によってそれらの学習効果を検証した。さらに, コーパス検索サイトの開発を推進した。主な研究成果を国際学会(AsiaTEFL国際会議, 台湾教育学会, TaLC, World CALL)および国内学会(JACET, 英語コーパス学会)において報告し, 開発した指導法等の詳細を公刊した。本課題に関する論文を掲載した著書がRodopi(アムステルダム)と松柏社(東京)より出版された。研究代表者は本課題に関連して2008年度英語コーパス学会賞を受賞した。
著者
影浦 峡 阿辺川 武 内山 将夫 佐藤 理史 宇津呂 武仁 竹内 孔一 相澤 彰子 戸田 愼一
出版者
東京大学
雑誌
基盤研究(A)
巻号頁・発行日
2009

(1) レファレンス・ツールにおける「包括性」の概念および包括性を 実現するための要件を明らかにした。(2) 専門語彙クローラーと対訳・関連多言語アーカイヴ クローラーを開発し、機能的包括性を有するレファレンス情報資源を構築した。(3) 翻訳情報 資源を提供する統合翻訳支援サイト「みんなの翻訳」(http://trans-aid.jp/)を開発・公開し、 一般利用に提供し翻訳情報資源の有効性を検証した。
著者
西垣 知佳子 中條 清美 砂岡 和子 隅田 英一郎 内山 将夫 徳井 厚子
出版者
千葉大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

グローバル化の進展に伴い,世界の外国語教育は多様化の方向に進んでいる。本研究では多言語教育のための語彙学習教材の開発を行った。研究成果として,1)ペーパー版の英語語彙学習教材を開発し,試用効果を小・中学校で検証した,2)英語教材をもとに中国語,韓国語,日本語学習のためのペーパー版語彙学習教材を作成した,3)ペーパー版教材の成果を踏まえ,iOSを使ってモバイル英語語彙学習教材を開発し,Apple Storeにて公開した。
著者
内山 将夫 井佐原 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.43, no.9, pp.1-14, 2002-09-15

近似文字列照合による全文検索では,入力パターンと一定以下の編集距離にある部分テキストすべてをテキストから検索する.近似文字列照合による全文検索は,テキストを接尾辞トライにより索引付けし,それを利用して検索することにより実現できる.しかし,接尾辞トライの占める空間領域は大きいため,接尾辞配列を索引として利用することもある.接尾辞配列を索引として利用する場合には,従来研究では,接尾辞トライ上での探索を接尾辞配列上での2分探索により模擬している.それに対して,本稿では,2分探索ではなく,補助的な配列を用いることにより,高速に,接尾辞トライ上での探索を模擬することができる手法を提案した.さらに,2分探索による方法を利用した場合と提案手法を利用した場合とにおける検索速度を実験的に測定し,提案手法の方が検索速度が速いことを示した.Given a text and an input pattern, the goal of full-text approximate string matching is to search for all parts of the text that match the pattern. Full-text approximate string matching can be performed using a suffix trie as an index of the text. A suffix trie, however, is relatively large. So, a suffix array, which is a compact representation of a suffix trie, is often used to simulate searches on a suffix trie. A binary search algorithm is used to search the array. A method is described in this paper that uses an auxiliary array to simulate searches on a suffix trie. The method does not use a binary search algorithm so that it can perform a faster simulation. Experiments showed that the proposed method is faster than one using a binary search algorithm.