著者
今村 賢治 越前谷 博 江原 暉将 後藤 功雄 須藤 克仁 園尾 聡 綱川 隆司 中澤 敏明 二宮 崇 王 向莉
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.29, no.3, pp.925-985, 2022 (Released:2022-09-15)
参考文献数
203

本解説論文では,特許を対象とした機械翻訳における種々の課題に対する関連技術の解説を行う.特許に対する機械翻訳は実用的にも学術的にも長い歴史を持つが,ニューラル機械翻訳の登場で新たな段階に進んできたと言える.そうした動向を踏まえ,訳抜け・過剰訳への対策,用語訳の統一,長文対策,低リソース言語対対策,評価,翻訳の高速化・省メモリ化,の6項目に分けて近年の関連技術を紹介し,今後の方向性を論じる.
著者
グプタ ビィシュウ 中村 亮裕 福田 治輝 綱川 隆司 狩野 芳伸 西田 昌史 西村 雅史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回 (2018)
巻号頁・発行日
pp.4Pin125, 2018 (Released:2018-07-30)

ニューラル機械翻訳モデルでは扱える語彙サイズに制約があり、この課題に対処する方法としてサブワード単位、文字単位、あるいはバイト単位で処理する方法が提案されている。一方、日本語においては文字単位に分割しても漢字のバリエーションが多いために語彙サイズは比較的大きくなる。本研究では日本語テキストに対して漢字分解を適用することで語彙サイズの低減と漢字情報の維持を両立させることを目指すニューラル機械翻訳手法を提案し、評価実験を行った。
著者
小谷 亮太 綱川 隆司 西田 昌史 西村 雅史
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.2, pp.306-314, 2018-02-15

本稿では,日本語文書中の語句に,Wikipedia記事へのリンクを付与するwikificationタスクにおいて,リンク付与に値する重要な語句等を選択するアンカー抽出器について検討を行う.本研究ではWikipediaにおけるリンクのガイドラインに準じたアンカー抽出基準をベースに,文書に適度にリンクを付与してWikipedia記事と結び付けることにより,文書の理解の可能性を高めることをねらいとする.日本語におけるアンカー抽出に有効と考えられる素性として,アンカーの前接語・後接語との関係をとらえた素性,および共起するアンカーの条件付きkeyphraseness素性の利用を提案する.また,一般的な日本語文書に対するアンカー抽出器の性能評価を行うため,日本語Wikificationコーパスに対して本研究で定めたアンカー抽出基準に従ってアンカー抽出作業を行い,評価用コーパスを構築した.評価実験により,提案した素性を既存手法に加えることで性能が改善することが示された.また,評価用コーパスを用いた実験では,正解率においてアンカー抽出作業者の2者間一致率の平均と同程度の性能が得られていることを確認した.
著者
永尾 眞 福島 清 曽根 巨充 藤井 裕彦 松葉 裕 綱川 隆司 東間 敬造 萱島 敬
出版者
一般社団法人日本建築学会
雑誌
日本建築学会技術報告集 (ISSN:13419463)
巻号頁・発行日
no.21, pp.373-377, 2005-06-20
被引用文献数
6

Recently in the construction industry rationalization in production systems are aimed at in order to improve the cost competitiveness. This time, we could get the chance of controlling the cost in early stages of design process. In the conventional procedure, the cost estimate is done in two stages consisting of preliminary estimate and detailed estimate later resulting in reconsideration of design in order to match with the budget. Using 3D-CAD we could do the estimate in each step of design and fit into the budget.
著者
辻井 潤一 米澤 明憲 田浦 健次朗 宮尾 祐介 松崎 拓也 狩野 芳伸 大田 朋子 SAETRE Rune 柴田 剛志 三輪 誠 PYYSALO SAMPO Mikael 金 進東 SAGAE Kenji SAGAE T. Alicia 王 向莉 綱川 隆司 原 忠義
出版者
東京大学
雑誌
特別推進研究
巻号頁・発行日
2006

本研究は、文解析研究で成功してきた手法、すなわち、巨大な文書集合を使った機械学習技術と記号処理アルゴリズムとを融合する手法を、意味・文脈・知識処理に適用することで、言語処理技術にブレークスルーをもたらすことを目標として研究を遂行した。この結果、(1)言語理論に基づく深い文解析の高速で高耐性なシステムの開発、(2)意味・知識処理のための大規模付記コーパス(GENIAコーパス)の構築と公開、(3)深い文解析の結果を用いた固有名、事象認識などの意味・知識処理手法の開発、(4)大規模なテキスト集合の意味・知識処理を行うためのクラウド処理用ソフトウェアシステムの開発、において世界水準の成果を上げた。(2)で構築されたGENIAコーパスは、生命科学分野でのテキストマイニング研究のための標準データ(Gold Standard)として、国際コンペティション(BioNLP09、BioNLP11)の訓練・テスト用のデータとして、採用された。また、(1)の研究成果と機械学習とを組み合わせた(3)の成果は、これらのコンペティションで高い成績を収めている。また、(1)と(4)の成果により、Medlineの論文抄録データベース(2千万件、2億超の文)からの事象認識と固有名認識を数日で完了できることを実証した。その成果は、意味処理に基づく知的な文献検索システム(MEDIE)として公開されている。
著者
岡崎 直観 劉 瀟 綱川 隆司 辻井 潤一
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

ウィキペディアでは,同一の実体を複数の言語で説明することがあり,それらのエントリ間は言語横断リンクで結ばれる.そこで,本研究では言語横断リンクで結ばれたエントリ同士を並行コーパスと見なし,対訳用語対をマイニングする.提案手法は,単一言語に対して用語抽出を行い,その用語に対する訳語を,統計的機械翻訳に基づく翻訳確率,並行コーパス中における共起回数,言語を横断した用語周辺文脈の類似度で選出する.