著者
田畑 文也
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第18回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.7-12, 2021 (Released:2021-06-21)

中国特許の出願が増大し、日本特許の10倍以上の出願数になっているが、中国特許を精査する際に重要な情報である中国特許庁提供の英語抄録と、日本特許庁提供の新しい翻訳エンジンを用いた機械翻訳について、翻訳精度の検証を実施した。中国特許庁提供の英語抄録については、少なくとも一部の翻訳工程では機械翻訳を用いていると考えられ、例えば”polyethylene terephthalate”と訳されるべきで所について43%が、”polyethylene glycol terephthalate”と訳の湧き出しのように誤訳されなど、機械翻訳で生じたと考えられる誤訳が、そのまま提供されており、翻訳精度的に問題あることがわかった。また、日本特許庁提供の中国特許機械翻訳も、例えば、中国語の”深度学习”は、深層学習等と訳されるべきところが、サンプル調査した100%が、深さ学習、深度学習と誤訳され、訳語としての精度に問題もあることもわかった。
著者
田畑 文也
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集
巻号頁・発行日
vol.2015, pp.135-140, 2015

&emsp;韓国特許については、その内国人出願数の増大及び技術レベル向上による特許的脅威の増大が問題になっているが、クレーム以下はハングル原文または機械翻訳の英文のみである。そのため、韓国特許を網羅的に、かつ精度よく調査することは困難であるが、2015年4月より、CPC (Cooperative Patent Classification) が、韓国特許庁より付与開始され、IPC (International Patent Classification) のみを用いるよりも、より精度良く調査できる環境が得られるものと考えられる。<br>&emsp;2015年10月時点では、新規発行の韓国公開特許公報のCPC付与は6割程度でしかない過渡期の状況であるが、韓国特許へのCPCの付与実態等を検証したので、ここに報告する。また、韓国特許庁系DB(データベース)であるKIPRISにおけるCPC階層検索対応有無など、CPCを用いて調査する際の注意点もまとめた。
著者
田畑 文也
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第17回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.37-42, 2020 (Released:2020-06-19)

AI(人工知能)を用いて特許調査の効率化が検討されているが、なかなか思ったように精度が出ない場合も多い。本検討では、アイ・ピー・ファイン(株)のDESKBEE®を用いて、特許調査精度を向上させる手段を検討した。半導体薬液特許を母集団とし、フッ酸の有無で正解・ノイズと分け、どのようにすれば精度が向上するか調べた。今回の特徴量であるフッ酸について、同義語の用語統制を行ったが、まだ十分な精度が得られず、その原因が形態素解析起因の問題であると考えた。そこで、DESKBEEで用いられている形態素解析システム(MeCab)が、日本語処理において、アルファベットの文字列を一塊の文字列として処理する特性を利用して、フッ酸を“AAAA”などと、一塊のアルファベットの文字列に置き換え(カプセル化)、形態素解析起因の問題を回避し、劇的に精度を向上できることを見出した。また、特徴量の重み付けとして、カプセル化した“AAAA”を、“AAAA、BBBB” や “AAAA、BBBB、CCCC”などと、複数の形態素が近くに存在するような形に読点”、“で区切って連続させると、正解・ノイズの分離精度が上がり、特徴量を重み付けることができることを見出した。これらの精度向上方法は、DESKBEEだけでなく、いろいろなAI系ツールでも同様に使える可能性あるので、ここに報告する。
著者
田畑 文也
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第16回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.113-118, 2019 (Released:2019-06-14)

中国特許、韓国特許に共通特許分類であるCPC (Cooperative Patent Classification) が付与開始され、IPC(International Patent Classification)のみを用いて調査するよりも、より精度の高い結果が期待される。ただし、通常の商用DB(データベース)を用いて、CPC検索すると、ファミリー特許がある場合、それらのファミリー特許に付与されたCPCも同時に検索される場合あり、中国特許庁や、韓国特許庁が付与したCPCを精度良く確認できない。今回、中国特許庁傘下のDBであるPSS-SYSTEMと、韓国特許庁傘下のDBであるKIPRISを用いるとともに、商用DBを用いてデータ補完しながら、中国特許庁と韓国特許庁が付与したCPC特許分類の付与状況を検証したので報告する。
著者
田畑 文也
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.68, no.7, pp.348-353, 2018-07-01 (Released:2018-07-01)

AI(人工知能)について,日本では新聞などのメディアで毎日目にしないことはないぐらいホットな話題であり,すでに実生活においても至る所で使われている。これに対して中国はどうかと言うと,“日本より,すでにより広く,より深く使われている”のが,実感である。これらの中国のAI動向を調べる上では,単に正攻法的に分析するだけでなく,政策,規制,ビジネスの進め方など,中国独特の情況を理解して解析しないと,正しく情況を捉えることができない場合もある。本稿では,中国AI動向を例に,中国情報をより正確に理解する上での注意点を紹介する。
著者
田畑 文也
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第14回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.89-93, 2017 (Released:2017-11-01)
参考文献数
1

AI(人工知能)の急速な進歩に伴い、自然言語処理技術が急速に進化を遂げている。これにより、機械翻訳のアルゴリズムについても、ニューラル翻訳(NMT)が登場した。また特許調査については、中国特許の急激な増大により、中国語で書かれた特許を査読する頻度も多くなり、その際には、まず日本語または英語に機械翻訳したもので、内容を理解しようとするのが通常である。しかし、現状では中国特許の機械翻訳の精度は高くないことも多い。中国特許についてNMTを用いて翻訳した場合、その翻訳精度を調べた。ただし、本稿を記した時点(2017年9月)では、中国語から日本語へのNMTに対応したものは少なく、中国語から英語へのNMTシステムも合わせて調べることにより、翻訳精度を評価した。 評価した結果、従来のルールベース翻訳や、統計翻訳とNMTを比べると、NMTの方が、単語レベルでの翻訳精度では必ずしも高いとは限らず、むしろ翻訳精度が低下する場合もあることが分かった。しかし、文としての意味を理解する上では、NMTの方が文の構成を理解し易い傾向があり、これについては発表までに詳しくまとめる予定である。また、中国語から日本語への翻訳より、中国語から英語への翻訳のレベルの方が高く、翻訳精度を求めるならば、日本語より、英語で見る方の効果の方が現時点では大きいことが分かった。