著者
池田 尚志 松本 忠博
出版者
一般社団法人 電子情報通信学会
雑誌
電子情報通信学会 基礎・境界ソサイエティ Fundamentals Review (ISSN:18820875)
巻号頁・発行日
vol.4, no.4, pp.282-292, 2011-04-01 (Released:2011-04-01)
参考文献数
35

点字は視覚障害者にとっての文字である.晴眼者が用いる墨字のテキストは点字に変換しなければ視覚障害者は読むことができない.一方,手話は聴覚障害者が使用する言語である.聴者の音声言語との間の対話には手話通訳が必要である.このような言語コミュニケーションのバリアを克服するために点訳ボランティアや手話通訳士などが携わっているが,対処できる量には限りがあり理想の状態からは程遠い.技術的な支援が期待されるゆえんである.本稿では,点字と手話を中心に言語バリアフリーへ向けて自然言語処理技術の側面から我々が行ってきた研究について解説する.
著者
松本 忠博 原田 大樹 原 大介 池田 尚志
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.13, no.3, pp.177-200, 2006-07-10 (Released:2011-03-01)
参考文献数
37
被引用文献数
1 3

日本手話をテキストとして表現するための表記法を提案する.本表記法の検討に至った直接の動機は, 日本語一日本手話機械翻訳を, 音声言語間の機械翻訳と同様, 日本語テキストから手話テキストへの翻訳 (言語的な変換) と, 翻訳結果の動作への変換 (音声言語におけるテキスト音声合成と同様に手話動画の合成) とに分割し, 翻訳の問題から動作合成の問題を切り離すことにある.この翻訳過程のモジュール化により, 問題が過度に複雑化するのを防ぐことをねらいとする.同時に, 手話を書き取り, 保存・伝達する手段としての利用も念頭に置いている.本表記法で記述される手話文は, 手話単語, および, 複合語等の単語の合成, 句読点, 非手指要素による文法標識で構成される.手話単語は, 単語名とそれに付加する語形変化パラメータ (方向や位置, その他の手話動作によって付加される語彙的, 文法的情報を表す) で表す.我々の表記法は, 基本的に手話の動作そのものを詳細に記述するのではなく, 動作によって表される意味内容を記述することをめざした.ただし, 機械翻訳を念頭に置いているため, 動作への変換のための便宜にも若干の考慮を払った.本表記法の記述力を検証するため, 手話を第一言語とする手話話者による手話映像720文を解析し, この表記法での記述を試みた.全体で671文を記述することができた.十分表記できないと判断した49文 (51表現) を分析し, 問題点について考察した.
著者
安本 護 池田 尚志 豊倉 完治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRU, パターン認識・理解
巻号頁・発行日
vol.94, no.423, pp.87-95, 1994-12-16

マルチメディア環境の進展に伴い、従来のような画一的なフォントだけではなく、多様なフォントデザインが求められるようになってきている。その中に、ユーザの個性を表現できる手書き風文字を望むものがある。しかしながら、日本語文書の表現には非常に多くの漢字が必要であり、これをユーザごとにデザインすることは事実上不可能である。そこで、我々は漢字の構造的特徴に着目し、漢字をへんやつくりなどの部分字形に分解し、その組合せによって手書き風フォントを自動生成することを考えた。本稿では、常用漢字1945文字を対象に入力された手書き文字データから基本部分字形及び漢字生成規則を抽出して個性的なフォントの生成を試みた。
著者
池田 尚志 松本 忠博
出版者
岐阜大学
雑誌
基盤研究(C)
巻号頁・発行日
2007

古典的な方式であるが、パターン変換型の機械翻訳エンジンを構築し中国語を始めベトナム語、シンハラ語、さらに日本の手話への機械翻訳システムjawを試作した。C++言語のオブジェクトのパラダイムを利用した相手言語の"表現構造"を介する翻訳方式が特徴である。また、jawにおいて用いる日本語解析システムとして、文節構造解析に基づく解析システムibukiCを開発した。
著者
松本 忠博 加藤 三保子 池田 尚志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. WIT, 福祉情報工学 (ISSN:09135685)
巻号頁・発行日
vol.108, no.170, pp.61-66, 2008-07-20

SignWritingは,音声言語における文字と同様に,日常の様々な用途で手話を読み書きするためにSuttonが考案した手話の書記法である.SignWritingでは手の形や動き,顔の表情などを表す図像的な記号を使って手話を表現するが,多くの記号の中から適切な記号を選び,単語を構成するのは,とくに初心者にとって時間を要する作業である.我々は計算機での入力・処理に適した手話表記法を提案している.本稿ではこの表記法で書かれた手話文を入力とし,そのSignWriting表現を自動生成することで,SignWritingによる手話記述を支援するシステムについて述べる.手話単語は手の形,位置,動き,顔の表情など複数の要素で構成されており,各要素の変化(語形変化)によって,語彙的・文法的な意味が付加される.それらの変化に対してもできる限り自動的に対応するようにしている.
著者
安本 護 池田 尚志 堀井 洋
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J80-D2, no.11, pp.2930-2939, 1997-11-25

パーソナルコンピュータや日本語ワープロを用いた文書作成において,ユーザ自身の個性的なフォントを使いたいという要求が潜在している.ところが,日本語文書の表現には数千もの文字が必要であるため,個人でフォントを登録することは困難である.本論文では,少数の手書き入力文字をもとにユーザの個性を反映した手書き風フォント一式を生成する手法を提案する.この手法は,複数の人が筆記した手書き文字データを基準パターンとし,これに非線形の幾何学的変形を加えた後,線形結合して手書き風文字の生成を行うものである.大域的個人性を表現する非線形変換のパラメータと局所的個人性を表現する線形結合のパラメータは少数のユーザ手書き文字から決定する.また,これら二つの個人性を個別に調整するパラメータを導入し,ユーザによる個人性制御も可能とした.文字間距離に基づく客観的評価と19名の被験者による主観的評価の結果,ユーザの個人性を反映した手書き風文字が生成できることが確認できた.
著者
松本 忠博 池田 尚志
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.15, no.1, pp.23-51, 2008-01-10 (Released:2011-03-01)
参考文献数
39
被引用文献数
1 2 3

手話は言語でありろう者の母語である.手話と音声言語の間のコミュニケーションには手話通訳が必要となるが, 手話通訳士の数は圧倒的に不足している.両言語間のコミュニケーションを支援する技術が期待される.本論文は日本語と手話との間の機械翻訳を目指して, その一つのステップとして, 日本語テキストから手話テキストへの機械翻訳を試みたものである.機械翻訳をはじめとする自然言語処理技術はテキストを対象としているが, 手話には文字による表現がないため, それらを手話にそのまま適用することができない.我々は言語処理に適した日本手話の表記法を導入することで, 音声言語間の翻訳と同様に, 日本語テキストから手話テキストへの機械翻訳を試みた.日本語から種々の言語への機械翻訳を目的として開発中のパターン変換型機械翻訳エンジンjawをシステムのベースに用いている.目的言語である手話の内部表現構造を設定し, 日本語テキストを手話の表現構造へ変換する翻訳規則と, 表現構造から手話テキストを生成する線状化規則を与えることで実験的な翻訳システムを作成した.日本手話のビデオ教材等から例文を抽出し, その翻訳に必要な規則を与えることで, 日本語から手話に特徴的な表現を含んだ手話テキストへの翻訳が可能であることを確認するとともに, 現状の問題点を分析した.
著者
井佐原 均 池田 尚志 石崎 俊
雑誌
全国大会講演論文集
巻号頁・発行日
vol.38, pp.279-280, 1989-03-15

日本語の文は、英語などに比べて、修飾句の順序に関する構文的制約が少ない。従って、日本語文からの格関係の抽出においては、修飾句に含まれる助詞の情報や文脈情報などさまざまな情報を用いて、格関係を決定していくことになる。そのような情報のなかで、助詞の情報(場合によっては、助詞が用いられていないという情報)は最も取扱いやすい情報であるが、助詞の情報とその係る用言の性質とだけでは、この修飾句が用言に対してどのような情報を担っているかを判定するには十分ではない。 本稿では、まず助詞「から」が持つ情報を分類する。次に各分類の判定基準について述べる。なお、データとしては、1985年11月2日から1988年3月8日までの朝日新聞に現われた経済活動に関する459の新間記事に含まれていた416の「から」を用いている。
著者
中村 明 速水 悟 津田 裕亮 松本 忠博 池田 尚志
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.50, no.4, pp.1375-1389, 2009-04-15

単語間の大域的な依存関係をトピック(話題)としてモデル化する言語モデルの1つであるLDA(Latent Dirichlet Allocation)を複数個統合する方式によって,言語モデルを高精度化・安定化できることを示す.新聞記事コーパスを用いた実験の結果,提案方式では単一のLDAからなる同一規模のモデルと比較して,つねに推定精度が向上・安定化することを確認した.単一LDAでは潜在トピック数<i>C</i> = 100前後を境に性能が低下するのに対し,提案方式では過適応が抑制され,はるかに大きい総トピック数(= 各モデルの潜在トピック数の総和)まで性能が向上し続ける.また提案方式によるunigram確率を用いて<i>N</i>-gram確率(<i>N</i>&ge;2)を補間することにより,trigramのパープレキシティを従来方式より大幅に削減できる.さらに本論文では,提案方式を予測入力に基づくテキスト入力支援(predictive text entry)に応用することを想定し,テキスト入力支援に適した言語モデル評価指標i-PPを提案する.この指標はパープレキシティの拡張であり,任意文字数の読み入力時点における平均単語分岐数を表す.この指標を用いた評価の結果,提案手法では入力読み文字数<i>l</i> = 2の時点まで通常のパープレキシティと同程度にi-PPを削減でき,従来方式よりも高精度に予測候補を絞り込めることが確かめられた.
著者
若田 光敏 兵藤安昭 池田 尚志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1999, no.22, pp.65-72, 1999-03-04

日本語では「は」は基本的には文中での主題を表すが,一文の中に複数の「は」が現れることも多く,その場合,「は」のスコープを確定することは,日本語文の解析において重要である.特に長文では,「は」のスコープを正しく認識することは,文の大域的な構造を把握することと一体の関係がある.本稿では,「は」のスコープを解析していく手がかかりとして行った,コーパス中での「は」の出現パターンについての分析結果について述べる.また,連体形述語の前に位置する連用形述語の係り先に関しても若干の分析を述べる.なお,コーパスの分析に際しては,我々が開発中の解析システムIBUKIをツールとして用いた.Japanese postpositional function word "wa" plays an imortant role in a sentence representing a topic. In a long sentence there can appear more than one "wa". To grasp correctly a global structure of a long sentrence it is definitely important to decide accurate scopes of each "wa". This paper describes our analysis of "wa" scope pattern in a large corpus. Besides we investigated in a large corpus a scope of an adnominal embedding sentence, which is also important to grasp a long complex sentence structure. To analyze and extract sentences including designated expression pattern, the syntactic analysis system IBUKI which is developed at our laboratory is used.