著者
大泉 洋路 佐藤 俊治 三宅 章吾 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.103, no.732, pp.117-122, 2004-03-10
被引用文献数
1

多義図形に対する図地反転知覚は,観察者の注意位置や範囲に依存して図地が反転し,この注意もまた,提示される図形に依存して変化する.本稿では,図地知覚と注意の動的な情報処理過程を説明する神経回路モデルを提案する.提案モデルは,(i)提示された図形中の輪郭情報から領域間の図地関係を決定する機構,及び(ii)視覚的注意の影響を(i)に与える機構から構成される.これら2つの機構は,図地知覚および注意の状態に応じて相互に影響し合う.数値実験により,図地反転図形を入力とした場合,提案モデルが図地反転現象を再現できること,また様々な条件下で我々の知覚と定性的に一致することを確認した.
著者
松田 友輔 大町 真一郎 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.3, pp.336-344, 2010-03-01
被引用文献数
3

本論文ではNAT(Noise Attribute Thresholding)法と色情報を用いた2値化及びエッジ情報を利用した情景画像からの高精度な文字列検出手法を提案する.NAT法はノイズの特性を利用した文書画像の2値化手法である.NAT法と色情報を用いて文字列検出を行う従来手法は照明変化等による色の変化に脆弱で誤検出が多いという問題があった.それに対して提案手法では,色コントラストを考慮した濃淡画像にNAT法を適用して2値化することにより従来手法よりも高い精度の2値化を実現し,高精度な文字列の検出を可能としている.また照明変化などにより文字の単色性が損なわれている場合を考慮して色情報を処理することにより照明変化に対応し,誤検出数を抑制している.更にエッジ情報を利用した手法を導入することにより,従来手法では不可能であった接触文字の検出を可能としている.実験により提案手法の有効性を示す.
著者
横山 弘子 大町 真一郎 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.97, no.593, pp.1-8, 1998-03-12
被引用文献数
8

本報告では, シソーラスを自動的に構築するための手がかりとして, コーパス内の単語の共起情報をもとにクラスタリングにより多義動詞の意味分類を行なう手法を提案している.この手法について, 1つの多義動詞に対して意味に応じたクラスタを形成する実験を行った.コーパスとして1年分の朝日新聞社説を用い, まず着目した多義動詞を含む社説を複数収集しそこから得た名詞間共起情報によるクラスタリングの結果, いくつかの動詞で意味に応じたクラスタが形成されることが確認された.また, 多義動詞の類義語を含む社説も追加して同様のクラスタリングを行った.これにより着目した動詞を含む社説のみ用いた場合意味に応じたクラスタが形成されなかった動詞についても良好な結果が得られた.
著者
藤岡 豊太 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-1, 情報・システム 1-コンピュータ (ISSN:09151915)
巻号頁・発行日
vol.80, no.11, pp.880-888, 1997-11
被引用文献数
2

コンピュータ技術の発達に伴い, 情報をいかに効率的に伝送, 蓄積するかが重要な課題となっている. そのためデータ圧縮技術が発達し, さまざまな分野で利用されている. しかし, 大量の情報を扱う場合の各種システムの速度的要求のもとでは, CPU内での圧縮処理では速度的要求を満足することが困難になってきている. そのため, VLSI/ULSI技術を用いた専用ハードウェアによる高速なデータ圧縮法が必要となっている. 本論文では, さまざまな情報に対して有効な符号化法の一つであるLZ77符号化法を高速に実行する並列処理アーキテクチャ-PAHL-Cを提案している. PAHL-Cでは, 符号化で最も計算量を要する最長一致記号系列探索での冗長な計算を削減し, スルーレートを大幅に向上するものである. また, 高位論理合成システムPARTHENONを用いてPAHL-Cの論理設計等を行い, 性能評価している. その結果約20〜25[MByte/s]というスルーレートが得られることがわかった. 更にLZ77復号化並列処理アーキテクチャ-PAHL-Dを提案し, 性能評価している. また, PAHL-C/PAHL-Dが効率的を統合できることを示す.
著者
後藤 英昭 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.3, pp.465-473, 1995-03-25
被引用文献数
8

文字領域の抽出は,文書画像に対して文字認識処理を適用する際の,必須な処理である.本論文では,文書画像から文字領域を抽出する新しい手法:区分直線連結法(Linear Segment Linking)を提案する.本提案手法は,文書画像中の区分直線状の要素を文字行と仮定して抽出するもので,文書構造に関する知識を必要とせず,画像のゆがみなどにも耐性があることが示される.本手法では,画像の中間表現として新しく定めた基本矩形を用いるが,これは行方向にぼかしを入れて抽出される定まった幅の矩形(高さは画像に依存する)である.この基本矩形は,外接矩形よりも容易かつ高速な生成が可能なものとなっている.また,文字行抽出処理の段階で行間の結合(ブリッジ)を強制的に切り離す処理を導入している.これによって,文字行間に若干の接触のある文書からも安定な文字行の抽出が可能となることが示される.
著者
大塚 浩司 大町 真一郎 阿曽 弘具
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. DBS,データベースシステム研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.140, no.2, pp.415-420, 2006-07-14
参考文献数
6

共通のトピックに関するウェブページの集合であるウェブコミュニティを抽出する手法の1っとしてHITSアルゴリズムが知られている.HITSアルゴリズムは,ウェブコミュニティを"オーソリティ"と"ハブ"と呼ばれる2種類のウェブページからなる2階層の構造をしていると仮定し,これを2部グラフと見なして抽出することを目的としている.しかし,一般にウェブコミュニティはより複雑なリンク構造を持っている.本論文では,3階層以上の多階層のリンク構造を持つウェブコミュニティを抽出することを目的とし,オーソリティ・ハブに加えて中間ノードを導入したウェブコミュニティ抽出法を提案する.提案手法により,HITSアルゴリズムでは抽出しにくいページをウェブコミュニティのメンバとして抽出することが可能であることを実験により示す.
著者
森 大毅 阿曽 弘具 牧野 正三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1994, no.63, pp.89-96, 1994-07-21
被引用文献数
5

trigramモデルは自然言語の局所的性質の良い近似となっており、パターン認識全般において広く用いられている。本報告では、日本語文書中の文字系列のtrigramモデルを用いた文字認識後処理の手法について述べ、実際に文字認識実験を行うことでその有効性を明らかにする。新聞の社説を統計処理することによりモデルを構築し、そのしぼり込み効果をパープレキシティを用いて評価する。その際2種類のスムージング法を導入し、削除補間法を用いた場合の予測性能が優れていることを示す。3種類の文書に対して文字認識後処理を適用した結果、誤字の回復率が75%から90%以上と高い効果が得られた。Being a good representation of local feature of natural languages, trigram model is widely applied to various pattern recognition system. In this report, a postprocessing method for character recognition using the trigram model of the character sequences in Japanese documents is described, and its advantage is revealed by practical experiments. The model is trained by statistical processing of leading articles, then the ability to reduce ambiguity is evaluated by the perplexity. In this procedure, two smoothing methods are introduced, and the predictive power of deleted interpolation method is shown to be superior. Experimental results of postprocessing for three kinds of documents show that the correction rates are 75 to over 90 percent.