著者
西村 涼 大田 康人 渡辺 靖彦 村田 真樹 岡田 至弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.67, pp.85-90, 2008-07-10
参考文献数
12

メールの文章は他の文書なら改段落しない場合でも、「見やすさ」、「読みやすさ」 を重視して改段落をする場合がある。こうした過剰で不要な段落わけは、メールの機械処理にとって問題である。そこで、メールの文章における段落間の接続の強さを機械学習によって推定する方法を提案し、過剰な段落わけを検出できることを示す。In order to improve the readability, we often segment mail text into smaller paragraphs than necessary. However, this oversegmentation is a problem of e-mail text processing. In this paper, we proposed an estimation method of connectivity between paragraphs in mails using machiene learning technieques, and showed that paragraphs which should be one paragraph can be found by detecting strong connectivity.
著者
西村 涼平 菅原 豊 入江 英嗣 平木 敬
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.75, pp.79-84, 2008-07-29

近年,半導体の製造技術の向上によって,1 チップに多数のプロセッサコアを集積することが可能になった.これを実現するために,多くの場合,チップを計算能力当たりで簡素にできる SIMD アーキテクチャが採用されている.この流行に沿ったアーキテクチャとして,Cell プロセッサや GPU が挙げられる.この 2 つのアーキテクチャは,マルチコアで SIMD という点では共通しているものの,細部においては様々な差がある.我々は,これらの差がメモリレイテンシの隠蔽やプログラミングの複雑さなどにおいてどのように表れてくるかを,行列積,FFT,ソーティング,そして ZIP ファイルのパスワードクラッキングの 4 つのアプリケーションを使って調べた.Recently, improvement of manufacturing technology of semiconductors has enabled to accumulate a lot of processor cores to one chip. In order to realize this, in a lot of cases, the SIMD architecture that can enable a chip to be simple per computing ability is adopted. We mention the Cell processor and GPUs as the architectures in accordance with this trend. These architectures are common in points of multicore and SIMD, but they are different in various particulars. We investigated how these differences appear in concealment of memory latency and complexity of programming using the four applications of matrix multiplication, FFT, sorting and password cracking of ZIP files.