著者
粟津妙華 高田雅美 城和貴
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.20, pp.1-6, 2014-06-18

国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして Web 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがヒストグラムでは除去できないルビであり,我々はすでに近代書籍に特化したルビ除去手法を提案している.しかしながら,提案した手法は書籍に付加された外部情報を元にしており,実現可能性は低い.そこで本論文では,書籍画像から直接得られるデータを元に,進化計算によってルビ除去式を生成し,近代書籍から自動でルビを除去する手法を提案する.In National Diet Library, books which are possessed in library as "the digital library from meiji era" are open to the public on Web. Since these are shown as image data and cannot search using document contents, an automatic text conversion is needed. There is a major obstacle to text conversion. It is ruby. Ruby can not be removed in the histogram method. Therefore, we have proposed a ruby removal method for early-modern Japanese printed books. However, since the proposed method is based on the external information added to the books, the feasibility is low. In this paper, we propose a method to remove the ruby automatically from early-modern Japanese printed books by generating ruby removal formula in Genetic Programming using the training data was based on the data of book image.
著者
粟津妙華 高田雅美 城和貴
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012, no.17, pp.1-6, 2012-11-29

国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして WEB 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがルビである.現在のルビを直線的に除去する技術は,規格に沿った現在の書籍を対象としたものであるため,現在の書籍とは違う特性を持つ近代書籍には適用できない.そこで,本研究では,遺伝的プログラミングを用いて,曲線的に出版者・時代ごとの専用ルビ除去式の生成を行う.In National Diet Library, books which are possessed in library as "the digital library from meiji era" are open to the public on WEB. Since these are shown as image data and cannot search using document contents, an automatic text conversion is needed. However, ruby is a disturbing text conversion. Since existing techniques of linearly removing ruby had developed for books of the current standard, the techniques are inapplicable to early-modern Japanese books, which have a specific characteristic different from characters of current books. In this paper, we propose a method to remove ruby from early-modern Japanese books using Genetic Programming.
著者
田邊昇 冨森苑子 高田雅美 城和貴
雑誌
研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2013-ARC-204, no.4, pp.1-7, 2013-03-19

HPC における反復解法のみならず、近年ではビッグデータ解析のニーズの高まりにより、大量データへのランダムアクセスの低電力化・高スループット化のニーズが高まっている。キャッシュベースの CPU や GPU において、キャッシュから溢れる配列に対して Scatter/Gather を行なうと、ライン内の空間的局所性の欠乏により消費電力とスループットの両面で深刻な問題が発生する。特に電力やメモリスループットが不足する将来の大規模計算基盤においては、この問題が年々深刻さを増す。本報告では、上記の問題の解決策として、Scatter/Gather 機能を Hybrid Memory Cube 内で行なうことを提案する。提案方式の電力やスループットに関するメリットについて、モデルを構築しつつ、Graph500 ベンチマーク課題行列に対する疎行列ベクトル積を実例に考察する。
著者
田邊昇 冨森苑子 高田雅美 城和貴
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014-HPC-143, no.7, pp.1-10, 2014-02-24

疎行列ベクトル積 (SpMV) は多くの場合にキャッシュアーキテクチャとの相性が悪い.並列処理においては負荷不均衡が性能に与える影響も大きい.これまでは SpMV 性能を決める要因として,キャッシュのヒット率や一行あたりの非零要素数の平均,最大値,分散が注目されていた.しかし,それらと性能との相関が不明瞭であり,SpMV の挙動は長年にわたり謎に包まれていた.それは SpMV の最適化や,効率的な疎行列ライブラリ構築の障害であった.本報告では,SpMV 性能を左右する様々な要因をアプリケーション依存の要因とプラットフォーム依存の要因に分けて考察した.それを踏まえて行列の非零要素配置から導かれる時間的局所性と空間的局所性等のアプリ依存パラメータを導入した SpMV 性能モデルを構築した.その上でフロリダ大コレクションから抜粋した 115 種の疎行列と GPU を用いて SpMV 性能モデルの評価実験を行った.その結果,GPU 上で実行する場合は Padding に関する補正と小さな行列での補正が必要であることと,長行を折り畳むなど適切な負荷分散がなされた場合はキャッシュのヒット率よりも,空間的局所性やインデックス転送の抑制の方が実効性能に敏感であることが明らかになった.
著者
粟津妙華 高田雅美 城和貴
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.17, pp.1-6, 2012-11-29

国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして WEB 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがルビである.現在のルビを直線的に除去する技術は,規格に沿った現在の書籍を対象としたものであるため,現在の書籍とは違う特性を持つ近代書籍には適用できない.そこで,本研究では,遺伝的プログラミングを用いて,曲線的に出版者・時代ごとの専用ルビ除去式の生成を行う.In National Diet Library, books which are possessed in library as "the digital library from meiji era" are open to the public on WEB. Since these are shown as image data and cannot search using document contents, an automatic text conversion is needed. However, ruby is a disturbing text conversion. Since existing techniques of linearly removing ruby had developed for books of the current standard, the techniques are inapplicable to early-modern Japanese books, which have a specific characteristic different from characters of current books. In this paper, we propose a method to remove ruby from early-modern Japanese books using Genetic Programming.
著者
高木里穂 高田雅美 梅田智広 城和貴
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.20, pp.1-6, 2012-11-29

本稿では定在波レーダを用いて人間の呼吸を観察するシステムの開発を行う.乳幼児突然死症候群という病気がある. 1 歳までの健康にみえた乳児が予兆なしに突然呼吸停止し,死亡してしまう症状のことである.この症候群を予防するには呼吸循環系の異常を早期に発見する必要がある.そこで呼吸循環系の異常を検出するために定在波レーダを用いる.定在波レーダは物体との変位を計測することができる.この変位を計測し周波数解析を行い呼吸の周波数帯域を観察することにより,ある一定の距離にいる乳児の呼吸の動きを観察するIn this paper, we present the development of a respiration monitoring system with a standing wave radar. There is a disease called sudden infant death syndrome. A well-looking baby of up to one year stops his/her breathing without any reason, and comes to die. To prevent babies from this disease, some kind of systems that check baby's breathing circulating system to detect abnormal foretaste is required. Such error detection for baby's breathing circulating can be realized by a standing wave radar, which measures the distance of target objects presicely. Measuring series of displacements to the breast of a baby, we apply Fourier transform analysis for the frequency band of baby's breathing, and we get periodical observation of baby's breathing.