著者
岩田 彩 上坂 和美 粟津 妙華 石川 由羽 高田 雅美 城 和貴
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21888833)
巻号頁・発行日
vol.2015-MPS-105, no.10, pp.1-6, 2015-09-22

本稿では,近代書籍で用いられているフォントを用いた活字を自動で生成する手法を提案する.近代デジタルライブラリーで一般公開されている近代書籍のテキスト化に使用する多フォント活字認識手法の精度向上のため,学習データを十分に増やす必要がある.しかし,近代書籍に使用されているフォントは多種多様であるため,十分な学習データを収集することは困難である.そこで本稿では,学習用の近代書籍フォントセットを自動生成する変換フィルタを,遺伝的プログラミングを用いて生成する.
著者
粟津妙華 高田雅美 城和貴
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.20, pp.1-6, 2014-06-18

国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして Web 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがヒストグラムでは除去できないルビであり,我々はすでに近代書籍に特化したルビ除去手法を提案している.しかしながら,提案した手法は書籍に付加された外部情報を元にしており,実現可能性は低い.そこで本論文では,書籍画像から直接得られるデータを元に,進化計算によってルビ除去式を生成し,近代書籍から自動でルビを除去する手法を提案する.In National Diet Library, books which are possessed in library as "the digital library from meiji era" are open to the public on Web. Since these are shown as image data and cannot search using document contents, an automatic text conversion is needed. There is a major obstacle to text conversion. It is ruby. Ruby can not be removed in the histogram method. Therefore, we have proposed a ruby removal method for early-modern Japanese printed books. However, since the proposed method is based on the external information added to the books, the feasibility is low. In this paper, we propose a method to remove the ruby automatically from early-modern Japanese printed books by generating ruby removal formula in Genetic Programming using the training data was based on the data of book image.
著者
小山 ちひろ 石川 由羽 高田 雅美 城 和貴
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21888833)
巻号頁・発行日
vol.2016-MPS-110, no.10, pp.1-6, 2016-09-09

本稿では,ルールや攻略法を与えず自動的にルールを構築し,上達することができる成長型ゲーム AI の開発を行う.専用の学習エミュレータが存在しないゲームを学習させることは困難である.そこで,プレイ画面情報のみでゲームを学習することができるシステムを開発する.画面情報より得られたスコアのみを学習に用い,遺伝的アルゴリズムを適用して Flash ゲーム “QWOP” の運動学習を行う.ランダムな行動パターンを持つ個体群に対し,遺伝子操作を行うことでスコアが徐々に向上し,歩行運動を学習していくことを確認する.
著者
松本 多恵 伊奈 諭 高田 雅美 城 和貴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.6, no.2, pp.128-136, 2013-08-21

情報通信機器を活用したコミュニケーションは視覚障害者と晴眼者との有効な情報伝達手段であるが,視覚障害者には大きな壁が存在する.それは『漢字仮名交じり文』を作成することである.視覚障害者が使用する点字には,ひらがな,カタカナ,漢字の区別がなく,表音文字だけをどんどん読み進んで文字の意味を理解するため,『墨字』という大きな壁にぶちあたってしまう.これまでも視覚障害者向けに点字ワープロなどが開発されてきたが,これらの機器を有効に活用するためには,視覚障害者の墨字リテラシ強化が必要不可欠である.そこで我々は,筆順に着目し,触覚と音声ガイドによる自学自習および対面指導を支援するシステムを開発し,視覚障害者を被験者とした評価実験を行った.We develop a Sumiji learning support system for visually impaired people. The system is based on hand writing using tactile stroke order to be displayed. In order to validate the system, we perform experimental evaluation of the system with visually impaired people. As a result, it is clarified that our system is very effective for the blind to learn Sumiji. Its hand writing is accompanied by shortening of acquisition time and the improvement in the rate of learning is compared with the conventional face to face instruction.
著者
児玉 理映子 石川 千里 高田 雅美 城和賞
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.128, pp.61-64, 2007-12-20

ユーザの嗜好に合致する商品を提示するレコメンド法が注目されているしかしながら,従来のレコメンド法では全てのユーザを満足させることはできないそこで,満足できないと考えられる特定ユーザの嗜好を抽出する新たなレコメンド法を提案する.本稿では,特定ユーザとして興味の有無が明確なオタクを採用したオタクの嗜好を抽出するにあたってまずオタクの定義をし,その定義に基づいて選出したユーザをオタクとする.またオタク以外のユーザを一般人とする.このオタクと一般人の Mb アクセスログから決定木を生成しネット上での行動パターンを抽出し分析する.分析結果からオタクは一般人と比べ膨大な情報量を持つコンテンツを閲覧していることが示された.Recommendation methods that offer goods to users according to their favorite attract at tention recently. However, existing recommendation methods cannot be applied to all users in even. So, we propose a new recommendation method that extracts specific users who are not happy with recommended goods. In this paper, we adopt Otakus, whose interest is clear, as specific users. First, for extracting Otaku's favorite, Otaku is defined, and several users selected according to the definition are regarded as otakus. The access pattern on the Internet is extracted from web access log of the otakus and other standard people to be analyzed. The result shows that otaku browses more copious contents than other standard people.
著者
粟津妙華 高田雅美 城和貴
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012, no.17, pp.1-6, 2012-11-29

国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして WEB 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがルビである.現在のルビを直線的に除去する技術は,規格に沿った現在の書籍を対象としたものであるため,現在の書籍とは違う特性を持つ近代書籍には適用できない.そこで,本研究では,遺伝的プログラミングを用いて,曲線的に出版者・時代ごとの専用ルビ除去式の生成を行う.In National Diet Library, books which are possessed in library as "the digital library from meiji era" are open to the public on WEB. Since these are shown as image data and cannot search using document contents, an automatic text conversion is needed. However, ruby is a disturbing text conversion. Since existing techniques of linearly removing ruby had developed for books of the current standard, the techniques are inapplicable to early-modern Japanese books, which have a specific characteristic different from characters of current books. In this paper, we propose a method to remove ruby from early-modern Japanese books using Genetic Programming.
著者
梅山 章子 高田 雅美 城 和貴
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21862583)
巻号頁・発行日
vol.2010, no.32, pp.1-6, 2010-02-25

本稿では,国立国会図書館が運営しているウェブアーカイブの WARP が抱える問題に対処するため,差分収集による新なサーバも同時に使う手法について報告する.差分収集とは,ウェブサイトの更新が行われる毎にリアルタイムで収集,保存を行い,WARP を補うサーバとなる.このサーバは,ウェブアーカイブ用アプリケーションの Wayback を用いて構築する.また,1 つのウェブアーカイブサーバとして両サーバが相対的に機能するかを確認するため,プロトタイプを設計する.この際,簡易版 WARP の構築,簡易版 WARP と差分収集サーバのインタフェースを実装する.WARP is a Web archive system in National Diet Library based on fixed interval collection. Since WARP does not have the incremental collection method, it is desired that a new incremental Web archiving system collaborates with WARP. Such the incremental collection server can be constructed with Wayback applications. Thus,we design a prototype system using WARP and the Wayback based server. Each server needs to work alone while any query must be recognized by the both servers. We use a simple WARP based server and implement the interface between the simple WARP and the Wayback based server.
著者
榎本 友理枝 石川 千里 高田 雅美 城和貴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.126, pp.17-20, 2008-12-10

本稿では,芝生の色の保持と緑色塗料の関係を予測するためのモデルを構築する.モデル構築にあたって,実際に試験塗料を散布させた芝生の劣化変化の解析結果を利用する.このモデルを用いてシミュレーションを行うことにより,芝生の色の持続性と塗料の濃度の関係が分かり,芝の品質に影響を与えない緑色塗料を適切な時期に散布し,常に葉色の良い状態で芝生を維持することが可能になると期待される.By this study, we build a model to predict color maintenance for lawns and relations of the green paint. On the model construction, We use the analysis results of the deterioration change of lawns which get really scatter examination paint. We understand the durability of the color of lawns and relations of the density of paint by simulating with this model. We can scatter the green paint which does not affect the quality of the turf in an appropriate time. And it is always expected with good leaf color and can maintain lawns.
著者
榎本 友理枝 高田 雅美 木目沢 司 城 和貴
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.14, pp.1-6, 2011-02-28

国立国会図書館では,所蔵する明治から大正期にかけての近代書籍を画像データとしてアーカイブ化し,Web 上で一般に公開している.このデジタルアーカイブをより簡便に利用できるよう,近代書籍画像の早急なテキスト化が望まれている.本稿では,SVM に基づく近代書籍に特化した多フォント漢字認識手法の有効性を実証する.出版社が異なる書籍から切り出した様々なフォントの漢字 256 種を用いて識別実験を行った結果,常に 92% 以上の識別率を得ることができた.従って,文字画像に対して PDC 特徴を抽出し,SVM で学習・識別を行うという提案手法が近代書籍で使用されている多フォント漢字認識に対して有効な手法であるといえる.The national diet library in Japan provides a web based digital archive for early-modern printed books by image. To make better use of the digital archive, the book images should be converted to text data. In this paper, we evaluate the SVM based multi-fonts Kanji character recognition method for early-modern Japanese printed books. Using several sets of Kanji characters clipped from different publishers' books, we obtain the recognition rate of more than 92% for 256 kinds of Kanji characters. It proves our recognition method, which uses the PDC feature of given Kanji character images for learning and recognizing with a SVM, is effective for the recognition of multi-fonts Kanji character for early-modern Japanese printed books.
著者
福尾 真実 高田 雅美 城 和貴
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012, no.34, pp.1-6, 2012-02-23

本研究では,近代デジタルライブラリーが所蔵する画像データから上手く文字を切り出す実際的手法の開発を行う.国立国会図書館では近代デジタルライブラリーとして,所蔵する書籍を Web 上で一般公開している.これらは,画像データとして公開されており,文書内容を用いた検索が行えないため,早急なテキスト化が求められている.そのため,近代書籍に特化した多フォント漢字認識手法が提案されている.しかし,ルビが振られた書籍からは上手く文字が切り出せず,認識ができない.そこで本稿では書籍の本文からルビを取り除く手法を開発する.In this research, we develop a practical technique to clip the kanji character well from the image data that the digital library from meiji era houses. The national diet library in Japan is opened to the public as the digital library from meiji era on the Web. There are shown as image data. Since it is impossible to perform full text search, it should be converted to text data. Therefore, it has been proposed the multi-fonts kanji character recognition method for early-modern Japanese printed books. Kanji characters with rubi occur that the kanji character clipping and recognition are badly constructed. In this paper, we propose a technique to remove the rubi from body of the book.
著者
福尾 真実 高田 雅美 城 和貴
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012-MPS-87, no.34, pp.1-6, 2012-02-23

本研究では,近代デジタルライブラリーが所蔵する画像データから上手く文字を切り出す実際的手法の開発を行う.国立国会図書館では近代デジタルライブラリーとして,所蔵する書籍を Web 上で一般公開している.これらは,画像データとして公開されており,文書内容を用いた検索が行えないため,早急なテキスト化が求められている.そのため,近代書籍に特化した多フォント漢字認識手法が提案されている.しかし,ルビが振られた書籍からは上手く文字が切り出せず,認識ができない.そこで本稿では書籍の本文からルビを取り除く手法を開発する.
著者
芳野 可奈子 高田 雅美 天白 成一 城和貴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.19, pp.81-84, 2007-03-04
被引用文献数
2

我々は,学習障害(LD)の中でも書字に問題があるDyslexiaの訓練用に新たにソフトウェアを開発している.Dyslexiaの障害を持つ人は,文字の読み書きの障害であり,従来から利用されている典型的な訓練方法は紙の上で文字をなぞり書きをすることのみであった.新たに開発している書字学習用のリハビリテーション用のソフトウェアは任天堂のDSという携帯型のゲーム機上で動作する.ゲーム機上で行うため紙上で行うよりも反復学習が容易である.さらに,ゲーム性を加えることで学習者の興味を持続できることも利点である本稿では,開発背景と現在開発中のソフトウェアの内容について述べる.We are newly developing training software for dyslexia disorder that is a type of learning disorder (LD). Person of dyslexia disorder has a trouble of the reading and writing of the character, and typical training methods are used to trace and to draw the character just on paper. The rehabilitation software for handwriting newly developed works on the portable type game machine, Nintendo DS. The repetition study on the game machine is easier than that of doing on paper. Moreover, it is an advantage that the learner can study with continued interest by adding the game. In this report, the content of the development background and the software developing now is described.
著者
児玉 理映子 石川 千里 高田 雅美 城和賞
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.128, pp.61-64, 2007-12-20

ユーザの嗜好に合致する商品を提示するレコメンド法が注目されているしかしながら,従来のレコメンド法では全てのユーザを満足させることはできないそこで,満足できないと考えられる特定ユーザの嗜好を抽出する新たなレコメンド法を提案する.本稿では,特定ユーザとして興味の有無が明確なオタクを採用したオタクの嗜好を抽出するにあたってまずオタクの定義をし,その定義に基づいて選出したユーザをオタクとする.またオタク以外のユーザを一般人とする.このオタクと一般人の Mb アクセスログから決定木を生成しネット上での行動パターンを抽出し分析する.分析結果からオタクは一般人と比べ膨大な情報量を持つコンテンツを閲覧していることが示された.Recommendation methods that offer goods to users according to their favorite attract at tention recently. However, existing recommendation methods cannot be applied to all users in even. So, we propose a new recommendation method that extracts specific users who are not happy with recommended goods. In this paper, we adopt Otakus, whose interest is clear, as specific users. First, for extracting Otaku's favorite, Otaku is defined, and several users selected according to the definition are regarded as otakus. The access pattern on the Internet is extracted from web access log of the otakus and other standard people to be analyzed. The result shows that otaku browses more copious contents than other standard people.
著者
田邊昇 冨森苑子 高田雅美 城和貴
雑誌
研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2013-ARC-204, no.4, pp.1-7, 2013-03-19

HPC における反復解法のみならず、近年ではビッグデータ解析のニーズの高まりにより、大量データへのランダムアクセスの低電力化・高スループット化のニーズが高まっている。キャッシュベースの CPU や GPU において、キャッシュから溢れる配列に対して Scatter/Gather を行なうと、ライン内の空間的局所性の欠乏により消費電力とスループットの両面で深刻な問題が発生する。特に電力やメモリスループットが不足する将来の大規模計算基盤においては、この問題が年々深刻さを増す。本報告では、上記の問題の解決策として、Scatter/Gather 機能を Hybrid Memory Cube 内で行なうことを提案する。提案方式の電力やスループットに関するメリットについて、モデルを構築しつつ、Graph500 ベンチマーク課題行列に対する疎行列ベクトル積を実例に考察する。
著者
芦田 尚美 高田 雅美 木目沢 司 城 和貴
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.19, pp.205-208, 2009-02-26

国立国会図書館は,所蔵する明治から大正期にかけての近代書籍を近代デジタルライブラリーとしてWeb上で一般に公開している.公開されている書籍は全て画像としてデータ化されており,全文検索を用いて書籍内容の検索を行うことができないため,早急なテキストデータ化が求められている.しかし,旧字体を多く含み活字の種類が特定できない近代書籍はOCRソフトウェアによるテキスト化を適用できない.そこで,本研究では近代書籍に特化した活字認識の手法を提案する.National Diet Library has a public web site as Early-Modern Digital Library for books in Meiji and Taisho periods. Since the archive is digitalized as images, text search for the books is not applicable and, therefore, required. Conventional OCR systems are not a good tool for such modern books because they have various font sets and most of them are very noizy. In this paper, we propose a character recognition method for early-modern printed books.
著者
秦野 真衣 米澤 朋子 吉井 直子 高田 雅美 城 和貴
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012-MPS-87, no.33, pp.1-6, 2012-02-23

本稿では,子どもの空間認識能力を高めるための AR を用いた新たな学習方法を提案する.AR を用いる利点として,物体を実際に動かすことで子どもでも直感的に,動作と視覚の両方の感覚を使って扱うことができる点がある.また,空中に浮いている立体などの仮想立体でも提示することが可能である.本学習方法は,イメージの中で物体を回転させやすくなるような支援を行っている.学習者は AR 空間の中に表示された物体を別の角度から見る場合を想像し,想像された物体を新たに作成するものである.この学習方法による空間認識能力の学習効果を調べるために,小学生を対象とした実験と実験結果による分析を行っている.
著者
重見 早南 石川 千里 高田 雅美 城和貴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.126, pp.1-4, 2008-12-10

本稿では,Flash を用いた Web アルバムの提案と設計について述べる.アルバムの自動生成の作成を行うシステムで使用する,関連画像と関連文書の提示を行うツールの開発を行う.関連画像は,写真の代わりとなる画像を取得するために用いる.しかし,ただ画像を提示するだけでは,ユーザのオリジナルアルバムとは言えない.そこで画像に付随して生年月日などからその当時の流行や音楽等の関連文書を提示することで,オリジナルアルバムを作成することができる.In this paper, we report the design of a Web album using Flash. For the automatic generation of the Web album, tools are developed showing related images and documents. The related images are used instead of photograph. A web album for a person should not be generated just from his/her related images. Therefore, by having related documents such as the fashion or the music of the days of birth, we can make the web album.
著者
冨森 苑子 田邊 昇 高田 雅美 城 和貴
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2012-HPC-135, no.17, pp.1-7, 2012-07-25

エクサスケールマシンは複雑なメモリシステムとなることが予想されている.同マシンへの適用を視野に入れた疎行列ライブラリの実現に向け,本報告では疎行列のキャッシュへの適合性分類に資する疎行列の特性に関する新しい指標として 「列インデックス列の空間的局所性」 を提案する.さらに,入力疎行列および Fold 法前処理後の提案指標の値をフロリダ大学の疎行列コレクションを用いて評価した.その結果,疎行列ベクトル積処理性能と L1 キャッシュヒット率と新指標の間には有意な相関関係があることが確認できた.よって,従来から指摘していた行列サイズと併せ,本指標をアプリ固有の最適化を避けたメモリアクセス機構や前処理アルゴリズム自動選択の指標の一つとする.
著者
秦野 真衣 米澤 朋子 吉井 直子 高田 雅美 城 和貴
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012, no.33, pp.1-6, 2012-02-23

本稿では,子どもの空間認識能力を高めるための AR を用いた新たな学習方法を提案する.AR を用いる利点として,物体を実際に動かすことで子どもでも直感的に,動作と視覚の両方の感覚を使って扱うことができる点がある.また,空中に浮いている立体などの仮想立体でも提示することが可能である.本学習方法は,イメージの中で物体を回転させやすくなるような支援を行っている.学習者は AR 空間の中に表示された物体を別の角度から見る場合を想像し,想像された物体を新たに作成するものである.この学習方法による空間認識能力の学習効果を調べるために,小学生を対象とした実験と実験結果による分析を行っている.In this research, we propose a method to progress spatial reasoning capacity of children with Augmented Reality(AR). AR has two advantages. First, children can use AR tools viscerally with sence of action and vision, since this tool can be moved actually. Second, AR tools with AR can display virtual solids like floating solid. An AR tool, which is based on the proposed method, supports to make image which rotates objects more easily. Learner images rotated objects which was displayed in AR. Then, they make this imaged objects. To evaluate spatial reasoning capacity in the AR tool, we experiment and analyze in regard to elementary school children.
著者
田邊昇 冨森苑子 高田雅美 城和貴
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014-HPC-143, no.7, pp.1-10, 2014-02-24

疎行列ベクトル積 (SpMV) は多くの場合にキャッシュアーキテクチャとの相性が悪い.並列処理においては負荷不均衡が性能に与える影響も大きい.これまでは SpMV 性能を決める要因として,キャッシュのヒット率や一行あたりの非零要素数の平均,最大値,分散が注目されていた.しかし,それらと性能との相関が不明瞭であり,SpMV の挙動は長年にわたり謎に包まれていた.それは SpMV の最適化や,効率的な疎行列ライブラリ構築の障害であった.本報告では,SpMV 性能を左右する様々な要因をアプリケーション依存の要因とプラットフォーム依存の要因に分けて考察した.それを踏まえて行列の非零要素配置から導かれる時間的局所性と空間的局所性等のアプリ依存パラメータを導入した SpMV 性能モデルを構築した.その上でフロリダ大コレクションから抜粋した 115 種の疎行列と GPU を用いて SpMV 性能モデルの評価実験を行った.その結果,GPU 上で実行する場合は Padding に関する補正と小さな行列での補正が必要であることと,長行を折り畳むなど適切な負荷分散がなされた場合はキャッシュのヒット率よりも,空間的局所性やインデックス転送の抑制の方が実効性能に敏感であることが明らかになった.