著者
木目沢 司
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.58, no.9, pp.683-693, 2015-12-01 (Released:2015-12-01)
参考文献数
15

国立国会図書館は2002年,「近代デジタルライブラリー」を公開し,デジタル化した図書のインターネットでの提供を開始した。以後,所蔵資料のデジタル化,デジタル化された他機関所蔵資料の収集等を継続的に実施するとともに,2013年からはインターネットで公開されている「電子書籍・電子雑誌」の収集も行っている。これら多種多様な資料の収集・保存・提供は現在,2011年に公開した「国立国会図書館デジタルコレクション」が担っている。本稿では,「近代デジタルライブラリー」から「国立国会図書館デジタルコレクション」へ至る開発の経緯を述べるとともに,OAIS参照モデルの機能要件の観点から,「国立国会図書館デジタルコレクション」における長期保存の現状および課題について説明する。
著者
木目沢 司
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.72, no.2, pp.67-73, 2022-02-01 (Released:2022-02-01)

国立国会図書館(NDL)電子情報部は,NDLにおける情報システムに関連する業務の一元化による効率化及び円滑化を図るため,2011年10月に設置された。以降電子情報部は,NDLの基幹システムである国立国会図書館業務基盤システム等のリニューアルをはじめ多くのシステムの新規開発やリプレースを行ってきた。本稿では2021年10月に設置から10周年を迎えたことを機に,電子情報部が行ってきた情報システム整備の取組について振り返り,その成果を省察する。またNDLにおける今後のシステム整備の方向性と課題について考察する。
著者
木目沢 司
出版者
社団法人 日本写真学会
雑誌
日本写真学会誌 (ISSN:03695662)
巻号頁・発行日
vol.80, no.1, pp.35-40, 2017 (Released:2018-03-02)
参考文献数
10

国立国会図書館(以下,NDL)は,所蔵資料のデジタル化により作成したデジタル画像(デジタル化資料)やインターネッ トから収集したPDF,EPUB形式等の電子書籍・電子雑誌(オンライン資料)等,大量のデジタルファイル形式の資料(デジタル資料)を保存・提供している.本稿では,デジタル資料を収集・保存・提供するシステムである国立国会図書館デジタルコレクション1)について,長期保存システムの国際標準Open Archival Information System(OAIS)参照モデル(ISO 14721:2012)2)の機能要件の観点から考察し,デジタル情報の長期保存の課題について述べる.
著者
榎本 友理枝 高田 雅美 木目沢 司 城 和貴
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.14, pp.1-6, 2011-02-28

国立国会図書館では,所蔵する明治から大正期にかけての近代書籍を画像データとしてアーカイブ化し,Web 上で一般に公開している.このデジタルアーカイブをより簡便に利用できるよう,近代書籍画像の早急なテキスト化が望まれている.本稿では,SVM に基づく近代書籍に特化した多フォント漢字認識手法の有効性を実証する.出版社が異なる書籍から切り出した様々なフォントの漢字 256 種を用いて識別実験を行った結果,常に 92% 以上の識別率を得ることができた.従って,文字画像に対して PDC 特徴を抽出し,SVM で学習・識別を行うという提案手法が近代書籍で使用されている多フォント漢字認識に対して有効な手法であるといえる.The national diet library in Japan provides a web based digital archive for early-modern printed books by image. To make better use of the digital archive, the book images should be converted to text data. In this paper, we evaluate the SVM based multi-fonts Kanji character recognition method for early-modern Japanese printed books. Using several sets of Kanji characters clipped from different publishers' books, we obtain the recognition rate of more than 92% for 256 kinds of Kanji characters. It proves our recognition method, which uses the PDC feature of given Kanji character images for learning and recognizing with a SVM, is effective for the recognition of multi-fonts Kanji character for early-modern Japanese printed books.
著者
木目沢 司 村山 泰啓
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.67, no.9, pp.459-464, 2017-09-01 (Released:2017-09-01)

インターネットの普及以降,ウェブサイトで多くのデータベースが公開されているが,内容やURLの変更,サイト閉鎖等により長期的なアクセスが保証されず,とくに調査研究において調査結果の根拠として用いる上で大きな課題となる。本稿では,2002-2014年に運用された国立国会図書館データベース・ナビゲーション・サービス(Dnavi)に収載されていたデータベース情報について,2017年時点でのアクセス可否を調査した結果を報告する。またデータベースの長期保存の方法について,国立国会図書館インターネット資料収集保存事業(WARP)の利用や,電子情報の長期保存の規格であるOAIS参照モデルを参照した考察を行う。
著者
芦田 尚美 高田 雅美 木目沢 司 城 和貴
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.19, pp.205-208, 2009-02-26

国立国会図書館は,所蔵する明治から大正期にかけての近代書籍を近代デジタルライブラリーとしてWeb上で一般に公開している.公開されている書籍は全て画像としてデータ化されており,全文検索を用いて書籍内容の検索を行うことができないため,早急なテキストデータ化が求められている.しかし,旧字体を多く含み活字の種類が特定できない近代書籍はOCRソフトウェアによるテキスト化を適用できない.そこで,本研究では近代書籍に特化した活字認識の手法を提案する.National Diet Library has a public web site as Early-Modern Digital Library for books in Meiji and Taisho periods. Since the archive is digitalized as images, text search for the books is not applicable and, therefore, required. Conventional OCR systems are not a good tool for such modern books because they have various font sets and most of them are very noizy. In this paper, we propose a character recognition method for early-modern printed books.
著者
木目沢 司
出版者
社団法人 日本写真学会
雑誌
日本写真学会誌 (ISSN:03695662)
巻号頁・発行日
vol.80, no.1, pp.35-40, 2017

<p>国立国会図書館(以下,NDL)は,所蔵資料のデジタル化により作成したデジタル画像(デジタル化資料)やインターネッ トから収集したPDF,EPUB形式等の電子書籍・電子雑誌(オンライン資料)等,大量のデジタルファイル形式の資料(デジタル資料)を保存・提供している.本稿では,デジタル資料を収集・保存・提供するシステムである国立国会図書館デジタルコレクション<sup>1)</sup>について,長期保存システムの国際標準Open Archival Information System(OAIS)参照モデル(ISO 14721:2012)<sup>2)</sup>の機能要件の観点から考察し,デジタル情報の長期保存の課題について述べる.</p>
著者
木目沢 司 和田 健之介 レイ トーマス 下原 勝憲
雑誌
全国大会講演論文集
巻号頁・発行日
vol.55, pp.439-440, 1997-09-24

デジタル生態系Tierraにおいては仮想生命体(デジタル生物)自身が進化することによって環境が変化し, その変化した環境に適応できた個体がより多く子孫を残す。Tierraにおいて進化するプログラムの具体的な機能は自己複製に関するもののみであり, それ以外の機能の創発は見い出されていない。本研究では自己複製以外に仮想的なモデル世界での適応機能を持ったシステムを検討する。仮想3次元空間で形状が成長・進化する生物(樹木)をつくり, 形態形成を記述した遺伝コードの進化の可能性を検討した。すなわち, Tierraにおけるエネルギー資源のアナロジーの代りに仮想的な日光を, 物質・空間資源のアナロジーの代りに樹木を成長させるためのフィールド(土地)を与え, これらの資源をめぐってより環境に適応した樹形を生成する個体がより多く生き残るシステムを作成した。以下では, 本研究で使用したシステムを説明し計算結果を示す。