著者
大久保 ゆう
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.59, no.12, pp.829-838, 2017-03-01 (Released:2017-03-01)
参考文献数
3

ボランティアで運営されているインターネット上のデジタルテキスト・アーカイブである青空文庫は,その主たる形式として,テキストファイル(拡張子.txt)を扱っている。本稿では,テキストファイルに施す青空文庫独自の注記や,作業にまつわる問題点や解決法,そのほかテキストファイルの利点などを,その歴史的な経緯や今後の展望とともに解説する。とりわけJIS漢字コードと,書籍の体裁や組み版の情報を残すための注記を,いかに整理して効率的に運用するかが課題であり,そのためのツールや資料が各種開発されたことを概説するものである。
著者
大久保 ゆう
雑誌
情報処理
巻号頁・発行日
vol.55, no.5, pp.470-474, 2014-04-15

青空文庫は,利用者から見れば,著作権保護期間の満了した本を中心に収蔵する「インターネット図書館」であるが,組織運営としては,クラウドソーシングを主体としたボランティア活動である.本記事では,1997年に創設された青空文庫の活動を初期・中期・後期・それ以後の4つに分け,情報技術とクラウドの変化に合わせた協働作業の形態の変遷を解説する.さらに,活動開始と同時に提唱された「青空文庫」という概念自体の発展に関連して,クラウドソーシングの可能性についても触れる.
著者
大久保 ゆう
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.2, no.2, pp.87-90, 2018-03-09 (Released:2018-05-18)
参考文献数
2

1997年7月に創設された「青空文庫」は、誰にでもアクセスできる自由な電子本を、図書館のようにインターネット上に集めようと考えて、20年のあいだ民間ボランティアによる活動を続けてきた。また初期から電子化の軸となるファイルに「テキストファイル」を選び、書籍から電子化する際のルールを厳格に定めるとともに、ファイル共有の実現のために必要かつ妥当なあり方を作業するなかで探求し続けてきた。その活動のなかで確立された電子化ルールは、通称「青空文庫形式」とも呼ばれているが、現在は作業マニュアルおよび「注記一覧」としてまとめられた上で一般公開され、青空文庫内外で活用されている。本発表では、青空文庫で用いられているテキストファイル化のルールについて、その誕生から発展・活用に至った経緯、そしてその品質管理を論じるものである。20年の電子化活動から生まれた、日本語(による/のための)マークアップの可能性を再考したい。