著者
北本 朝展 堀井 洋 堀井 美里 鈴木 親彦 山本 和明
雑誌
じんもんこん2017論文集
巻号頁・発行日
vol.2017, pp.273-280, 2017-12-02

本論文は古典籍「武鑑」を対象として,大規模データを構造化するための全く新しいワークフローを提案する.まず「武鑑」を時間的に連続して変化する「時系列史料」という新しい種類の史料と捉え,そこから生み出される多数のバージョンをソフトウェア工学の観点から解釈し,これを板本書誌学の概念と対応させる.次にバージョン間の差分を検出する方法としてテキストベースと画像ベースのアプローチを比較し,「武鑑」では特に画像ベース差分検出が有効であることを示す.さらに差分検出と差分翻刻を合わせたアプローチを「差読」と呼び,そのためのワークフローを「人機分業」として構築することが「武鑑」の構造化の鍵を握ることを論じる.その最初の成果を「武鑑全集」として2017年11月に公開した.
著者
李 康穎 Batjargal Biligsaikhan 前田 亮
雑誌
じんもんこん2017論文集
巻号頁・発行日
vol.2017, pp.125-130, 2017-12-02

篆文は今でも広く使用されている古代の書体である.しかしその字形は抽象性が高いため,専門的な知識を持たない人にとって篆文字形を読むのは非常に難しい.また,現存の篆文の記載に使用する文献資源が極めて少ない状況であり,利用できる篆文の画像データも不足しているため,篆文に基づくOCR システムもほとんど存在しない.本研究は小篆の篆文書体を研究対象とし,白川静の漢字研究の成果に基づく「白川フォント」中の小篆書体の文字と「説文解字フォント」中の白川フォントと対応する文字をGenerative Adversarial Network に基づくzi2zi モデルの入力データとして利用し,生成された画像の変形処理を行う.処理した後の画像ファイルを訓練データとして使用し,文字認識の実験を行った.本論文では,生成した画像を手書き篆文の認識モデルの訓練データとして用いる手法を提案し,今後の手書き篆文文字の検索支援の実現に向けた基礎を構築することを目指す.
著者
山本 峻平 佐藤 弘隆 髙橋 彰 河角 直美 井上 学 矢野 桂司
雑誌
じんもんこん2017論文集
巻号頁・発行日
vol.2017, pp.199-206, 2017-12-02

本研究では,1978(昭和53)年に全面廃止となった京都市電の写真資料に撮影位置の情報を付加させたデータベースを構築し,それを活用した過去の記憶のアーカイブの可能性について検討する.過去の京都市電の写真の撮影位置を特定するには,過去の大縮尺の地図などを用いることが有効である.しかし,都市景観の急速な変化から,撮影場所を特定することが難しい場合も多い.そこで,本研究では,クラウドソーシングを用いた撮影場所の特定方法を提案した.また,一般市民を対象とした京都市電の写真の展示会を実施し,過去の写真と大縮尺の地図を用いて,人々の過去の記憶のアーカイブの作成を行った.その結果,写真や史資料に残らない,当時の生活や体験などに関する記憶を蓄積することが可能となった.
著者
齊藤 鉄也
雑誌
じんもんこん2017論文集
巻号頁・発行日
vol.2017, pp.89-96, 2017-12-02

本論文では,源氏物語の短い本文を持つ巻の,写本本文の仮名のNgram を用いた系統分類の調査結果を述べる.表記が異なる本文データのNgram を用いた巻ごとの分類結果からは,3gram から5gramの調査データで,青表紙本系統と河内本系統の分類ができること,系統分類が明瞭な巻と不明瞭な巻があることを明らかにした.加えて,文学や文献学の系統分類の研究成果と本調査結果を比較し,その分類結果が一致している点があることから,本調査方法に一定の有効性がある可能性を示した.
著者
ホドシチェク ボル 山本 啓史
雑誌
じんもんこん2017論文集
巻号頁・発行日
vol.2017, pp.207-212, 2017-12-02

本稿の目的は、歌ことばの辞書を開発するにあたり、従来の「見出し語とその解説」による辞書記述に加え、「見出し語 関連語」形式の関連対の追加を提案することである。関連対によれば、従来の辞書に不足していた語と語を取り持つ関係概念を示すことができるだけでなく、古代語の意味記述の困難さを解消する方法であることを示す。和歌を題材とするネットワーク構造のデータから、見出し語(梅、桜、橘)との関連対となる語の抽出を試みた。R パッケージlinkcomm (Kalinka and Tomancak 2011)の3 種の計算方法を用いて行った結果、どの計算方法においてもほぼ同様の抽出ができ、それら語は和歌の文脈において各見出し語の関連対として取り出せたことが確認できた。