著者
近藤博人 松本 隆一 柴山 守 山田 奨治 荒木 義彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.6, pp.1-8, 2003-01-24
被引用文献数
8

古文書画像を対象にした翻刻支援システムの構築を行っている。本稿では、文字認識の対象となる標題画像の射影ヒストグラムから推定した探索範囲に対して、文字パターン辞書から取り出した文字パターンを探索範囲内の最大文字幅で正規化しテンプレートとしてマッチングを行う、切り出しを前提としない認識手法について述べる。本手法を用いた実験では、近世の借金等証文類を中心にした『伏見屋善兵衛文書』(約1 900点、大阪市立大学所蔵)から200標題(及び、辞書に存在しない文字、又はサンプル数の少ない文字が含まれる標題を除く151標題)を対象として認識実験を行い、翻刻結果とする候補文字の抽出を行った。結果は、認識後の候補文字の抽出における認識率は、59.5%(69.7%)の結果であった。そこで設定に失敗した探索範囲を分析し、文字パターン辞書に含まれる特異な形状をもつ文字種に対する正規化、および先頭文字における適切な探索範囲を再設定する改良によって、候補文字の抽出においては70.4%(83.1%)の結果が得られた。We have developed a transliteration assisting system which recognizes the character in the document written by calligraphic brush in the historical materials.This paper describes new recognizing scheme which tries to recognize the character without segmentation in the search area estimated from the projection histogram in a title image. A template image, which is a character pattern image extracted from the character pattern dictionary, before template-matching is normalized to be adjusted to a width of character pattern in the searching area after extracting from the dictionary. In an experiment for recognizing 200 titles(151 titles for eliminating them with few character patterns in the dictionary) in the Fushimiya Document, the recognizing rate was 59.5%(69.7%). Furthermore, in the experiment by improving the appropriate normalization for some characters with special shape, and the connection for joining divided searching areas at first character in title image, the result of the recognizing rate was 70.4%(83.1%).
著者
柴山 守 笠谷 和比古 加藤 寧 山田 奨治 川口 洋 原 正一郎 並木 美太郎 柴山 守 石谷 康人 梅田 三千雄
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
2002

本研究は、古文書翻刻支援システム開発プロジェクト(HCRプロジェクト)において、手書き文字OCR技術などを発展的に応用して、古文書文字認識システムの高精度化に関する研究を行うことである。平成14-16年度の研究期間において、主に古文書文字データベースを構築すること、及び日本語文字認識アルゴリズムの適用可能な範囲と問題点を洗い直し、以下の検討課題での研究をすすめ、成果を挙げた。(1)文字切り出し法、及び正規化法について:射影ヒストグラム、文字外形の曲率などの手法を検討し、レイアウト認識では、Hough変換による行抽出方式を提案し、文字データベースの基づく実験を進めた。(2)オフライン文字認識手法について:古文書文字認識に有効と考えられる文字切り出しと文字認識を連携処理させる方法について検討した。非線形正規化手法の研究及び実験を行った。(3)オンライン文字認識手法について:くずし字検索等に適用可能なタブレット入力によるオンライン古文書文字認識手法について検討した。また、『くずし字解読辞典』の文字画像から筆順を推定する手法の研究を行った。本成果は、電子くずし字辞典として平成17年度中に刊行する予定である。(4)東京堂出版『漢字くずし方辞典』の文字パターンを入力し、オンライン検索ソフトウェアの開発を行った。これも上記の(3)に含め、刊行予定である。(5)文字認識用文字パターン辞書として、9種類の古文書文字データベースを公開した。すべてがHCRプロジェクトのホームページは,http//www.nichibun.ac.jp/shoji/hcr/からダウンロード可能である。また、公開したソフトウェアは、2種類GetAMojiマクロ(古文書翻刻中に遭遇する不明文字(ゲタ文字)の正解候補を提示する機能)、及びWeb版GetAMoji(古文書翻刻中に遭遇する不明文字(ゲタ文字)の正解候補を提示する機能のWeb版)である。
著者
武内 恵美子 山田 奨治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.9, pp.73-80, 2007-01-27

本研究は、江戸時代の上方歌舞伎における演奏者の活動傾向を、主成分分析を行うことによって解明しようとする試みである。安政5(1858)年から慶応3(1867)年までの10年間に発行された上方の役割番付511点を基礎データとし、演奏者の劇場への出演傾向を調査した。さらに主成分分析を行うことによってそこに一定の要素すなわち「角」「中」「天満」の各劇場への主成分が検出できることがわかった。このことから、演奏者の歌舞伎への出演傾向は劇場の「格」と関係があり、ある程度の劇場に固定して出演する傾向を示す演奏者が存在すること、したがって「格」が演奏者にも適用される可能性があることを解明することができた。In this study, I attempted to analyze the casting pattern of Kabuki musicians in the Kyoto and Osaka area by using the Principal Component Analysis. I constructed a data from 511 Kabuki "yakuwari Bandukd\ casting programs of the Kyoto and Osaka area in the Edo period, from which I extracted some casting patterns of the musicians. The analysis of the data shows that there had been several principles of each theater such as "Kadd\ "NaJca" and "Tenma". The analysis also enables to illuminate that the casting pattern of musicians is determined by "kakii\ these principles of each theater which are considered as a rank. Moreover, the analysis of data implies that the rank of theater is applied to the rank of groups of musicians.
著者
渡辺 晃宏 馬場 基 市 大樹 山田 奨治 中川 正樹 柴山 守 山本 崇 鈴木 卓治
出版者
独立行政法人文化財研究所奈良文化財研究所
雑誌
基盤研究(S)
巻号頁・発行日
2003

奈良文化財研究所では、1961年に平城宮跡で初めて木簡を発掘調査して以来、20万点を超える木簡を調査・研究してきた。今回の研究では、この蓄積と、文字認識や情報処理に関する最新の情報学・情報工学との連携を図り、(1)木簡の情報を簡易にデジタル化するシステムの開発、(2)木簡の文字画像データベースの作成、(3)木簡解読支援データベース群の構築、(4)木簡の文字自動認識システム(OCR)の開発の4点を軸に研究を進め、木簡の文字画像データベース「木簡字典」と、木簡の文字解読支援システム「Mokkan Shop」(モッカンショップ)を開発した。「木簡字典」には、カラー・モノクロ・赤外線写真・記帳ノート(木簡の読み取り記録)の4種類の画像を掲載しており、これまでに約1,200字種、約20,000文字を収録した。「Mokkan Shop」には、今回開発した墨の部分を抽出するための画像処理手法や欠損文字に有効な文字認識システム、及び今回入力した古代の地名・人名・物品名のデータベースに基づく文脈処理モジュールを搭載し、解読の有効性を高めることができた。これにより、全体が残るとは限らない、また劣化の著しい、いわば不完全な状態にあるのを特徴とする木簡を対象とする、画期的な文字の自動認識システムの実用化に成功した。「木簡字典」と「Mokkan Shop」は、木簡など出土文字資料の総合的研究拠点構築のための有力なツールであり、当該史料の研究だけでなく、歴史学・史料学の研究を大きく前進させることが期待される。なお、今回の研究成果の公開を含めて木簡に関する情報を広く共有するために総合情報サイト「木簡ひろば」を奈良文化財研究所のホームページ上に開設した。また、WEB公開する木簡字典とは別に、『平城宮木簡』所収木簡を対象とした印刷版「木簡字典」として、『日本古代木簡字典』を刊行した。
著者
山田 奨治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.32, pp.1-8, 2005-03-19

文化が変容を遂げながら時間と空間を越えて拡散してきたことの価値と,現在の知財保護で主流となっている価値観には,相容れない部分がある.この論文では,主として文化学の観点から知財保護のあり方を見直す.まず,シャノンの情報理論にあてはめた「文化伝達の一般モデル」を示す.このモデルでは,文化の伝達においては,情報の符号化と復号化に使われる「コードブック」が情報の送り手と受け手で異なることと,情報伝達行為を通して「コードブック」がダイナミックに上書きされることを重視する.つぎに,「日本からみた文明モデル」を示す.このモデルは,日本と西洋・アジアとの関係を規定するもので,西洋に対する憧憬と超克あるいは追従,アジアに対する蔑視と抑圧あるいは支配という重層化された構造を持っている.明治以後の日本は,現在もなおこのモデルに示されるような文明観を維持している.そして,国際知財保護をめぐる日本側の言説は,「日本からみた文明モデル」を忠実に踏襲したものであることを示す.これらの実例として,海賊版によって日本のテレビドラマがアジアの若者に影響を与えていることなどを示す.海賊版が日本文化の流通のための,強力な社会基盤となっている現状を分析するとともに,文化拡散の運動を阻害しない知財保護のあり方を検討する必要性を指摘する.Some discrepancies exist between the values that human culture has been diffused over time and space with transfigurations and the sense of values of recent intellectual properties (IP) protection. In this article, I propose some new view points for IP protection, on the basis of the cultural studies. First, I describe "the generalized model of cultural transmission," applying Shannon's information theory. This model emphasizes the following two points: the sender's encoding "code book" and the receiver's decoding "code book" are incompatible in cultural transmission; the "code books" are dynamically overwritten through the cultural transmission. Next, I describe "the civilization model around Japan." This model defines a relationship among Japan, the West, and Asia. It has a multi-layered structure: longing, overcoming, or servility to the West ; despisement, coercion, or domination to Asia. Japanese people and goverment after the Meiji period, thus far, keep the view of civilization presented in the model.Japanese discourses of international IP protection are revealed to successing "the civilization model around Japan." I introduce some recent examples of this point: e.g., Japanese TV dramas affect Asian young people through pirated VCDs. Finally, after the analysis of the fact that the pirated contents have been playing an important role as a powerful infrastructure for the distribution of Japanese culture, I point out the necessity of reconsidering the principles of IP protection, avoiding the inhibition of cultural diffusion.
著者
山田 奨治 早川 聞多 相田 満
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.112, pp.39-46, 2006-10-27
被引用文献数
2

『古事類苑』は,明治政府の一大プロジェクトとして明治12年(1879)に編纂がはじまり,明治29年(1896)から大正3年(1914)にかけて出版された,本文1 000巻,和装本で350冊,洋装本で51冊の大百科事典である.そこには,前近代の文化概念について,明治以前のあらゆる文献からの引用が掲載されており,人文科学研究を行ううえでたいへん有用な事典として,いまでも利用されている.この『古事類苑』を電子情報資源化して活用すべく,著者らはその全頁の画像入力を行い,さらに全文テキスト入力作業を進めている.この論文では,現在までの作業の方法・進捗・課題点,インデックスからのシソーラス辞書作成,そしてHTML版の一部試験公開とWiki版の試作状況について報告する.Kojiruien (The Dictionary of Historical Terms) is a kind of large-volume Japanese encyclopedia with 1,000 volumes in original form, 350 volumes in Japanese-style binding, and 51 volumes in Western-style binding, which started editing in 1879 as a big project conducted by Government of Japan, and published during 1896 to 1914. It contains numerous words and cultural concepts of pre-modern Japan, citing plenty of books and documents before Meiji restoration (1867), and is frequently used even today among scholars of the Humanities. We are conducting a digital \it Kojiruien \rm project, with scanning every page images and making full-text data to utilize it as an electric information resource. In this report, we discuss on the project status, method, difficulty, thesaurus extraction from the index, making and public opening of the HTML version, and trial of the Wiki-based system.
著者
小沼 元輝 朱碧 蘭 山田 奨治 柴山 守 中川 正樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.91-96, 2007-03-09
被引用文献数
2

本稿では,電子くずし字辞典に用いるロバストな文字認識の開発について述べる.古文書の翻刻作業を特定の専門家以外でも可能にし,その効率を高めるために,古文書で標準的に用いられるくずし字の辞典を電子化し,翻刻の利便性を向上させることが有効である.我々は,67,739種のくずし字に対する認識システムを開発した.くずし字までいかない通常の字体に対しても現有の認識システムを利用できるようにした.採用手法は,現在の文字パターンに対して一定の認識率を保証しているので,実用に耐えることを期待しているが,現実課題のサンプルパターンが少ないために,定量的な評価は今後の課題とする.
著者
山田 奨治
出版者
共同通信社
雑誌
共同通信
巻号頁・発行日
2019-02-07

共同通信 2019年2月7日配信、東奥日報、河北新報、徳島新聞、山陰中央新報、西日本新聞、SankeiBiz、高知新聞、秋田さきがけ、北海道新聞、中国新聞、神奈川新聞、静岡新聞、岐阜新聞等に掲載された記事の著者原稿
著者
山田 奨治
出版者
京都新聞社
雑誌
京都新聞
巻号頁・発行日
2007-09-13

2007年9月13日夕刊
著者
Herrigel Eugen 秋沢 美枝子 山田 奨治
出版者
国際日本文化研究センター
雑誌
日本研究 (ISSN:09150900)
巻号頁・発行日
vol.38, pp.253-262, 2008-09

オイゲン・ヘリゲルが戦時中に出版したもののうち、その存在がほとんど知られていない未翻訳エッセイを研究資料として訳出する。ヘリゲルのエッセイは、日本文化の伝統性、精神性、花見の美学、輪廻、天皇崇拝、犠牲死の賛美について論じたものである。その最大の特徴は、彼の信念であったはずの日本文化=禅仏教論には触れずに、そのかわりに国家神道を日本文化の精神的な支柱に位置づけた点にある。
著者
山田 奨治
出版者
国際日本文化研究センター
雑誌
日本研究 (ISSN:09150900)
巻号頁・発行日
vol.35, pp.527-536, 2007-05

この論文では、日文研でのCMの共同研究の成果を踏まえて、テレビ・コマーシャル(CM)による文化研究の過去と現状を通覧する。日本のCM研究は、映像のストックがない、コマーシャルを論じる分野や論者が極めて限定されていたという問題がある。CMによる文化研究という面では、ロラン・バルト流の記号分析を応用した研究が八〇年代初頭からみられた。しかし、研究の本格的な進展は、ビデオ・レコーダが普及した八〇年代後半からだった。その後、CMの評価の国際比較、ジェンダー、CM作品の表現傾向と社会の相関を探る研究などが生まれた。 現代のCM研究者は、CMという言葉から通常私たちが想像するような、一定の映像様式が存立する根本を見直しはじめている。名作中心主義による研究の妥当性、CMに芸術性をみいだそうとする力学の解明、CMを独立した単体ではなくテレビ番組との連続性の中に定位しようとする研究、CMと国民国家の関係を問う研究などが進められている。 しかしながら、CM研究をさらに進めるには、映像資料の入手可能性、保存体制などに大きな限界があり、研究環境の早急な改善が必要である。
著者
山田 奨治
出版者
国際日本文化研究センター
雑誌
日本研究 (ISSN:09150900)
巻号頁・発行日
vol.35, pp.527-536, 2007-05
被引用文献数
1

この論文では、日文研でのCMの共同研究の成果を踏まえて、テレビ・コマーシャル(CM)による文化研究の過去と現状を通覧する。日本のCM研究は、映像のストックがない、コマーシャルを論じる分野や論者が極めて限定されていたという問題がある。CMによる文化研究という面では、ロラン・バルト流の記号分析を応用した研究が八〇年代初頭からみられた。しかし、研究の本格的な進展は、ビデオ・レコーダが普及した八〇年代後半からだった。その後、CMの評価の国際比較、ジェンダー、CM作品の表現傾向と社会の相関を探る研究などが生まれた。 現代のCM研究者は、CMという言葉から通常私たちが想像するような、一定の映像様式が存立する根本を見直しはじめている。名作中心主義による研究の妥当性、CMに芸術性をみいだそうとする力学の解明、CMを独立した単体ではなくテレビ番組との連続性の中に定位しようとする研究、CMと国民国家の関係を問う研究などが進められている。 しかしながら、CM研究をさらに進めるには、映像資料の入手可能性、保存体制などに大きな限界があり、研究環境の早急な改善が必要である。