著者
小倉 英里 工藤 真代 柳 英夫
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.5, pp.1-8, 2010-11-19

グローバル経済が加速する中で,英語版ドキュメントは海外市場進出の要となる.しかし,多くのメーカー企業では,英語版ドキュメントの言語品質の低さに悩まされている.英語のネイティブライターが関与していないことも原因のひとつだが,それ以上に,英訳を視野に入れて日本語版ドキュメントが作られていないことが,その最大の原因である.この研究では,英訳しづらい日本語の表現パターンを洗い出し,そのような日本語表現を規制できるかを検証し,規制された日本語は,その英訳の品質が改善することを明らかにした.Creating content in English plays an important role for globalizing businesses. However, the quality of English documents is an obstacle in many Japanese companies. This situation can stem from limited resources, such as the number of in-house English-native proofreaders. But the root cause of the problem is that the Japanese source documents are not ready for translation into English. In this research, we identify the patterns of problematic Japanese expressions in Japanese-English translation in order to determine whether these expressions can be controlled in the source language. Our analysis reveals that controlling the source language can improve the quality of English translation and reduce the time and the cost of translation tasks.
著者
鈴木 俊哉
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.7, pp.1-8, 2009-07-23

昨年、7 年間の作業を経た CJK 統合漢字拡張 C が ISO/IEC 10646:2003 の Amd.5 として正式に発表された。拡張 C ははじめて原規格分離を適用せずに整理された漢字集合である。拡張 C への中華人民共和国からの申請は辞典類から収集された漢字が大半である。本発表では、その中で最大の収集元である「殷周金文集成引得」に由来する 1800 字程度の図形集合について、典拠を再調査した結果を報告する。拡張 C の統合作業中に提出された典拠確認資料を見ると、この収集は「殷周金文集成引得」の総画索引から、拡張Bまでで符号化済みと思われるものを削って選定したと思われる。しかし、選定された漢字を本文中で確認すると、総画索引には出現するが、釈文では使われていないものも少なくないため、それらを全て申請することの妥当性には疑問がある。また、金石学の分野では「古文字字形表」や「金文編」など過去にいくつもの字書が出版されているが、「殷周金文集成引得」の特徴の一つに、見出し字の大半を宋体 (風の図形) にしている点がある。金文字形に対する宋体 (風の図形) が一意的に定まる、言い換えれば「殷周金文集成引得」で導入された図形文字が (この字書の外部でも) 金文字形に対する識別子として機能するのであれば、他の金石学の字書類と整合する筈である。そこで、代表的な金石学字書である「金文編」と「殷周金文集成引得」の比較を行ない、この結果を報告する。また、これらの結果を踏まえ、「殷周金文集成引得」典拠情報の今後の管理方法について考察したい。After the long efforts during 7 years, finally ISO/IEC 10646:2008 has included CJK Unified Ideographs Extension C. This is the first Hanzi collection which is standardized after the expire of the source code separation rule which was introduced for existing regional character encodings. There are 2 large groups of the sources: Hanzi for personal names (especially from TCA) and Hanzi for post-kaisu palaeographic documents (especially from ROK).In Ext. C, PRC submitted 366 glyphs taken from "Index to Collections of the Inscriptions in Yin-Zhou period" (殷周金文集成引得, I2CIYZ). The book is used to lookup Bronze objects (collected in "Collections of the Inscriptions in Yin-Zhou period" (殷周金文集成引得, CIYZ) including a specified Old Hanzi. Most of 366 glyphs taken from I2CIYZ are suspected to be the glyphs invented only for the specification of Old Hanzi.In this report, the submission by PRC and that by UTC are investigated for their original glyphs based on Bronze or Seal scripts (篆文, Zhuan Wen), and their original shapes (in references and evidences) and modernized shapes (in proposal and submission documents) are compared. The unification rules of CJK Unified Ideographs (ISO/IEC 10646 Annex S) are under revision process, but the discussion is based on the information interchange by the stabilized shapes of Hanzi current in use. The glyphs to specify Bronze script shape can be synthesized by different granurality. In fact, the identification rule by IRG Old Hanzi group for Oracle Bone script (甲骨文, Jia Gu Wen) is incompatible with ISO/IEC 10646 Annex S.
著者
ラートサムルアイパン カンウィパー 渡辺 知恵美 中村 聡史
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.6, pp.1-7, 2009-09-18
被引用文献数
3

日本では料理や味覚を擬音語,擬態語を表すオノマトペを用いて「ふわふわケーキ」のように表現することが多い.そこで本研究では,オノマトペを利用した料理レシピ推薦システムの開発をしている.具体的にはWeb上の料理掲載ページよりレシピを収集し,レシピ内の文章を解析する.それにより,オノマトペと固有名詞(料理名,食材など),形容詞,一般名詞,動詞の関連性を数値化する.これらの関連より,レシピに含まれる語からオノマトペとの関連度を算出することで,キーワードサーチと比べて精度の高いレシピ検索システムを目指す.Japanese language is filled with onomatopoeic words, which describe sounds or actions like "click" or "bow-wow". Especially, when talking about foods, Japanese people frequently use onomatopoeic words to express vague taste or sense of the foods. There, we develop a system for searching recipes by using onomatopoeic words as the search keyword. In concrete, we collect recipes from a recipe website, and perform Japanese language morphological analysis, then store the words from the analysis into the database based on their part of the speech. Next, we calculate relation between onomatopoeic words and other types of words. Last, we use the value of relation to find matched recipes to recommend to the user.
著者
簗瀬 拓弥 増田 英孝 山田 剛一 荒牧 英治 中川 裕志
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2013, no.1, pp.1-6, 2013-02-21

本研究では電車の運行状況をリアルタイムに一般の Twitter のユーザのツイートから取得することを目的とする.対象として常磐線をキーワードとして含むパブリックタイムライン上のツイートを半年分収集した.このデータを用いて単位時間あたりのバースト数を元に定常時と異常時を判別し,通知を行うシステムを試作した.また,遅延や運転見合わせ時のユーザのツイートの特徴の分析を行った.Our goal is to extract train services from ordinary twitter users' tweets in real-time. We have collected tweets which includes '常磐線' from public time line over six months. We distinguish abnormal state from normal state by using a burst per minutes in the collected tweets, and we implemented a prototype system which can be notified abnormal state. Also, we analyzed the characteristic of users' tweets when trains are delayed or postponed.
著者
ウメルジアンウスマン 中平勝子 鈴木俊哉 植村俊亮 三上喜貴
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2013-DD-90, no.5, pp.1-8, 2013-07-19

本論文で扱うウイグル文字は,歴史的にはアラム文字を起源とし,アラム文字から派生したソグド文字を直接の祖先として形成された表音文字である.また,ウイグル文字からは,後にモンゴル文字,満州文字などが派生した.ウイグル文字は,縦書き,横書きいずれの書記方向でも書かれてきた.横書きのウイグル文字は中央アジアの西トルキスタンと東トルキスタン地方に見られる.一方,縦書きのウイグル文字は紀元 8-9 世紀頃にトルファン地方で誕生したと考えられ,西はトルファンから東はモンゴルと甘粛に至る広範囲で使われるようになった.検討にあたって,文献作品クダトクビリグと阿毘達磨倶舎論実義疏には,作成者の署名を表すような様々な図形が登場し,これをすべて符号化しようとすれば数百になる.ここで検討が必要なのは,縦書き用の文字と横書き用の文字を,符号として区別するかどうかという点である.ウイグル文字の単語中での文字の位置によって文字図形が変化する文字の場合,異なる図形ごとに異なる符号を与える方式,図形は異なっても同じ音を意味する場合には同じ符号を与える方式 (符号-グリフ分離方式) とがある.ISO/IEC 10646 では符号-グリフ分離方式が採用されていることから,本設計でも,符号-グリフ分離方式を採用した.筆者らは,このウイグル文字の文字符号を確立することによって,ウイグルの貴重な歴史的文献情報の保存と活用の基盤形成に貢献したいという目的をもって研究を行なっている.本論文ではその研究成果であるウイグル文字古文献に基づくグリフデザインの経験について述べる.
著者
竹中 姫子 古宮 嘉那子 小谷 善行
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.1, pp.1-6, 2011-03-21

Twitter ではハッシュタグという,自分の投稿 (ツイート) に則した内容のインデックスをつける機能が提供されている.本研究ではハッシュタグのついていないツイートにたいしてハッシュタグを推定することを目的とする.そこでハッシュタグのついたツイートを学習し,そしてあるツイートがどのハッシュタグに属するかの推定を行った.分類器としてベイジアンフィルターを使用し,それぞれのタグについて 2 値分類を行い,複数のハッシュタグの推定を行った.実験では 50 種類のハッシュタグのつきの約 4 万件のツイートを学習データとして使用した.ツイート文にベイジアンフィルターを適用する場合は既知語に限定して処理を行うことで良い結果が得られるとわかった.In this paper, we propose a method of discovering hashtags, which are indexes in Twitter. We estimate hashtags of tweets without hashtags using tweets with hashtags. Binary classifier was developed for every tweet so as to they have more than one tags, and Bayesian filtering was used to classify. In the experiment, about 40,000 tweets with 50 kinds of hashtags are classified. The result shows Baysian filtering with limiting known words is effective in estimating hashtags of tweets.
著者
小倉 英里 工藤 真代 柳 英夫
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2010-DD-78, no.5, pp.1-8, 2010-11-19

グローバル経済が加速する中で,英語版ドキュメントは海外市場進出の要となる.しかし,多くのメーカー企業では,英語版ドキュメントの言語品質の低さに悩まされている.英語のネイティブライターが関与していないことも原因のひとつだが,それ以上に,英訳を視野に入れて日本語版ドキュメントが作られていないことが,その最大の原因である.この研究では,英訳しづらい日本語の表現パターンを洗い出し,そのような日本語表現を規制できるかを検証し,規制された日本語は,その英訳の品質が改善することを明らかにした.
著者
平野 淳一
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.9, pp.1-8, 2011-03-21

本論では,エジプトを中心とするアラブ世界やイラン,トルコにおいて,新聞や雑誌といったプリント・メディアがどのような歴史的経緯のもとに普及・発達していったのか,ヨーロッパとの国際関係,支配者の政治社会政策,知識人の文化活動などに着目しつつ明らかにする.This paper aims to reconsider a historical and theoretical process of development of the print media in the Arab world, Iran and Turkey, with special reference to their international relationships with the West and the governors' social politics and the intellectuals' cultural activities from the latter half of the 19th century to the beginning of the 20th century.
著者
坂本 俊介 須藤 崇志 丸山 広 中村 太一
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.17, pp.1-6, 2009-07-23

技術文章力を高めるには,個別に添削指導を受けることが有効であるが,時間的な制約により実現が難しい.この問題に対処するため,書き手自身が短時間で何度も文章の客観的な見直しを繰り返し行い,さらに指摘の重要性や修正例を提示する校正支援手法により,学生の文章作成能力の向上に寄与できることを示した.また,学生の実験レポート2,285編から,140,214件の誤りを指摘した結果,学生に多い誤りは句読点および体言止めで79.4%を占めた.同時に,技術文章作成のノウハウを課題やレポートを通じて習得させることの重要性を改めて確認できた.There has been discussion about improving technical writing skills. Individual tutoring which a mentor provides a trainee to correct a technical writing might be the most effective way to enhance the skills. However it is difficult to repeat the tutoring many times because of time consuming job. We propose a method that an author oneself can emend a manuscript repeatedly. The method is based on a recommendation system which implements Japanese grammar and technical writing grammar with a morphological analysis. This paper describes the experimental results obtained from 2,285 reports written by students. The proposing method detected 140,214 technical writing errors in their reports. 79.4% of 140,214 errors are a punctuation mark and the indication of the termination with a substantive and speak that it is effective to teach these errors.
著者
片岡 えり 天笠 俊之 北川 博之
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2012-DD-87, no.2, pp.1-8, 2012-12-15

本論文では, EPUB に対する読書情報の管理を目的として, EPUBCFI を用いた読書情報管理システムを提案する. EPUBCFI とは, EPUB 出版物の任意のコンテンンツを参照するための標準であり, 1) CFI によってコンテンツ内の任意の点が唯一に識別される, 2) CFI 同士を比較することによって,コンテンツ内での順序を判別することができるといった特徴を持つ.本研究では, EPUBCFI を用いて, EPUB 出版物に関連するブックマークやアノテーションなどのメタデータを管理するとともに,それをシステムの利用者間で共有する機能を持った読書情報管理システムを構築する.これにより利用者は,出版物に付箋を貼ったり書き込みといった行為を電子書籍上でできるようになる.さらにそれらを多人数で共有したり、検索やマイニングを行うことにより,現在では不可能なリッチな読書体験の共有を実現することが期待される.このための EPUB での読書情報管理手法,さらにはソーシャルリーディングを行うための手法について議論する.
著者
坂本 俊介 須藤 崇志 丸山 広 中村 太一
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2009-DD-72, no.17, pp.1-6, 2009-07-23

技術文章力を高めるには,個別に添削指導を受けることが有効であるが,時間的な制約により実現が難しい.この問題に対処するため,書き手自身が短時間で何度も文章の客観的な見直しを繰り返し行い,さらに指摘の重要性や修正例を提示する校正支援手法により,学生の文章作成能力の向上に寄与できることを示した.また,学生の実験レポート2,285編から,140,214件の誤りを指摘した結果,学生に多い誤りは句読点および体言止めで79.4%を占めた.同時に,技術文章作成のノウハウを課題やレポートを通じて習得させることの重要性を改めて確認できた.
著者
片岡 えり 天笠 俊之 北川 博之
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2012, no.2, pp.1-8, 2012-12-15

本論文では, EPUB に対する読書情報の管理を目的として, EPUBCFI を用いた読書情報管理システムを提案する. EPUBCFI とは, EPUB 出版物の任意のコンテンンツを参照するための標準であり, 1) CFI によってコンテンツ内の任意の点が唯一に識別される, 2) CFI 同士を比較することによって,コンテンツ内での順序を判別することができるといった特徴を持つ.本研究では, EPUBCFI を用いて, EPUB 出版物に関連するブックマークやアノテーションなどのメタデータを管理するとともに,それをシステムの利用者間で共有する機能を持った読書情報管理システムを構築する.これにより利用者は,出版物に付箋を貼ったり書き込みといった行為を電子書籍上でできるようになる.さらにそれらを多人数で共有したり、検索やマイニングを行うことにより,現在では不可能なリッチな読書体験の共有を実現することが期待される.このための EPUB での読書情報管理手法,さらにはソーシャルリーディングを行うための手法について議論する.
著者
齋藤 準樹 湯川 高志
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.2, pp.1-8, 2011-03-21

本稿では,ソーシャルブックマークに含まれるタグの共起関係から階層的な類語辞書を作成し,それを用いてユーザの興味語を抽出する手法および興味語の類似性によりユーザ推薦を行う手法を提案する.また提案した手法について,Twitter を対象として興味抽出および推薦の精度と意外性に関する評価実験を実施し,有用性の確認を行った結果についても述べる.In the present paper, as a means of extracting user interest for the purpose of user recommendation, the authors propose a method for constructing the hierarchy of words based on SBM tags and to emphasize characteristic word by using this relation. Additionally, the user recommendation system based on this interest extraction is proposed. As a result of a survey on Twitter, the authors discovered that the tags in SBM and their hierarchy have a rich vocabulary for extracting the interests of Twitter users. Moreover, experimental results have indicated that the user recommendation system attains approximately 0.41-0.48 precision if the friend relations in SNS are also utilized as a user preference data.
著者
大野 邦夫
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.6, pp.1-12, 2009-05-29

本報告は、当研究会の技術領域であるデジタルドキュメントの歴史を回顧・考察し、今後の発展に資することを意図したものである。デジタルドキュメントとは、コンピュータで処理される文書であり、プログラム開発のためのテキストエディタや文字ベースのワープロに端を発する。その後、文字以外に、図形・画像を採り入れた複合文書に発展し、最近は映像やアニメといった動的な情報もコンピュータで処理されるようになった。ここでは、その経緯を、情報メディア、データ型、オブジェクト指向技術、XML、Web といった技術面から分析すると共に、標準化、国際会議といった技術動向を背景に、当研究会における研究内容の変遷を述べる。最後に技術的変遷に伴う利用者ニーズ、市場といったビジネス・サービスの現場に基づく社会的・制度的な面についても考察を加える。This report describes the history of digital document, which is created, edited, transformed, distributed, and viewed through computers, and which also is the technical area of SIG−DD. The origin of the digital document was text files edited by text editors or early primitive word processors. After a decade or so, compound document which comprises figures and images with text were created through desktop publishing (DTP) systems. Recently broadband network has enabled the services of the interaction with dynamic content of video or animation. Those content will also be a kind of digital document. The history of digital document has been considered through several concepts and models of information media, data types, object−oriented technology, XML and the web, then the history of SIG−DD has been described with the trend of standardization and international conferences. Finally the history is summerized with social and cultural aspect of customers, market, and standardization movement.
著者
鈴木 俊哉
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2010-DD-76, no.5, pp.1-6, 2010-07-15

第 67 回デジタルドキュメント研究会にて、ページ記述言語 PostScript における標準的な字形指定番号である Adobe CID から、TrueType フォントのグリフへのマッピング方法について発表した。アドホックなマッピング情報を持たないよう、PostScript 資源として提供されている情報のみでマッピングを決定しようとすれば、テーブル構築の際に 0.5~3 秒程度の遅延が発生することを示した。この負荷はラスタ処理が数十秒から数分におよび高解像度の印刷の場合には無視できるが、モニタ表示の観点では問題となる。この負荷は PostScript 資源をフォントごとに読み込んでマッピングを構築するためと考えられるので、PostScript 資源ではなく、近年普及が進みつつある TrueType フォントの UVS サポートを用いて、このマッピング処理を高速化する方法について検討する。
著者
大和 裕幸 稗方 和夫 畑野 勇 新木 仁士
出版者
情報処理学会
雑誌
研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.1, pp.1-7, 2010-01-22
被引用文献数
1

歴史に関する史料にメタデータを付与して管理する歴史研究支援システムを提案する。このシステムは平賀譲デジタルアーカイブを基盤としている。はじめに著者の 1 人が行ってきた従来の歴史研究手順を整理し、史料の管理という問題点を抽出した。その結果を踏まえ、web 技術を用いて史料の書誌情報、所在する URL と研究者のコメントをまとめて保存・管理することで史料同士を関連付ける基本機能を持つシステムを構築する。そして歴史文献や書籍など紙媒体史料もスキャニングによりデジタル化し、アップロードすることで他の史料と同等に取り扱う。また文章のみのテキスト史料だけでなく、テキストデータとして扱えない図面や写真などの様々な史料も画像ファイルとして同様に取り扱うことができるデータ構造とした。事例として巡洋艦コスト削減の歴史研究を行い、提案するシステムの有効性を立証した。A system of supporting historical research is proposed. The system which is based on Hiraga Yuzuru Digital archive attaches metadata to historical documents and manage them. Considering the traditional historical research process, the problem of historical material management is extracted. The function which makes historical materials related developed by web technology. The effectiveness of proposed system is evaluated by verifying the historical research hypothesis about the reduction of cruiser's construction cost.
著者
江村 優花 関 洋平
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2012, no.1, pp.1-7, 2012-03-19
被引用文献数
2

現在,電子メールや Twitter で,顔文字が使用されている.顔文字はユーザの感情を表すのに便利であるが,反面,その種類は膨大であり,適切な一つを選ぶことは難しい.そこで,本研究では,ユーザの顔文字選択支援を目的とし,ユーザが入力したテキストに現れる感情,コミュニケーション,動作のタイプ推定を行い,顔文字を推薦する方法を提案する.感情,コミュニケーション,動作のタイプの推定は k-NN に基づき実装し,推定精度は,マクロ平均で 53.1% となった。また,システムが推薦する顔文字がユーザの意図にどの程度適合しているか実験した結果,66.7% の顔文字が適切に推定されており,感情カテゴリのみを用いて推薦された結果と比べて,提案手法の顔文字推薦の精度が有意に向上していることがわかった.Many users used facemarks in recent computer mediated communication environments such as e-mail, Twitter or facebook. Facemarks are useful to express the emotion or communication functions beyond texts. However, many users feel difficult to choose the right one from lots of candidates. We propose a method to recommend facemarks based on the estimation of emotions, communication, or motion types in texts written by users. We implemented emotion, communication, or motion type estimation system with k-NN, and the accuracy of estimation is 53.1% on macro average. We also estimated the relevance of recommended facemarks for user intention, and found that 66.7% of facemarks were recommended properly, which improved significantly over the recommendation results only from emotions categories.
著者
高橋 正輝 奥野 拓 川嶋 稔夫
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2013, no.9, pp.1-6, 2013-01-11

函館のデジタルアーカイブに含まれる大量の写真資料はメタデータが少なく,写真間が歴史的関連で関連付けられていない.そこで,函館の歴史に関する文献を利用することで写真資料のメタデータを補い写真間が関連付く可能性がある.写真資料と函館市史年表編,はこだて人物誌を Linked Open Data (LOD) として作成し公開する. LOD とは外部とのデータ連携を実現する技術である.函館の歴史資料を LOD 化することで,地域写真アーカイブの編纂を目指す.Photos in Hakodate photo archives have historical relations to each other, but there is no links between them. There is a possibility that the photos are linked by using historical records of Hakodate. This study aims to link the photos in the archives by generating Linked Open Data of photo archives, historical calendar, and historical figure of Hakodate.
著者
小林 龍生
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2011, no.9, pp.1-6, 2011-11-11

システムやソフトウェアの構築に当たっては,利用者側が要求する事項とそれを実現するために開発者側が提供する成果物との間に,程度の差こそあれ必ず差異が生じる.その多くは要求者側と開発者側の間の意思疎通の齟齬に起因する.また,要求者側が要求事項と混同して,自らの知見の範囲内でいわば場当たり的な解決策を提示した結果,開発者側が潜在的に提供しうる高い機能性が実現できないことや,開発者側が要求事項を字義通り鵜呑みにして実装を行った結果,要求者側の本来の意図が実現されないことが多発する.本稿では,主としてEPUBの最新仕様に日本語組み版に必要とされる縦組み機能やルビ機能を盛り込む過程を通して,要求事項の言語化とその要求事項に基づく実現方法のモデル化を試みると同時に,要求する側とそれを実現する側それぞれの留意点を手案する.In IT system development scene, gaps between requirements and solutions are frequently happens. The reasons are usually dis/mis-communication between requirement side and solution side. Especially, confusion between requirements and arbitrary solution in requirement side, and ad Hoc solution for requirements with "word by word solutions" in solution side, are very common and difficult issue. In this paper, a case study from the standardization of EPUB Japanese text layout functionality is reported and a hypothetical model for communication between requirement side and solution side is duscussed. With this duscussion model, some recommendations will be proposed.
著者
白井 涼子 波多野 賢治
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2012, no.2, pp.1-6, 2012-03-19

現在,和歌研究では計算機による和歌データの分析がなされており,和歌研究者の一部では新しい知識発見に寄与するシステム開発を望む声もある.和歌の原本は一冊しか存在せず,多くの人によって書き写されて普及していくことが一般的であるが,その書写過程において,誤字や表現の違いが発生し,同一和歌であっても異なる表記になっていることがある.和歌研究を進めていく上ではそれらの和歌を同一の和歌として扱う必要があるため,同一の和歌の一元的な管理を可能にすることが望まれる.そこで,本稿では RDF による和歌データ管理手法を提案する.RDF による和歌データ管理を行うことで,和歌に関連するあらゆるデータを紐づけることが可能となり,同一の和歌を同一として扱うだけではなく,和歌単体を眺めるだけでは気づかない新たな知識発見に役立たせることが可能となる.Recently, researchers tend to analyze character strings of Japanese poems using computers, and a part of them require someone to develop a system that contributes to find their new knowledge. There is just one original copy of their anthology in the world, so that it becomes widespread thanks to transcription by a lot of people. In their transcription process, however, a literal error and a difference in their spellings may be occurred. As a result, transcriptional Japanese poem is different from its original one. If the researchers want to proceed with their research, original and transcriptional ones should be consolidated. In this paper, we propose an approach for managing Japanese poems using RDF. It can help to bind all data related to a Japanese poem. As a result, we can turn new knowledge into a solution in the research field of Japanese poem.