著者
木村 麻衣子
出版者
日本図書館情報学会
雑誌
日本図書館情報学会誌 (ISSN:13448668)
巻号頁・発行日
vol.64, no.4, pp.147-165, 2018 (Released:2018-12-18)
参考文献数
55

国内で構築されている漢籍デジタルアーカイブの運営状況を明らかにし,漢籍デジタルアーカイブの横断検索を実現するために解決すべき問題点を整理することを目的として, 2 段階の質問紙調査と訪問調査を実施した。68 機関より合計77 件の漢籍デジタルアーカイブに関する有効な回答を得た。デジタルアーカイブの連携を目指して策定されたガイドラインの枠組みに沿って問題点を整理した結果,これらの漢籍デジタルアーカイブは,画像データの作成や提供に関しては必要なレベルをおおむね満たしているものの,メタデータの提供や共有についての達成度が比較的低かった。特に,漢籍のメタデータのみを抽出することができるデジタルアーカイブは43.4%に留まり,今後漢籍デジタルアーカイブの横断検索を実現するためには,個々の漢籍デジタルアーカイブがメタデータをより連携しやすい形で再整備する必要がある。
著者
谷口 祥一 木村 麻衣子
出版者
日本図書館情報学会
雑誌
日本図書館情報学会誌 (ISSN:13448668)
巻号頁・発行日
vol.64, no.2, pp.59-76, 2018 (Released:2018-07-04)
参考文献数
17

国立国会図書館件名標目表において,細目を伴った件名標目には代表分類記号が原則付与されていない。国立国会図書館作成の書誌レコードに付与された細目付き件名と日本十進分類法 9版の分類記号の組み合わせの中から,当該件名の代表分類記号となりうるものを機械学習によって同定することを試みた。 まず,出現した件名・分類記号ペアに対して人手によって適切性を判定し,機械学習用の学習・評価用データを整備した。その結果,件名を構成する主標目の代表分類記号と完全一致または前方一致となる分類記号の約 8割が,細目付き件名の代表分類記号として適切と判定された。 機械学習の適用実験では,学習用データの設定において 2つの方式,件名・分類記号ペアの属性群設定において 5つの属性集合,それに 7つの機械学習法という条件を組み合わせた実験とした。実験の結果,機械学習は一定程度の有効性は見せたが,大きく有効との結果を示すまでに至っていない。
著者
木村 麻衣子
出版者
三田図書館・情報学会
雑誌
Library and information science (ISSN:03734447)
巻号頁・発行日
no.72, pp.63-93, 2014

原著論文【目的】本研究の目的は, 韓国, 日本, 台湾, 香港の図書館および米国議会図書館(LC)で作成されている韓国人・団体著者名典拠データの表記を比較し, 相違点を発見して, 典拠データ相互運用のための課題を整理することである。【方法】まず韓国人名・団体名の表記の特徴を概観した後, それらの特徴を踏まえ, 韓国人名・団体名の典拠データを表記する上で地域や機関によって多様性が存在すると考えられる点を調査項目として設定した。調査項目は, ①ハングル形の扱い, ②漢字形の扱い, ③ローマ字形の扱いと種類, ④姓名の分かちとカンマの有無, ⑤韓国以外の地域における現地特有の表記(カタカナ等)の5点である。次に調査対象機関について文献調査およびインタビュー調査を行い, あわせて閲覧可能な典拠データについては確認作業を行った。調査の結果から, 各機関の表記の相違点をまとめ, 典拠データの相互運用のための課題を整理した。【結果】表記の調査を行った8機関のうち, ①ハングル形の記録を必須としているのは3機関, ②漢字形の記録を必須としているのは1機関のみであった。③ローマ字形は4機関が必須としていたが, ローマ字の種類は統一されておらず, 同定のための有力なキーにはならないと考えられる。④日本と台湾では, 漢字形, ハングル形, ローマ字形のいずれの形でも姓名の間を分かち書きしていたが, その他の機関では分かち書きはローマ字形のみで行われていた。⑤日本では日本語ヨミや韓国語ヨミ, 香港やLCでは日本語ローマ字ヨミや漢語ピンイン形などが見られた。ハングル形と漢字形は, 必須としている機関は少ないものの, 判明すれば参照形に記述している機関が多く, 現代では漢字名が不明の著者もいることから, ハングル形を同定のための有力なアクセスポイントとした上で, 漢字形やその他の付記事項を積極的に記録することが望ましい。Purpose : This study aims to compare representations of Korean personal and corporate name authority data in South Korea, Japan, Taiwan, Hong Kong and the Library of Congress (LC) in order to identify differences and issues affecting name authority data sharing.Method : First, characteristics of Korean personal and corporate name representations were overviewed. Second, from these characteristics, five check points considered to be important in creating Korean name authority data were set. Subsequently, manuals, formats, and case reports of organizations were collected, and face-to-face interviews were conducted. Available data were also used to confirm actual authority data.Results : Of the eight organizations studied, (1) Hangul script forms are mandatory in three organizations. (2) Hanja script forms are mandatory in only one organization. (3) Romanized forms are mandatory in four organizations, but Romanization schemas are different among organizations. Thus, Romanized names are not strong candidate keys for data identification. (4) Organizations in Japan and Taiwan separate surnames and given names in all forms of names, but other organizations examined in this study separate them in Romanized forms only. (5) Some organizations adopt representations in their local language. Although only a few organizations adopt Hangul and Hanja script forms as mandatory, many organizations record them as variant access points if they are known. Since Hanja forms are often difficult to obtain, especially for relatively new authors, it is desirable to set Hangul script forms as strong possible keys for data identification, and to try to record Hanja and other designations as much as possible.
著者
木村 麻衣子
出版者
三田図書館・情報学会
雑誌
Library and information science (ISSN:03734447)
巻号頁・発行日
no.69, pp.19-46, 2013

原著論文【目的】日本を含む漢字文化圏の国々では, 1 つの著者名に対して多様な表記が存在する。欧米における著者名典拠データ共有の場面では, 漢字文化圏の表記の複雑さが理論的に反映されていないため, 漢字文化圏特有の事情をふまえた典拠情報の共有については, 漢字文化圏の中で詳細に検討すべきである。本研究の目的は, 中国人・団体著者名の中国, 日本, 韓国における表記を比較し, 相違点を発見して, 典拠データ共有のための課題を整理することである。【方法】まず, 中国, 日本, 韓国における典拠コントロールの状況を概観し, 中国人・団体著者名典拠データ作成を行っている機関を研究対象として選出した。次に, 機関によって多様性があると考えられる表記上の項目として, ①漢字形の文字種, ②ローマ字形の種類と扱い, ③姓名の分かちとカンマの有無, ④中国以外の地域における現地語(カナヨミ, ハングルヨミ)表記の有無と方法, を設定した。そして, 研究対象とした各典拠データベース作成機関で中国人・団体著者名典拠データを作成するために使用しているマニュアル, 実際のデータの一部, 事例報告等の資料を収集し, 収集した資料を用いて, 各典拠データの項目①から④の状況を比較し, 各典拠データの相違点から, 漢字文化圏における中国人・団体著者名典拠データ共有に際しての課題を整理した。【結果】①各機関が使用している漢字形の文字種にはばらつきがある, ②ローマ字形は全機関が漢語ピンインを採用しているが, 漢語ピンインの記述方法に相違点が見られる, ③漢字形の姓名の分かちは日本を除くほとんどの機関が行っていないが, 多くの機関がローマ字形にはカンマを使用している, ④日本ではカナヨミ形は必須, 韓国では漢字の韓国語読みハングル表記または漢語ピンインの韓国語読みハングル表記が記述されていることが明らかとなり, 漢語ピンインの記述方法や異体字の扱いなどに課題が見られた。
著者
斎藤 早苗 河原 俊昭 高垣 俊之 ライト キャロリン 木村 麻衣子
出版者
東海大学
雑誌
基盤研究(C)
巻号頁・発行日
2011

次の3点に注目する。(1)現地調査のためのアンケート及びインタビューの調査票の作成と検討、(2)10の地方都市地域における外国人住民のための言語支援の実態の把握のため地方自治体の取り組みと外国人住民が直面している日常生活での諸問題問題の把握、(3)国際学会における研究の中間と成果発表である。調査の結果、様々な問題や不便さの中でも特に「表現の平易化」と情報が行き届いていないことが明らかになった。従って、地方自治体をはじめ、教育関係者や個々の日本人が外国人住民が健全にそして十分に参加できる共生社会づくりに向けて簡略化した言語の提供と生活に必要な情報の普及に関して対応策を打ち出すことを提言する。