著者
安形 輝
出版者
三田図書館・情報学会
雑誌
Library and information science (ISSN:03734447)
巻号頁・発行日
no.54, pp.1-18, 2005
被引用文献数
1

原著論文Benedetto et al. recently confirmed the validity of a method for measuring similarity using data compression software. Despite its potential, this method has not yet been applied to the field of information science. The present study proposes the use of CIR, a modified method that uses an improved ratio of compression, and describes two experiments on authorship attribution using data from modern Japanese literature. The first experiment compares the results of applying CIR and Benedetto's method to test collections of modified data (fixed length) using aprocedure similar to that described by Matsuura et al. The second experiment is based on original data (variable length).The first experiment showed an average precision rate of 97.7% for CIR, while Benedetto's method gave a rate of 90.5%. The CIR method proves to be an improvement on the best method described by Matsuura et al. The second experiment confirmed the e
著者
安形 輝 安形 麻理
出版者
三田図書館・情報学会
雑誌
Library and information science (ISSN:03734447)
巻号頁・発行日
no.61, pp.1-23, 2009

原著論文【目的】 未解読文書に関する研究は、文書内容の解読に焦点を当てたものが多い。 しかし、長年にわたって解読不能である文書は、何らかの意図で作成された意味をなさない「捏造文書」 であり、そもそも解読自体ができない可能性もありうる。 本研究の目的は、文書構造の有無から解読可能性そのものを判定する手法を提案することである。 【方法】 既存の多くの言語に応用可能なテキスト処理技術は未解読文書に対しても有効であるという前提に基づき、未解読文書の部分文書同士の類似度をクラスタリング手法によって分析することにより、首尾一貫した文書構造の有無を検証する。 次に、本書構造と、図表やページ順など他の手がかりから導かれる構造との対応関係を比較 分析することによって、「捏造文書」を判定する 。 【結果】 提案手法を用いて有名な未解読文書であるヴォイニッチ写本を分析した結果、本文の構造と挿図・ページから推測される構造が一致することが明らかになった。つまり、ヴォイニッチ写本は一貫性のある構造を持つ文書であり、「捏造文書」ではない可能性が高いと判定できる。実験により提案手法の適用可能性を示すことができた。
著者
大場 博幸 安形 輝 池内 淳 大谷 康晴
出版者
日本図書館情報学会
雑誌
日本図書館情報学会誌 (ISSN:13448668)
巻号頁・発行日
vol.58, no.3, pp.139-154, 2012-09-30
被引用文献数
1

日本の公共図書館・大学図書館・国立国会図書館の所蔵傾向について包括的な調査を行った。2006年上半期に刊行された約3万5千点の書籍を対象とし,2010年にカーリルやWebcat Plus等を通じて所蔵館数を調査した。調査対象の書籍について出版点数と需要を軸に分布を示し,館種別の所蔵数の分布と比較した。また,絶版書籍や選定図書の所蔵率も調べた。結果から次のことが明らかになった。第一に,公共図書館群は8割以上の所蔵率を示した。この結果は,公共図書館の蔵書が共通の書籍に集中しているわけではないことを推定させる。第二に,大学図書館群は出版点数や需要の分布とは異なる所蔵の偏りを見せること。これは,大学図書館が選択的な所蔵をおこなっており,かつ図書館間でその評価基準が共有されていることを推測させる。第三に,国立国会図書館には約1割の所蔵もれがあり,これは先行文献で報告されていたことと同様だった。
著者
大場 博幸 安形 輝 池内 淳 大谷 康晴
出版者
日本図書館情報学会
雑誌
日本図書館情報学会誌 (ISSN:13448668)
巻号頁・発行日
vol.62, no.2, pp.83-100, 2016 (Released:2016-11-11)
参考文献数
23

公立図書館における中立・公平な所蔵について検討した。2014 年から2015 年にかけて日本国内で論議された「集団的自衛権」を主題とする91 点の書籍の所蔵について調べた。書籍を賛否に従ってグループ分けしたところ,需要においては賛成本が勝っていたが,否定本のほうが4倍弱多く所蔵されていた。一点当たりの所蔵数においては否定本が1.2 倍程度有利に所蔵されていた。所蔵に影響する他の要因も含めて重回帰分析をしたところ,出版社の信用(特に岩波書店刊行書籍),需要,書籍の質などの要因とともに,否定本であることも有意な要因であった。続いて,賛否の所蔵数の比を基準に図書館設置自治体をグループ化し,所蔵規模別に検討した。結果,所蔵規模が大きくなるほど中立的となり,小さくなれば賛否どちらかに偏ること,特に否定本に偏るケースが多いことが明らかになった。否定本のみ所蔵する自治体は全体の1/4 強存在した。
著者
安形 輝 上田 修一
出版者
日本図書館情報学会
雑誌
日本図書館情報学会誌 (ISSN:13448668)
巻号頁・発行日
vol.65, no.2, pp.84-96, 2019 (Released:2019-06-28)
参考文献数
25

印刷本のうち,電子書籍版が提供される割合は,年々,高まっていると考えられる。電子書籍化の進展を測るために,国立国会図書館の蔵書から印刷版の書誌データを得て主要な電子書籍プラットフォームの提供データと照合し電子化率を調査する手法を考案し,調査した。1)近年,電子化率は高くなっている,2)出版点数の多い出版社ほど電子化率は高い,3)各プラットフォームの提供する電子書籍には重なりがある,4)コミックの電子化率は高い,5)学術書の電子化率は高い,6)小説の電子化率は高いという仮説を設定した。 調査の結果,2017 年の電子化率は,36.6%となり,全ての出版物に展開した場合,約3 万点の電子書籍があると推計した。調査結果は,2)と5)以外の仮説を支持するものであった。 次に,国立国会図書館デジタルコレクションの収録件数を1901 年から1980 年まで調査し, 1960 年頃から2000 年頃までの間に電子書籍化の空白期間があることを指摘した。
著者
上田 修一 安形 輝 池内 淳 石田 栄美 野末 道子
出版者
慶應義塾大学
雑誌
基盤研究(B)
巻号頁・発行日
2009

研究の目的は,分野を限定せず,日本語及び英語の学術論文への直接的なアクセスを保証し,公開された検索アルゴリズムを用いた学術論文に特化した検索エンジンの構築と評価である。ウェブクローリングを行うために機関リポジトリ収載ファイルを調査し,深層ウェブの存在などウェブ構造を明らかにした。また,日本語および英語で書かれた全分野の学術論文の構成要素と構成を調査し,その結果に基づいて,学術論文の自動判定を行うための判定ルールを構築した。次いでウェブから約300万件の日本語PDFファイルを収集し, Solrによる検索エンジンの構築を行った。既存の検索エンジンと比較評価を行った結果,構築した検索エンジン「アレセイア」は,論文へのアクセスの点で優れており,高い確率で学術論文を自動判定できることが明らかになった。
著者
大場 博幸 安形 輝 池内 淳 大谷 康晴
出版者
日本図書館情報学会
雑誌
日本図書館情報学会誌 (ISSN:13448668)
巻号頁・発行日
vol.62, no.2, pp.83-100, 2016

<p>公立図書館における中立・公平な所蔵について検討した。2014 年から2015 年にかけて日本国内で論議された「集団的自衛権」を主題とする91 点の書籍の所蔵について調べた。書籍を賛否に従ってグループ分けしたところ,需要においては賛成本が勝っていたが,否定本のほうが4倍弱多く所蔵されていた。一点当たりの所蔵数においては否定本が1.2 倍程度有利に所蔵されていた。所蔵に影響する他の要因も含めて重回帰分析をしたところ,出版社の信用(特に岩波書店刊行書籍),需要,書籍の質などの要因とともに,否定本であることも有意な要因であった。続いて,賛否の所蔵数の比を基準に図書館設置自治体をグループ化し,所蔵規模別に検討した。結果,所蔵規模が大きくなるほど中立的となり,小さくなれば賛否どちらかに偏ること,特に否定本に偏るケースが多いことが明らかになった。否定本のみ所蔵する自治体は全体の1/4 強存在した。</p>
著者
原田 隆史 高久 雅生 小野 永貴 杉岡 秀紀 真山 達志 逸村 裕 江草 由佳 岡部 晋典 小泉 公乃 山本 順一 安形 輝 桂 まに子 岸田 和明 佐藤 翔
出版者
同志社大学
雑誌
基盤研究(B)
巻号頁・発行日
2019-04-01

本研究では,「資料」「来館者」「非来館者」「知の拠点」「図書館制度・経営」という5つの観点を研究する5 つのグループを設定して,日本の公共図書館全体を対象とする大規模な質的・量的調査を実施する。これによって日本の公共図書館に関して,それぞれの機能・サービスの基準とし,規模や地域経済など,図書館の状況に応じたベースラインを明らかにする。本研究により日本の公共図書館すべてに適用可能な評価パッケージを開発可能にすることが可能になると考えられる。
著者
木谷強 小川 泰嗣 石川 徹也 木本 晴夫 中渡瀬 秀一 芥子 育雄 豊浦 潤 福島 俊一 松井 くにお 上田 良寛 酒井 哲也 徳永 健伸 鶴岡 弘 安形 輝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.2, pp.15-22, 1998-01-19
被引用文献数
33

日本語情報検索システム評価用テストコレクションBMIR-J2は、情報処理学会データベースシステム研究会内のワーキンググループによって作成されている。BMIR-J2は1998年3月から配布される予定であるが、これに先立ち、テスト版としてBMIR-J2が1996年3月からモニタ公開された。J1は50箇所のモニタに配布され、多数の研究成果が発表されている。BMIR-J2では、J1に対するモニタユーザからのアンケートの回答と、作成にあたったワーキングループメンバの経験をもとに、テストコレクションの検索対象テキスト数を大幅に増やし、検索要求と適合性判定基準も見直した。本論文では、BMIR-J2の内容とその作成手順、および今後の課題について述べる。BMIR-J2, a test collection for evaluation of Japanese information retrieval systems to be released in March 1998, has been developed by a working group under the Special Interest Group on Database Systems in Information Processing Society of Japan. Since March 1996, a preliminary version called BMIR-J1 has been distributed to fifty sites and used in many research projects. Based on comments from the BMIR-J1 users and our experience, we have enlarged the collection size and revised search queries and relevance assessments in BMIR-J2. In this paper, we describe BMIR-J2 and its development process, and discuss issues to be considered for improving BMIR-J2 further.
著者
大場 博幸 安形 輝 池内 淳 大谷 康晴
出版者
日本図書館情報学会
雑誌
日本図書館情報学会誌 (ISSN:13448668)
巻号頁・発行日
vol.58, no.3, pp.139-154, 2012-09-30 (Released:2017-04-30)

日本の公共図書館・大学図書館・国立国会図書館の所蔵傾向について包括的な調査を行った。2006年上半期に刊行された約3万5千点の書籍を対象とし,2010年にカーリルやWebcat Plus等を通じて所蔵館数を調査した。調査対象の書籍について出版点数と需要を軸に分布を示し,館種別の所蔵数の分布と比較した。また,絶版書籍や選定図書の所蔵率も調べた。結果から次のことが明らかになった。第一に,公共図書館群は8割以上の所蔵率を示した。この結果は,公共図書館の蔵書が共通の書籍に集中しているわけではないことを推定させる。第二に,大学図書館群は出版点数や需要の分布とは異なる所蔵の偏りを見せること。これは,大学図書館が選択的な所蔵をおこなっており,かつ図書館間でその評価基準が共有されていることを推測させる。第三に,国立国会図書館には約1割の所蔵もれがあり,これは先行文献で報告されていたことと同様だった。
著者
池内 淳 野末 道子 安形 輝 久野 高志 石田 栄美 上田 修一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.51, pp.159-166, 2003-05-22
被引用文献数
1

Webの拡大に伴い、情報検索における、Webページの有用性の識別は重要な問題となっている。本研究では、まず、150万のページ集合から抽出した1 000ページについて、被験者によって、7ポイント・スケールで有用性判定行うとともに、その有用性判定の規準について分析をおこなった。さらに、ページの被リンク数、及び、特徴語を用いたWebページの有用性判定システムを構築し、各々の結果の比較を行った。In information retrieval, the problem of identifying web page usefulness increases its importance with expansion of the Web. In this study, firstly, web page test set(1,000 pages) was extracted from 150 million Japanese pages. Three respondents judged web page usefulness by 7-point scale, and we examined their judging criteria. We developed two type of web page usefulness judging systems by using linked frequency and key-term frequency, and compared each result.