著者
木谷強 小川 泰嗣 石川 徹也 木本 晴夫 中渡瀬 秀一 芥子 育雄 豊浦 潤 福島 俊一 松井 くにお 上田 良寛 酒井 哲也 徳永 健伸 鶴岡 弘 安形 輝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.2, pp.15-22, 1998-01-19
被引用文献数
33

日本語情報検索システム評価用テストコレクションBMIR-J2は、情報処理学会データベースシステム研究会内のワーキンググループによって作成されている。BMIR-J2は1998年3月から配布される予定であるが、これに先立ち、テスト版としてBMIR-J2が1996年3月からモニタ公開された。J1は50箇所のモニタに配布され、多数の研究成果が発表されている。BMIR-J2では、J1に対するモニタユーザからのアンケートの回答と、作成にあたったワーキングループメンバの経験をもとに、テストコレクションの検索対象テキスト数を大幅に増やし、検索要求と適合性判定基準も見直した。本論文では、BMIR-J2の内容とその作成手順、および今後の課題について述べる。BMIR-J2, a test collection for evaluation of Japanese information retrieval systems to be released in March 1998, has been developed by a working group under the Special Interest Group on Database Systems in Information Processing Society of Japan. Since March 1996, a preliminary version called BMIR-J1 has been distributed to fifty sites and used in many research projects. Based on comments from the BMIR-J1 users and our experience, we have enlarged the collection size and revised search queries and relevance assessments in BMIR-J2. In this paper, we describe BMIR-J2 and its development process, and discuss issues to be considered for improving BMIR-J2 further.
著者
木本 晴夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.3, pp.886-898, 1999-03-15
被引用文献数
33

感性語を検索入力として 花やブラシペイント画像を検索する感性検索システムの開発と評価について述べる. 感性語はシステムが内蔵する 感性語と配色パターンの対応テーブルによって 配色パターンに変換され 各画像から抽出された代表色パターンとの間で類似度計算をして 類似度順に検索結果を出力する. 検索精度評価においては テキスト検索で確立されている検索精度評価方法を使用するなどして評価方法を客観的 数値的なものとした. つまり 評価用の検索対象画像として 花の写真100枚 ブラシペイント画像100枚の合計200枚を準備して これらに対する検索要求と個々の検索要求に対しての評価用正解データを作成して 画像検索を行ったのち これらの精度評価用データを使用して検索精度の再現率・適合率の評価を実施した. 本論文での新規な結果としては次のとおりである. (ア) 花 ブラシペイント画像を検索対象として 今回作成した評価用正解データベースを使用して検索精度評価をした. 従来は 本論文で示したような評価用正解データベースを用いての検索精度評価はなされていなかった. (イ)感性語とそれに対応する検索正解画像の色解析結果から 感性語ごとに 検索における感性語と色相・彩度・明度の関係を明らかにした。この関係を正解特徴量分布としてまとめた。また この正解特徴量分布は離散データであるので 近傍のデータの影響を計算して連続データに補正した。この補正したデータを領域重み分布データと呼ぶ。従来は 画像と感性語の間の関係をアンケートデータを基にして感性語をベースとして分析したり 画像からの代表色抽出のために色相のみのヒストグラム分析をした報告はあったが 感性語と色相・彩度・明度との関連性を上記のような評価用の正解データに基づいて詳細に分析した報告はなかった。(ウ) 検索のための類似度の計算において 上記の領域重み分布データを使って類似度の補正をした結果 検索精度を大幅に向上できた。This paper describes the image retrieval system whose input search keys are impressional words, such as "refreshing", "bold″and "pretty". The databases for search are a flower image database and a brush paint image database. The input impressional words are translated into color patterns which correspond to the impressional words. An impressional words to color patterns table is used for this translation. Dominant colors are also extracted from each of the images of the databases. The similarity matching is made between these color patterns on the L^*a^*b^* color space. And the system outputs the images in the similarity order. The evaluation of the system is made based on the recall-precision measurement that is frequently used for the evaluation of text retrieval systems. The recall-precision measurement is well established in the field of text in formation retrieval. For the evaluation of the image retrieval systems, a relevancy database was constructed. A relevancy database consists of a database of 200 images from flower image database and brush paint image database, 10 queries expressed by impressional words and the relevancy judgements. The result of the evaluation shows a couple of points. The first point is that this evaluation is the first one that uses the relevancy database, and, as a result, the evaluation is accurate. The second point is that for each impressional words, the degrees of the influence of hue, saturation and intensity of colors were made clear when retrieving the images using impressional words. This was made by analyzing the relevancy database. The third point is that the effectiveness of retrieval was greatly improved by using the results of analysis of the relevancy database. As a result, the relevancy database is very necessary for the image retrieval system.
著者
周 臻 木本 晴夫
出版者
日本デザイン学会
雑誌
日本デザイン学会研究発表大会概要集
巻号頁・発行日
vol.54, pp.D01-D01, 2007

六書原理は、漢字の独特な造字・造型の方法であるだけてなく、まだ有効な視覚表現の手段の一種で、さらに設計思惟でもある。六書原理は東洋の思想モデルを反映する論理的な創造システムである。本研究は、ロゴデザインを例にして、六書原理に基づく新しいデザイン体系を探求したので報告する。六書の各原理、すなわち、象形、指事、形声、会意、転注、仮借の概念と造字方法、造字実例を研究して、その中から得る啓発をデザイン構想とデザイン手法に転化して、自分のデザイン実例と結合して、新しいロゴデザインシステムを構成することを試みた。1. 象形:具体物の形態を表現する。2. 指事:抽象的な符号を入れる。3. 会意:現有の要素を合併して新しい意味を生む。4. 形声:意味を表す符号と発音を表す符号の結合。5. 転注:シリーズデザイン。6. 仮借:類似したオブジェクトを借りる。7. 六書原理の統合的応用。文化の内包を掘り起こすことと民族の風格を発展さめることによって、六書原理に基づくデザインシステムは、中国のデザインを進展させる強力な道具になる。
著者
中渡瀬 秀一 木本 晴夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1995, no.87, pp.41-48, 1995-09-14
被引用文献数
16

本論文では字面処理によって,テキストから重要語(キーワード)を自動抽出する方法について述べる.日本語の場合まず文章から単語を得るために,形態素解析が必要であるが,形態素解析には未知語や曖昧性の解消などの問題があり,これを解決するために,従来は複雑な規則や人間がメンテナンスしなければならない辞書が必要であった.本手法はNグラムの頻度情報を用いた完全な字面処理になっている.その手順では()まずNグラム頻度情報を使って重要な文字列を抽出し,()次にその中から無意味な文字列を排除する.実験ではこの手法が未知語や複合語の範囲を正しく識別し,抽出精度を向上させることを確認した.This paper describes a new method to extract free keywords automatically from a Japanese text. Morphological analysis is necessary to recognize words from a text for extraction of keywords. There exist, however, problems of unknown words recognition and ambiguity of compound words recognition, so dictionaries and complex heuristics are necessary to resolve them. Our method is based on the n-gram method and consists of 2 steps: (1) Evaluation of major strings using the n-gram statistics, and (2) Exclusion of nonsense strings. It was found that our method extracts keywords that is unknown word more precisely than conventional methods.
著者
木本 晴夫
出版者
一般社団法人 日本色彩学会
雑誌
日本色彩学会誌 (ISSN:03899357)
巻号頁・発行日
vol.42, no.3+, pp.104, 2018-05-01 (Released:2018-07-17)
参考文献数
9

中国の色譜としては代表的なものとして,「色譜」(中国科学院,1957年)と,「中国の伝統色」(大日本インキ化学,1986年)とがある.「中国の伝統色」の応用は主に美術・デザイン方面にある.「色譜」の応用は「(動物,植物などの)生物学,鉱物学,印刷染色,絵画などの各領域」であり,「中国の伝統色」に比べてその応用分野は幅広い.「色譜」はその成立過程や編集関係資料などは明らかでないとされている.近年,インターネットの普及によって,世界中の種々様々な情報がアクセス可能となった.このことは中国においても同様である.本研究では,「色譜」の編集委員達について調査を行い,それを通して「色譜」の成立背景を考察した.併せて,関係資料として,特に,「色譜」が参考とした「ロシアのボンダルツェフ色譜」を入手して「色譜」との対比を行った.その結果,「色譜」と「ロシアのボンダルツェフ色譜」はその色と色名において顕著な類似性は見られなかった.「色譜」は中国の自然,文化を反映して,色,色名などを幅広い分野にわたって独自に作られたものと考える.色名造語も自由闊達で,多種多様である.
著者
金 釗立 木本 晴夫
出版者
Japanese Society for the Science of Design
雑誌
日本デザイン学会研究発表大会概要集
巻号頁・発行日
pp.78, 2013 (Released:2013-06-20)

イタリック体は欧文書体の一つとして、引用、強調など様様な場所で活用されている。しかしながら、漢字ではイタリック体が無いため、欧文イタリック体に対応する書体がない。本稿はイタリック体の有用性に気づき、欧文イタリック体と伝統漢字書体を比較し、考察を行った:合計22書体の漢字書体と欧文書体の印象アンケートを行った。アンケートの結果い基づいて更にSD法で分析を行った。結果として、欧文イタリック体の印象特徴を得た上、その印象に近い伝統漢字書体も知った。また、書体の主の三つの因子も得て、書体の座標地図を作ることもできた。最後に漢字イタリック体の試作を挙げてみた。
著者
小川 泰嗣 木本 晴夫 田中 智博 石川 徹也 増永 良文 芥子 育雄 豊浦潤 福島俊一 宮内 忠信
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.1994, no.86, pp.145-152, 1994-10-13
被引用文献数
4

日本語を対象とした情報検索に関する研究開発では、性能(検索精度)の評価に開発元独自の方法が用いられてきた。このような状況に対し、われわれは「情報検索システム評価用データベース構築ワーキンググループ」を設置し、情報検索手法・システムを公正かつ客観的に評価するためのベンチマーク構築を目指している。本稿では、情報検索システムモデル・対象データの特性とサンプル件数・評価法・作成手順などベンチマーク構築に関する現在までの検討内容を報告する。In the research and development of Japanese information retrieval systems, different research groups have been using different measures to evaluate their system because there is no standard or benchmark for them. Our working group in IPSJ-SIGDBS has been developing such a benchmark, and in this report we will present several of its characteristics: IR models, the features and size of texts and queries, evaluation methods, and the development procedure of the benchmark.
著者
周 臻 木本 晴夫
出版者
日本デザイン学会
雑誌
日本デザイン学会研究発表大会概要集
巻号頁・発行日
vol.55, pp.89-89, 2008

概要: 本研究は、トンパ文字の象形性、絵画性と西夏文字の論理性、システム性を利用し、新しいピクトグラムデザイン方法を探求することを目的とする。トンパ文字、西夏文字を研究対象として、おのおの造字構成法の特徴を分析した。それらの造字構成法から下記のピクトグラムデザイン手法に転化した:象形的な表現法、抽象的な表現法、組み合わせ表現法。提案したデザイン方法の特徴について述べる。また、この方法よって、漢方薬に関するピクトグラムデザインを作成した。作成したピクトグラムの解読性についてアンケート調査を行った。その結果、トンパ文字、西夏文字に基づくピクトグラムデザイン方法の有効性が明らかになった。
著者
木本 晴夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151915)
巻号頁・発行日
vol.J74-D1, no.8, pp.556-566, 1991-08-25

言語処理・知識処理・統計処理を用いる新しいキーワード自動抽出法として語特徴評価法を提案する.また,語特徴評価法に基づくキーワード自動抽出システム(INDEXERシステム)を作成し,評価を行ったのでその結果を報告する.本論文でのキーワード抽出の対象は日本語で書かれた新聞記事である.従来のキーワード自動抽出はフリーターム方式か統制キーワード方式を用いて行われていた.これらの方法では必要キーワードと共に,その3~5倍もの不必要キーワードが抽出されていた.語特徴評価法は,これらの不必要キーワードを大幅に削除して精度の高いキーワード自動抽出を実現することを目的としている.本方法はシステムが抽出したキーワード候補語について,個々の語の,文章中やシソーラスにおける特徴を抽出して,その特徴によって,キーワード候補語が文献の内容をよく代表していて,文献を検索するためのキーワード(以下では必要キーワードと呼ぶ,またシステムが自動抽出したキーワードで必要キーワードでないものを不必要キーワードと呼ぶ)として必要か否かを評価する方法である.ここで,語の特徴として次に掲げるものを採用している.それらは,並立に表現された語,連体修飾語,強調表現された語,シソーラスにおける上位語,シソーラスにおいて上位・下位の関係にある語,語の文章中における出現位置,出現頻度等である.語特徴評価法を用いることにより,抽出される不必要キーワードの数を従来の方法と比較して1/4にできることを実験によって確認した.更に,処理対象とする文書の分野特性を利用することによって,よりいっそうの精度向上が可能なことを述べる.またシステムが自動抽出したキーワードの相対的重要度を語の特徴を利用して評価した結果,上位の10語の中に専門家が付与したキーワードの95%を入れることができた.