著者
福島 俊一 松田 勝志 高野 元
出版者
情報知識学会
雑誌
情報知識学会研究報告会講演論文集 情報知識学会 第7回(1999年度)研究報告会講演論文集 (ISSN:24329908)
巻号頁・発行日
pp.77-80, 1999 (Released:2017-09-18)
参考文献数
6
被引用文献数
1

This paper surveys page ranking factors used in the current WWW search engines, such as (1) relevance to query keywords, (2) freshness, (3) popularity, (4) citation rank and (5) page types. The relevance to query keywords have been studied in the traditional information retrieval researches. However, other factors are introduced into the WWW search engines in order to improve their ranking performance, because WWW contents are heterogeneous and changeable large-scale hypermedia. The freshness, the popularity and the citation rank are the factors introduced from a viewpoint of contents reliability. On the other hand, the relevance to query keywords and the page types are the ones corresponding to user's domain and task in problem solving. Selection and combination of these factors must be refined for satisfying user's information needs.
著者
小川 泰嗣 木本 晴夫 田中 智博 石川 徹也 増永 良文 芥子 育雄 豊浦潤 福島俊一 宮内 忠信
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.1994, no.86, pp.145-152, 1994-10-13
被引用文献数
4

日本語を対象とした情報検索に関する研究開発では、性能(検索精度)の評価に開発元独自の方法が用いられてきた。このような状況に対し、われわれは「情報検索システム評価用データベース構築ワーキンググループ」を設置し、情報検索手法・システムを公正かつ客観的に評価するためのベンチマーク構築を目指している。本稿では、情報検索システムモデル・対象データの特性とサンプル件数・評価法・作成手順などベンチマーク構築に関する現在までの検討内容を報告する。In the research and development of Japanese information retrieval systems, different research groups have been using different measures to evaluate their system because there is no standard or benchmark for them. Our working group in IPSJ-SIGDBS has been developing such a benchmark, and in this report we will present several of its characteristics: IR models, the features and size of texts and queries, evaluation methods, and the development procedure of the benchmark.
著者
山田 洋志 福島 俊一 松田 勝志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.29, pp.143-150, 2000-03-21
参考文献数
4
被引用文献数
6

ユーザの目的に応じた情報検索・情報提供を実現するために,ページタイプ分類を利用した情報抽出・分類方式を提案し,試作システムで精度を評価した.本方式では,ページタイプ分類を使用することで,それぞれのページタイプに適した抽出・分類処理を行える.そのため,多くの種類の文書が混在するWebページに対しても必要な情報だけを高い精度で抽出することができる.また,分類結果を表や図を用いてユーザに提示することで特定の目的に応じた情報を提供するサービスを実現できる.試作システムによる求人情報とイベント情報の抽出精度の評価では,記述が比較的一定している勤務地や開催日時などの情報で適合率90%以上を達成した.記述の自由度が高い,求人の応募資格やイベント名では65?75%にとどまっている.検索誤りの主な原因は,情報を判別するキーワードのミスマッチと,表や箇条書きの前後からの抽出の誤りであった.抽出もれの原因としては,表や箇条書きのパターンや情報判別用のキーワードのの不足が主なものであった.This paper describes a novel information extraction method which realizes task oriented information retrieval. This method uses page-type classification method which judges type of Web pages. Introducing the page-type concept, extraction systems can select appropriate algorithm or rules for the target page-type. Hence, extraction performances will be increased. This paper also demonstrates accuracy of extraction. Extraction precisions of work place at help-wanted advertisement and date at event information are 90% and over, since these information are relatively set. Precisions of requirement at help-wanted advertisement and event name at event information are unfortunately between 65% and 75%, because there are many description styles of these information. The causes of the extraction errors is mismatches of keywords and extracting errors from table captions. The extraction omissions are caused by lack of pattern, namely, table, article, keyword and so on.
著者
福島 俊一 下村 秀樹 森 義和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.37, no.4, pp.500-510, 1996-04-15
被引用文献数
19

本論文では フリーピッチ手書き文字列の読み取りのために 新しい知識処理アルゴリズムである「文字タグ法」を提案する. 字形が多様で 文字サイズ・文字ピッチにばらつきがあり 文字の接触・入り組みなどもよく起きる手書き文字列の読み取りでは 誤切り出しや誤認識によって欠落した正解文字を補完する知識処理が不可欠である. 従来の知識処理方式は 単語辞書と候補文字列とを照合して単語候補を抽出したうえで その並びの妥当性を判定する2段構成である. このような従来法では 単語境界が不確定なケースをうまく扱えないことや 候補文字列と単語辞書との虫食い照合における組合せ爆発を避けると 強引に候補を切り捨てることになって最良解を保証できないことなどが大きな問題になっている. これに対して 本論文で提案する文字タグ法は 文字を基本単位としてタグを付与し その位置関係をチェックしながら連結していく戦略をとる. 単語内の文字の連結と単語間の文字の連結とを同等に扱って動的計画法を適用することで 最良解を保証し かつ 入力文字列の長さLと候補多重度Mに対してO(L^2・M^2)またはO(L・M^2)の時間計算量を達成している. さらに 手書き宛名住所の地名領域の読み取りに文字タグ法を応用し 文字切り出しや個別文字認識のあらゆる組合せと正解文字欠落の可能性の中から最良解を高速に探索する文字タグ法の能力を確認した.This paper proposes a new algorithm for post-processing in a hand-written character reader. Hand-written characters have such characteristics as various styles, irregularity in size and pitch, frequency of character overlapping, and so on. These characteristics bring difficulty into hand-written character reading systems. Post-processing to correct mis-segmentation and mis-recognition by linguistic information is an important approach to accurate reading. Conventional post-processing methods consist of two steps. In the first step, word candidates are extracted by word dictionary looking-up. In the second step, combinations of words are evaluated. These conventional methods have the following problems. The first problem is that they don't work well when word boundary segmentation is missed. The second one is combinational time complexity, required for examinations of all combinations of character segmentation candidates and character recognition candidates by approximate matching. In the algorithm proposed in this paper, character candidates are tagged with position-in-word information, and the position-in-word tags are connected by a dynamic programming method. This algorithm has the advantage of time complexity O(L^2・M^2) or O(L・M^2) for optimum path search, where L is input length, and M is average number of segmentation and recognition candidates per character. This paper also describes its implementation and evaluation results in hand-written Japanese address reading.
著者
佐古和恵 福島俊一
雑誌
デジタルプラクティス (ISSN:21884390)
巻号頁・発行日
vol.6, no.1, pp.43-52, 2015-01-15

プライバシーフレンドリーなシステムをどう規定するかは,国や社会の在り方に深く関わるものである.これを巡る環境・動向として,企業や消費者の意識,日・米・欧の違い等に目を向けつつ,プライバシーフレンドリーなシステム・社会の実現に向けた課題や提言にも話が及んだ.
著者
岩並 恵一 石原 正隆 坪田 有史 小林 和弘 松山 喜昭 小久保 裕司 福島 俊士
出版者
社団法人日本補綴歯科学会
雑誌
日本補綴歯科學會雜誌 (ISSN:03895386)
巻号頁・発行日
vol.39, no.1, pp.109-113, 1995-02-01
被引用文献数
17 1

日常の臨床における支台築造方法や築造材料の種類について,1977年(昭和52年)と1986年(昭和61年)に実施した調査報告に続く第3報である.特にレジン築造を含む成形材料による築造の頻度に注目したが,前回の28%から8%に減少していた.大学附属病院での調査であるため特殊な環境におけるものとの解釈もあろうが,意外の感は否めない.その他,鋳造体としての銀合金の使用頻度の減少や,合着用セメントとしてのリン酸亜鉛セメントの激減などのデータも得られている.
著者
福島 俊彦 鈴木 眞一
出版者
日本内分泌外科学会・日本甲状腺外科学会
雑誌
日本内分泌・甲状腺外科学会雑誌 (ISSN:21869545)
巻号頁・発行日
vol.31, no.1, pp.24-26, 2014 (Released:2014-04-30)
参考文献数
4

永続的上皮小体機能低下症は,甲状腺手術において避けるべき合併症の一つである。本稿では,当科で行っている上皮小体温存手技の実際を解説する。1.Capsular dissection:要点は,膜解剖の正確な把握である。Surgical thyroid fasciaとtrue thyroid fasciaを確認し,その間で,剝離操作を行う。これにより,自ずと上皮小体はin situに温存できる。加えて,反回神経はsurgical thyroid fasciaと同じ層で温存されることになる。2.上皮小体の自家移植:中心領域のリンパ節郭清を併施する場合,下腺の血流は犠牲にせざるをえないことが多いので,摘出しmincingしたものを胸鎖乳突筋内に自家移植する。胸腺舌部に迷入している下腺も可及的に確認し,同様に自家移植する。3.Surgical loupeの使用:高解像で明るい2.2倍レンズのloupeとloupe装着型のLEDライトを好んで使用している。これにより,明視野下に膜解剖の認識が可能である。
著者
福島 俊一
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.46, no.7, pp.436-445, 2003
被引用文献数
6 2 3

本稿は「Webサーチエンジンの基本技術と最新動向」と題した2部構成論文の後編である。前編ではWebサーチエンジンの背後にある基本的な情報検索技術を解説した。この後編ではWebサーチエンジン技術にかかわる5つの新しい話題を解説する。Googleで一躍有名になったリンク解析の改良・高度化が第1の話題,規模を追求してきた汎用Webサーチエンジンに対する目的特化やユーザ適応/状況適応という発展方向が第2・第3の話題,情報提供側の意図を反映した情報提示手法が第4の話題,サーチエンジン最適化(SEO)というコンサルテーション手法に着目したサーチエンジンスパムの問題が第5の話題である。
著者
立石 健二 福島 俊一 小林 のぞみ 高橋 哲朗 藤田 篤 乾 健太郎 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2004, no.93, pp.1-8, 2004-09-16
被引用文献数
14

本稿では、Web文書から意見を抽出し、それらをレーダーチャートの形式で要約/視覚化する意見抽出分類システムを提案する。Webの意見は、商品購入の際の情報収集、市場調査等のマーケティング、企業のリスク管理等、さまざまな目的での利用が考えられる。Webの意見の収集/分析に関する研究には2つの課題がある、対象とするWeb文書から意見に該当する箇所を抽出すること、抽出した意見を要約/視覚化することである。本システムは、この2つの課題を3つ組{対象物 属性 評価}のモデルと情報抽出の手法を用いて解決する。本システムを車に関するレビューサイトの100記事を対象として評価したところ抽出精度が適合率82% 再現率52%であり、システムが出力したレーダーチャートと人手で作成したレーダーチャートが類似することを確認した。This paper proposes an opinion extraction and classification system, which extracts people's opinions from Web documents and summarize/visualizes them in the form of "radar charts". People's opinions on the Internet are available for many purposes such as surveys before purchasing products, market research and risk management for enterprises. There are two issues on this area. One is to locate opinion sentences from Web documents, and the other is to summarize/visualize the extracted opinions. The proposed system solves them by employing an opinion model {object name, attribute expression, evaluative expression} and information extraction techniques. The experimental result conducted with 100 articles on the car domain showed that the system performed 82% on precision and 52% on recall, and that both radar charts created by the system and by the hand are similar to each other.
著者
小林 のぞみ 乾 健太郎 松本 裕治 立石 健二 福島 俊一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.23, pp.77-84, 2003-03-06
被引用文献数
26

近年,Web上に多数存在する掲示板などの文書から,意見情報を自動的に収集・解析する技術への関心が高まっている.このような意見情報の抽出には,評価を表す表現が重要な手がかりとなるが,評価表現には「コクがある」「液晶がきれい」といった領域依存の表現が多数存在するため,人手で書き尽くすことは困難である.そこで,我々は,テキストマイニングの技術を応用し,評価対象表現,属性表現,評価表現の共起パタンを利用して,これら領域依存表現を効率的に収集することを試みた.本稿では,共起パタンに基づく属性・評価表現の半自動的収集方法を提案し,「コンピュータ」と「ビール」の2つの領域を対象に行った経験的評価を報告する.It has been receiving increasing interest how to extract opinions from tremendous piles of Web documents. To automate the process of opinion extraction, a collection of evaluative expressions like "the monitor is fine" would be useful. However, it can be prohibitively costly to manually create an exhaustive list of evaluative expressions for each domain since they tend to be domain-dependent. Motivated by this background, we have been exploring how to accelerate the process of collecting evaluative expressions by applying a text mining technique. This paper proposes a semi-automatic method where we use particular patterns of cooccurrences between an evaluated subject, focused attribute and orientation expression, and reports the results of our empirical evaluation on the computer and beer domains.
著者
飯田 龍 小林 のぞみ 乾 健太郎 松本 裕治 立石 健二 福島 俊一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.1, pp.21-28, 2005-01-11
被引用文献数
12

本稿では,文章に記述されている意見を抽出するタスクについて述べる.我々は,意見を<対象,属性,評価値>の3つ組として定義し,文章からその3つ組を抽出する手法を提案する.具体的には,意見抽出の問題を,(a)辞書に存在する属性候補集合と評価値候補集合から評価値候補と対となる属性を同定する問題と,(b)同定した対が意見性を持つか否かを判定する問題の2つの問題に分解し,それぞれ機械学習に基づく手法を用いて解析することにより,属性-評価値対を同定する.提案手法を用いて評価実験を行った結果を報告するとともに,今後の展望についても議論する.This paper addresses the task of extracting opinions described in a given document collection. Assuming that an opinion can be represented as a tuple < Subject, Attribute, Value>, we propose a computational method to extract such tuples from texts. In this method, the major task is decomposed into (a) the process of extracting Attribute-Value pairs from given texts and (b) the process of judging whether each extracted pair is expressed as an opinion of the author, to both of which we apply machine-learning techniques. We also report on the present results of our experiments discussing future directions.
著者
坪田 有史 西村 康 大祢 貴俊 深川 菜穂 橋本 興 小林 和弘 野本 理恵 平野 進 福島 俊士
出版者
一般社団法人日本歯科理工学会
雑誌
歯科材料・器械 (ISSN:02865858)
巻号頁・発行日
vol.23, no.4, pp.225-235, 2004-07-25
被引用文献数
4

レジン支台築造において,間接法を採用することによりレジン築造体を装着前に加熱処理を行うことが可能となる.そこでクリアフィルDCコア(DC)およびクリアフィルフォトコア(PC)の支台築造用コンポジットレジンに対して,各種加熱処理による物性の影響を検討した結果,以下の結論を得た.1.DCにおいて,100℃30分の加熱処理により圧縮強さ,圧縮比例限,ダイアメトラル引張強さ,3点曲げ強さ,曲げ弾性係数が有意に向上した.2.DCにおいて,加熱処理によりヌープ硬さは増加しなかった.3.DCにおいて,化学重合のみと化学重合と光重合で硬化させた試料間では吸水量以外の物性に有意な差は認められなかった.4.PCは,DCと比較すると加熱処理による影響が少ないことが示唆された.したがって,DCで製作したレジン築造体を加熱処理することによって,いくつかの物性が向上し,臨床的意義があることが分かった.
著者
立石 健二 石黒 義英 福島 俊一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.69, pp.75-82, 2001-07-16
被引用文献数
39

本稿では,インターネットに分散して存在する人の意見を一括して検索する手法を提案し,試作したシステム概要と,その検索精度を報告する.インターネットはすべての人が情報発信できる場であり,さまざまな人の意見が存在する.しかし,従来これらの意見を効率的に入手する方法は存在しなかった.提案手法では,ユーザが入力した商品名とあらかじめ辞書として用意した評価表現を近接演算する方法を用いて,インターネットのWebページから意見を抽出する.また,抽出した意見の意見らしさ(適性値)を構文的な特徴を利用して判定する.試作システムの精度を評価したところ,従来のキーワードと比較して検索結果を15%程度に絞りこめること,検索結果の上位17.1%で86.6%という高い適合率を得られることがわかった.This paper proposes a method for retrieving people's opinions from www pages, and describes its implementation as well as the evaluation results of this system. Many people are exchanging or expressing their opinions with the Internet. However no traditional system can efficiently retrieve people's opinions from the Internet. With the proposed method, our system can extract people's opinions by utiltzing word distance calculation and opinion-likeness evaluation. The averge number of the search result of this system is 85% of smaller than the result of traditional keyword-based search. The precision of this system is 86.6% within the top 17.1% of the search result.
著者
福島 俊一 山田 洋志
雑誌
全国大会講演論文集
巻号頁・発行日
vol.49, pp.259-260, 1994-09-20
被引用文献数
1

近年、ペンを用いて文字の入力やコンピュータの操作を行なうペンコンピューティングヘの期待が、急速に高まってきている。キーボードと比べたペンコンピューティングの利点は、(a)小型化が可能であることや、(b)初心者にもなじみやすいことである。携帯端末では(a)の利点が活かされ、ペンワープロでは(b)の利点が活かされている。しかし、ペンによる手書き操作で日本語入力を行なうと、現状では、誤認識の発生や漢字の画数の多さなどからキーボードよりも入力効率が大きく劣る。この欠点は、ペンワープロのような文書作成の用途で特に問題になる。ペンベース文書作成より快適なものにするには、ペンによる日本語入力の効率改善が必要である。この改善のために、従来、オンライン文字認識の性能向上だけでなく、文字認識後処理や交ぜ書き漢字変換なども取り入れられてきた。さらに筆者らは、効率をいっそう高める新手法として予測ペン入力インタフェースを提案している。本稿では、その予測実現方式と手書き操作の削減効果について報告する。
著者
竹元 義美 福島 俊一 山田 洋志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.42, no.6, pp.1580-1591, 2001-06-15
被引用文献数
5

日本語テキストからの情報抽出の基盤技術として,組織名・人名・地名・固有物名・日付・時刻・金額・割合表現を高精度で分類抽出する,固有表現抽出システムを開発した.本システムは,形態素解析を利用して入力文を単語分割し,固有表現辞書とパターンマッチルールとを適用することでテキスト中の固有表現を判定するというベーシックなアプローチをとっている.辞書の充実とルールの整備を基本方針として抽出精度の改善を進め,辞書の増強と辞書情報の詳細化,人手によるルール作成を行った.また,辞書を充実させても生じる課題として,複合語の一部となる固有名詞判定と未知語・多義語の固有名詞判定とに工夫を加えた.前者は,複合語を分割して複合語中の固有名詞を判定することにより,固有名詞の抽出洩れを救済する.後者は,ルールで判定した固有名詞で信頼度の高いものをもとに,未知語・多義語となった固有名詞の省略表現を判定する.IREX-NEコーパス(トピックを限定しない一般的な内容の記事)を用いた精度評価を実施し,F値で83.86という精度を得た.また,導入したルール・処理の効果も分析し,有効性を確認した.We have developed a Named Entity extraction system from Japanese text.``Named Entities'', i.e.,proper names and temporal/numerical expressions are considered as the essential elements for extracting information.The system employs a conventional method that it divides input Japanese text into words and parts of speech by morphological analysis and extracts each Named Entity by referencing dictionaries and applying pattern-matching rules.In order to improve the system's accuracy,we aim to build a large-scale and high-quality dictionary and rules.Both the dictionary and rules have been produced manually,because we believe that a hand-made dictionary or rules have better quality than those that are made automatically.We also focused our attention on two points for cases that cannot be covered by the dictionary.One is to extract proper names from compound words,and the other is to designate unknown or vague words as proper names.For the first point, our system divides compound words and determines proper names within them.Thus, omissions of proper names in compound words can be eliminated.For the second point, our system recognizes abbreviations of proper names,which tend to be unknown or vague, using reliable proper names.For the IREX-NE corpus, our system has accomplished 83.86 as F-measure score.