著者
沼尾 雅之 清水 周一 木村 雅彦
雑誌
全国大会講演論文集
巻号頁・発行日
vol.51, pp.195-196, 1995-09-20
被引用文献数
1

大福帳システム、データベースからの仮説検証など、データベースを積極的にマーケティング戦略に利用していこうとする動きが、流通業を中心として盛んになっている。その中でも、データマイニングは、データベース中から未知の規則を発見できる、仮説生成型アプリケーションとして注目されている。現在、データマイニングの手法として知られているものを大別すると、以下のようになる。(1)クラス分類型:パターン認識や学習といわれているもので、クラスのわかっているサンプルデータを訓練例として、クラスを分類するための式、ルール、決定木等を生成するものである。ニューラルネットもここに入れられる。応用としては、顧客の信用調査、不正検出、ポートフォリオマネージメント等があげられる。(2)クラスタ分割型:属性間の距離などを規準にして、似かよっている属性を持つデータをグループ化するものであり、統計的クラスタリングや整数プログラミングの手法などが知られている。応用としては、顧客のプロトタイピング、バスケットアナリシス等があげあれる。(3)演繹データベース検索型:データベースから新しいパターンを導出し、これを数えあげることによって、そのパターンの有効性を検証する。応用としては、関連購買分析があげられる。(4)視覚化型:データをわかり易く表示し、対話的にデータの絞り込みなどの操作することによって、データ中の変数間の関係を明確化するものであり、基本的にルールの発見は人に任されている。これらの手法の中でも、演繹データベース検索型は、扱えるデータのサイズ、柔軟なパターン、および、解の完全性などの点で優れており、大規模データベースに対してもスケーラブルなアルゴリズムが開発されている。この手法は、直接的には流通業において、どの商品とどの商品が一緒に買われたかという関連購買分析に有効であることが知られているが、本稿では、これを一般の要因分析に応用することを示す。POSデータ等の大量の購買履歴と、その時間、場所的な背景データを同時に処理することによって、購買の要因のみならず、要因間の因果関係なども抽出することができるようになる。
著者
清水 周一
雑誌
全国大会講演論文集
巻号頁・発行日
vol.39, pp.779-780, 1989-10-16

日本語文書中の誤りを計算機により指摘する、校正支援システムの研究は、これまで多く行なわれてきている。その一手法として、漢字かな混じり文を形態素レベルで解析し、解析用辞書中の単語では接続が不可能となる部分を、未知語として指摘する方法が多くのシステムで採用されている。しかし、日本語ワープロで作成された文書に対しては、英文におけるスペル・チェッカーほどの効果はない。漢字かな混じり文の入力方式として、かな漢字変換方式を用いているため、例えば、「欠裂(決裂)」や「速時(即時)」といったような書き間違いは起こらない。文書の修正時に、削り過ぎや削り残し等のため若干生じる程度である。それどころか、タイプミスした入力にさえ、形態素の接続関係の満たされた結果を出力しようとする。このような、形態素の接続では判定ができない誤りを、高いヒット率で、しかも高速に検出する実用的な校正支援システムを構築するには、ヒューリスティックな誤り検出ルールを数多く備えることが最も現実的であると考えられる。われわれは、実用的な校正支援システムを構築するためのツールとして、PCのOS/2上にFleCS(Flexible rule-based Critiquing System)を開発してきた。FleCSでは、校正ルール(誤り検出ルール)のために、柔軟なパターン記述用言語を提供している。