情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2002, no.59, pp.5-8, 2002-06-26

ウイルス進化論を模した遺伝的アルゴリズムが開発され、組み合わせ問題に適用された。この研究におけるアルゴリズムはひとつの個体とたくさんのウイルスを用いる。個体はウイルスにより攻撃され、感染され、改良される。ウイルスは二つの遺伝子(トップ遺伝子とテイル遺伝子)からなる。もし個体が攻撃によって改善されれば、感染が起こる。局所解を抜け出すために、感染に余裕率を設けている。感染後、ウイルスのテイル遺伝子は突然変異される。もし同じウイルスが数回攻撃し、感染しなかったならば、トップ遺伝子が突然変異される。個体はこの突然変異により、効率的に改善される。最適解を得るために、部分攻撃がまた有効である。A genetic algorithm that simulates the virus evolutionary theory has been developed and applied to combinatorial optimization problems. The algorithm in this study uses only one individual and a population of viruses. The individual is attacked, infected and improved by the viruses. The viruses are composed of two genes (a top gene and a tail gene). If the individual is improved by the attack, infection occurs. To escape from local minima, an infection allowance is set. After the infection, the tail genes are mutated. If the same virus attacks several times and fails to infect, the top genes of the virus are mutated. The individual can be improved effectively using this mutation. To obtain the optimal solution, "sub-attack" is also useful.
加藤 剛 井庭 崇
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2008, no.85, pp.47-50, 2008-09-11

本論文では,コンセプトメイキングを支援するための 「コンセプトメイキング・パターン」 を提案する. 「コンセプトメイキング・パターン」 とは,コンセプトメイキングにおいて繰り返しぶつかる壁と,その壁を乗り越えるためのヒントを, 「パターン・ランゲージ」 の手法を用いて記述したものである.本論文では,提案した 「コンセプトメイキング・パターン」 を大学初年次教育に導入し,その履修者からのフィードバックを分析することで,本提案の有効性についての評価を行う.In this paper, we propose a pattern language for concept making. Each pattern consists of a frequent problem and its solution in concept making. In this paper, we show two examples from 20 patterns and effectiveness by analyzing feedbacks from university students. Our aim is to support activities in making concept and also provide a tool for project members to communicate about their activities of concept making .
杵崎 のり子 川崎 廣吉 高須 夫悟 重定 南奈子
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2001, no.37, pp.19-22, 2001-05-10

近年,道路や建物などの人為的な環境攪乱による生物の生息域分断化が種の存続に大きな影響を与え,不均質環境における生物の存続や侵入の問題は保全生態学観点からも極めて重要な課題となっている.そこで本研究では,不均質環境に対する生物の侵入問題に対して解析的なアプローチを試みた.つまり,帯状の好適環境と不適環境とが周期的にあらわれる2次元帯状分断環境を取り上げ,これに拡張Fisher モデルを適用して分布拡大過程の数学的な解析を行った.特に,少数の生物がある点に侵入した場合に帯状分断環境を伝播する速度と分布拡大パターンを解析的に描く手法を提出する.Environments for living organisms are often fragmented by natural or artificial habitat destruction. To simulate the range expansion of a single species in such a heterogeneous environment, we present a diffusion-reaction equation in which the rates of diffusion and reproduction periodically fluctuate between favorable and unfavorable habitats arranged in a striped pattern. Using this model, we derive a mathematical formula for the invasion speed together with the spatio-temporal pattern of range expansion.
成瀬 継太郎 久保 正男 佐藤 浩 松原 隆
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2008, no.85, pp.51-54, 2008-09-11

本論文の目的は、電子掲示版システム (BBS) におけるコミュニケーションの様相を理解することである.特に本論では次の三点について議論する. (1) 調査:オープン型の BBS のログを分析し、多くの BBS に共通する特性を調べた結果,各々のユーザーによって投稿される一日あたりの記事の数が対数正規分布に従うことを明らかにする.これらの特徴は各ユーザーに明示的にそのように振る舞うように定められたものではなく,自由な相互作用の結果現れた創発現象がもつ性質である.そこで,この現象を理解するために (2) 創発現象を起こす個人特性の提示と (3) 創発現象下のユーザーの振る舞いの定式化を行い,投稿件数分布を導出している.The objective of this paper is to understand an aspect of human social interaction in bulletin board systems on internet. When an individual submits an article to a BBS, it is potentially influenced by articles from other users. A submission sometimes starts a long and hot chain of articles, but often does not. This paper tries to answer the question of why and how such a chain of articles emerges. In other words, we attempt to reveal a mechanism linking the individual voluntary activity of article submission and the social phenomenon of a long article chain.
劉力綺 筒井 茂義 小島 基伸
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.86, pp.13-16, 2007-09-03

筆者らは先にカンニングアントシステム(cAS)と呼ぶ新しいACOアルゴリズムを提案し,TSP を用いて評価を行い,cAS の有効性を確認した.本論文は,cASのQAPへの応用と並列化方式に関するものである並列化の目的は大きく二つに分類できる.一つは,与えられた時間内に よりクオリティーの高い解を得ることである.もう一つは,与えられたクオリティーの基準を満たす解を高速に得ることである本論文では第二の目的,すなわち高速化を達成することを目的に,複数のプロセッサを用いるcASの並列化の一方法と QAP における結果について述べる.The previously proposed cunning ant system (cAS), a variant of the ACO algorithm, worked well on the TSP and the results showed that the cAS could be one of the most promising ACO algorithms. In this paper, we apply cAS to solving QAP focusing our main attention on the parallelization of the cAS. Results show promising speedups of the parallel cAS.
谷口 剛 伊藤公人 五十嵐 学 村上 悌治 高田 礼人 原口 誠
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2006, no.135, pp.185-192, 2006-12-22

インフルエンザウイルスにおける抗原変異の規則性を発見するために,アミノ酸残基の共変異を解析する共変異とは,タンパク質を構成するアミノ酸残基のうち〆複数の位置のアミノ酸が共に置換する現象である.従来からアミノ酸残基の共変異を解析する手法がいくつか提案されていたが,それらの手法では進化の過程における分岐や時間的関係が考慮されていなかったそこで,これらの問題を解決するために,進化系統解析によって得られる系統樹を利用する手法を提案する.過去40年間のH3N2亜型インフルエンザウイルスのHAタンパク質を対象とし,共変異の検出を行い,その結果を示す,また,共変異は時代と共に変化するため,共変異の変化を検出するための手法を提案する.The influenza viruses undergo antigenic drift to escape from antibody-mediated immune pressure. In order to predict possible structural changes of their molecules in future, it is important to analyze the patterns of amino acid substitutions in the past. In this paper, we present a new method to extract the sets of residue positions which were involved in correlated mutations. We also discuss a method to detect changes of correlation among co-evolving residues.
谷口 剛 原口 誠 伊藤公人
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.128, pp.251-258, 2007-12-21

インフルエンザウイルスの遺伝子は突然変異を起こしやすい.抗体による免疫圧力によって,抗原性が変化したウイルスのみが生き残り,次の流行を引き起こす.ウイルスの進化の詳細を理解するために,本論文では,インフルエンザウイルスの進化において,アミノ酸置換の起こる残基位置が時代と共に変化するか否かを明らかにすることを目的とする.コントラストセットマイニングの枠組みを用いて,隣接するグループ列間の特徴的違いを発見するアルゴリズムを提案し,進化系統解析と提案手法を組み合わせることによって,アミノ酸置換の起こる残基位置の時代的変化を解析する.The influenza viruses undergo antigenic drift to escape from antibody-mediated immune pressure. In order to predict possible structural changes of their molecules in future, it is important to analyze the patterns of ammo acid substitutions in the past. In this paper, we present a method to extract segment of ordered groups in a phylogenic tree constructed from influenza virus gene sequences. We develop an algorithm for segmentation of ordered groups based on a contrast set, which identifies differences between two groups. We apply our algorithm to given ordered groups obtained from the phylogenic tree.
藤野 昭典 上田 修功 磯崎 秀樹
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2008, no.85, pp.95-98, 2008-09-11

各データが複数のカテゴリに属する多重分類問題に対して,ラベルありデータとラベルなしデータを用いた半教師あり学習により分類器を設計する手法を提案する.提案法では,ラベルありデータで学習させる識別モデルとラベルなしデータで学習させる生成モデルの統合により分類器を得る.提案法を多重テキスト分類問題に適用するため,識別モデルに対数線形モデルを,生成モデルにナイーブベイズモデルを用いる.実テキストデータからなる3つのテストコレクションを用いた実験で,従来の対数線形モデルとナイーブベイズモデルの半教師あり学習法と比較して,提案法ではより高い汎化能力を持つ多重分類器を得られることを確認した.We propose a method for designing semi-supervised multi-label classifiers, which select one or more category labels for each data example and are trained on labeled and unlabeled examples. The proposed method is based on a combination of discriminative models trained on labeled examples with generative models trained on unlabeled examples. We employed a log-linear model and a naive Bayes model as the discriminative and generative models, respectively, for multi-label text classification problems. Using three test collections consisting of real text data, we confirmed experimentally that the proposed method provided a better multi-label classifier with high generalization ability than conventional semi-supervised learning methods of log-linear and naive Bayes models.
藤澤 公也 武藤佳恭
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2003, no.91, pp.53-56, 2003-09-18

Recreational Mathematicsの分野ではWeb上で多くの未解決問題が提示され,活発に議論されている.本研究ではDuisenberg's Puzzleにおいて2000年6月28日に提示された未解決問題の一つである"Doubly AttackingQueens"問題に対してニューラルネットワークをベースとした新しい手法を適用した.本手法はニューラルネットワークの組合せ最適化手法に遺伝的アルゴリズムの突然変異を組み合わせたものであり,この問題における新しい解を発見することに成功した.In the field of Recreational Mathematics, many unsolved problems have been actively shown on the Internet Web where some solutions have been given. The problems:"Doubly AttackingQueens" is one of the unsolved problems shown on the Web site of Ken Duisenberg's Puzzle on June 28, 2000. In this research, the combined optimizing method using an artificial neural network and a genetic algorithm is proposed and new solutions are discovered.
井庭 崇 深見 嘉明 吉田 真理子 山下 耕平 斉藤優
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.43, pp.45-48, 2007-05-17

本論文では、書籍販売市場の実データを解析し、販売冊数-順位の関係が、月間・年間のどちらの場合も「べき乗分布」になっていることを示す。さらに、順位が上位 1.5%のタイトルに注目し、その区間におけるべき指数と市場シェアの時系列変化を調べる。その結果、本論文で対象とした 2005年度においては、べき指数も市場シェアも上昇傾向にあり、「売れるものがますます売れる」という傾向があることが示唆された。In this paper, we analyze the real sales data in the book sale market in Japan. As a result, the relation between sale and rank follows power law in both of monthly and annual data. In addition, we focus on the books in the top 1.5% of sales, and analyze the exponent and the market share on the time series. We find that the both of the exponent and the market share are increasing in the fiscal year 2005, which shows that the books in top sales are getting to be sold more and more.
鄭美紅 成田 佳慶 樫森与志喜 星野 修 神原 武志
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2001, no.37, pp.27-30, 2001-05-10

突発的騒乱に対して魚群が示す秩序的集団対応において個体間の相互模倣がどのような働きをするのかを調べるために 我々は魚群の群行動をシミュレーションするモデルを提案した。このモデルは個体の意志決定のルールに基づくモデルである。近隣個体に対する模倣は群れ行動になる一つの要素として考えられている。そのほか 衝突回避行動も群れ行動になるもう一つの方策と思われている。我々の研究では 個体が隣魚の何をどのように、そしてどの程度真似することについて調べた。スクール運動に最適な相互模倣をする群れは自己組織臨界状態であることを明らかにした。さらに 最適模倣の群れは 突発的騒乱に対して優れた動的安定性を持つのかについて調べた。本研究では 魚群の突発的分裂および発散を二種類の突発的騒乱として採用された。魚群の動的安定性を評価する量は分裂及び発散された群れが一つの群れに戻る回復時間と回復臨界距離の二つの量である。調べた結果により我々のモデルは突発的騒乱に陥った魚群の秩序的対応に対しても有効であることが分かった。A simulation model of collective motion of a fish group was presented to investigate the role of allelomimesis of fish individual in emergence of dynamically stable schooling behaviors. It was shown that the schooling behaviors generated using the optimal values of the allelomimesis rate correspond to a self-organized critical state. The main purpose of the present modeling is to investigate whether the tactics of individual decision-making suited to generate good schooling behaviors work well also in maintaining dynamical stability of the fish school under emergent affairs. It was found that the tactic suitable for schooling generates the dynamically stable response of the school to emergent affairs.
藤原 賢一 藤本 康孝
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.128, pp.159-162, 2007-12-21

金融工学における従来のEVT(極値論)を用いたVaR(Value at Risk)推定法では、観測期間の標本標準偏差を超えるヒストリカルデータを裾野分布とみなし、裾野分布を推定した後に VaR を推定している。従来の EVT モデルでは、裾野分布の開始点、つまり閾値に対してあまり言及していない。しかし、閾値を正しく推定することは、EVT における重要な1つの課題である。本研究では、収益率時系列にウェーブレット解析を適用し、解析後の時系列に GARCH を用いてボラティリティの推定を行う。推定したボラティリティを閾値として EVT による VaR 推定を行う。提案モデルは従来モデルに比べ VaR が小さく、また、二項検定をクリアする結果を示す。Estimating VaR(Value at Risk) that is used with conventional EVT(Extreme Value Theory), historical data that exceeds the sample standard deviation at the observation period is considered to be the tail distribution. After the tail distribution is estimated, VaR is Estimated. For conventional EVT model, the beginning point of the tail distribution, in a word, the threshold is not so referred. However, it is one of important problem in EVT to estimate the threshold correctly. In this paper, the volatility is estimated by wavelet analysis applying to the profit margin time series, and using GARCH for the time series after wavelet analysis. The estimated volatility is assumed to be a threshold and VaR is estimated with EVT. VaR used with proposing EVT model is smaller than VaR used with conventional EVT, and showed the result of passing statistical binomial test so far.
久保田 文子 稲森 豊 大野 宏司
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.128, pp.219-222, 2007-12-21

新車およびモデルチェンジ車販売台数分析のための、時系列推移・時系列要因モデルを提案する。時系列推移モデルとして、新製品の普及モデルである Bass モデルに、買替のための市場流入率を組み込んだモデルを構築した。また、時系列推移の要因を分析するために、時系列推移モデルパラメータを目的変数に、メーカや価格等の車の特性を説明変数として回帰分析した。2BOX コンパクト、3BOX ミディアム、3BOX ラージの実データを使った評価実験では、既存モデルと比べて台数時系列推移の推定精度が向上した。また、要因分析の結果、発売時に台数のピークがある歴史のある車種と、発売後に台数のピークがある新規の車種では、割安感等の一部の要因が逆向きの影響を与える傾向があることが示唆された。This paper proposes a new-model car demand model for time-series forecasting and factor analysis. The Bass model is extended with the introduction of market inflow ratio, which enables to represent the dynamic change of market size. The estimated parameter values of the model are analyzed with multivariate regression analysis in terms of the relation with the car characteristics. In the evaluation experiment using real sales data, the extended Bass model could improve the accuracy of estimation, and the regression analysis reveals that a part of factors, such as undervalued image, had an opposite influence on traditional cars and novelty cars.
小鮒 幸洋 橋本 敬
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.86, pp.37-40, 2007-09-03

欺き行動は社会で他個体より有利に立つことで利益を得る方策として,ヒトの社会的知能の進化を説明するマキヤベリ的知性仮説で着目されている.また,欺きの能力は他者の内部状態を推定する能力と関連していることが実験などで示されている.本論文では,欺き能力と内部状態推定能力の進化との関係を研究する基礎として,欺き行動を形式的にモデル化することを試みる.ここでは,欺き行動を,ランナーがキャッチャーから逃れようとする「逃走・捕獲ゲーム」における,ランナーによるフェイント行動としてモデル化する.ここでは,ランナーはキャッチャーの次の行動が読めるとし,その情報を利用してフェイントの仕方を決める.また,キャッチャーはランナーの過去の行動から次の行動を予測する.このモデルの振るまいをエージェントシミュレーションで調べたところ,キャッチャーが予測能力を持つ場合にのみ,フェイントが十分有効であることがわかった.この結果から,相手に誤った情報をわざと与えて誤導することで利益を得るという,欺き行動の本質的部分がモデル化できたと考えられる.Deception is a remarkable human behavior in order to get an advantage over other people in a society. It is paid attention in the Machiavellian intelligence hypothesis as to explain the evolution of social intelligence of humans. Some experimental results show that deception behavior is relevant to the ability to recursively infer others' internal states. In this paper, we try to model deception behavior as a basis of studying the evolution of deception ability and the recursive inference ability of others' internal states. In this model, deception is modeled by feint behavior in "Running-Catching" game, in which a runner tries to escape from a catcher. The runner is thought to be able to "read" the catcher's next behavior, which is catcher's internal state, and decide the way to feint using the information. The catcher can predict runner's next behavior using past behavior of the runner. It is shown by agent simulations that the feint behavior is useful to escape from the catcher only when the catcher has the prediction ability. It is considered that the essence of deception, namely, getting advantage by giving erroneous information to others and misleading them, is modeled by this game and the feint behavior.
村木 雄二 狩野 均
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.128, pp.223-226, 2007-12-21

著者らは,現実の感知器交通量データに基づいて信号制御を行うエージェントモデルの研究を行っている.従来は,エージェントの知覚情報として現実に測定できないデータを仮定したり,仮想的な道路ネットワーク・交通流でのシミュレーションにより手法の評価を行っている研究が多い.本研究では,道路地図,計測データの得られるリンク,計測されるデータについて現実と同じものを用いている.本稿では,信号制御方式の評価に使用するシミュレータを交通量予測に適用し,実測交通量データの再現性について評価を行った.実験結果から,最近隣法に比べ,本シミュレータによる渋滞発生時の予測精度が高くなることを確認した.We study an agent model for traffic signal control based on traffic measured by vehicle detectors. In conventional studies, signal control methods are usually evaluated by applying simulations based on hypothetical road networks and traffic volume, and agents perceive data that cannot be actually measured. In this study, we use a simulator based on actual road maps and measured traffic data. This simulator was found to be superior to the nearest neighborhood method for traffic prediction at times of congestion outbreak.
金井 遵 森 拓郎 荒木 健志 田邊 昇 中條拓伯 並木 美太郎
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2006, no.68, pp.59-62, 2006-06-26

本論文では,分散ファイルシステム(DFS)およびメモリマップトファイル機能を利用してOSに手を加えることなく分散共有メモリ(DSM)を実装し,カーネルに手を加えることができないコモディティOS上でクラスタシステムを実現する方法を提案する.大容量バッファを持った高速なネットワークインターフェースであるDIMMnetF2を用い,Windows上で複数のDIMMnet-2の大容量バッファをまとめて-つのDFSおよび,DSMとして利用するドライバとライブラリを設計,実装した.評価では実際に,DSMを用いていくつかの分散処理実験を行った.特に行列乗算による評価では,2ノードの分散処理において1.99倍の性能向上が予測できた.This paper describes implemention of Distributed Shared Memory(DSM)by using Distributed File System(DFS) and Memory Mapped File without changing souce code of OS in order to implement PC Cluster System for a non-open source commodity OS. We have designed and implemented a DFS device driver and a DSM library by plural high-speed network interface cards named DIMMnet-2 with mass buffer for Microsoft Windows. As a result of matrix multiplication evaluation,up to 1.99 times higher performance has been gained by 2-nodes distributed parallel execution.
橋本 康弘 陳Yu 大橋弘忠
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2008, no.85, pp.63-66, 2008-09-11

本研究ではソーシャルコミュニケーションの時系列データからネットワークの時系列を構築し,コミュニティ検出によってコミュニティ構造の時間発展を捉える.そして,分裂・融合を繰り返すコミュニティの遍歴を視覚的に理解するためのインタラクティブ性の高い可視化手法を実現することで,人間行動をモデル化する前段階としてのシナリオを語る枠組みを提案する.We introduce a new framework that enables us to discuss a probable scenario derived from insights on human behavior by developing a highly interactive visualization method for visualizing human community evolution. First, we create a number of successive networks from the time-series data on social communication, and then, extract and visualize a hidden dynamic structure of evolving communities by integrating some recently developed methods.
井庭 崇 三宅 桐子 仲里和
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2008, no.17, pp.97-100, 2008-03-05

本論文では,実空間において,わずかな時間のずれによってコミュニケーションの機会が失われている状況を「すれ違い」と捉え,実際に「すれ違い」が起きているということを, RFID (Radio Frequency Identification) を用いた調査により明らかにする.さらに,RFID と携帯電話のメール機能を利用して,「すれ違い」の存在を可知化するシステムを提案する.このシステムによって,すれ違いが起きている当人たちに,「すれ違い」が起きたことを知らせ,新たなコミュニケーションを誘発することを目指す.In this paper, we focus on the situation of the real space in which a chance of communication is missed by a little time lag. We prove the exisitence of the situation by the experiment with using RFID (Radio Frequency Identification). In addition, we propose the system that makes the walkers know the possibility of communication with their friends near them, with using RFID and E-Mail on mobile phone.
高橋 俊博 水田 寛之
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2006, no.95, pp.9-12, 2006-09-14

近年 大規模な現象をシミュレーションできるAgent-Based Simulation(ABS)システムの必要性が高まっている.我々は,BlueGene上に大規模なABSフレームワークを構築した.エージェント間の通信量が大きいとき,ノード間の通信量が増大しABSのパフォーマンスに影響を与える.エージェント間の通信量が大きいエージェント同士を同一ノードに配置することで,ノード間の通信量を削減することができる.この問題に対し,非常に単純で効果的なアルゴリズムを提案し,実験によって有効性を示した.In recent years the importance of large-scale Agent-Based Simulation(ABS) that can handle large complex systems is increasing. We developed a large-scale ABS framework on BlueGlue. When the number of transmissions among the agents is large, the transmission cost seriously affect the nodes by clustering the agents which communigate heavily with each other. This problem can be formulated as a Maximum-Frow and Minimum-Cut Problem. In this paper we present an efficient algorithm to find an approximate solution. Our algorithm is reliable, simple and efficient in ABS. We demonstrate its benefical effects with some experiments.
佐藤 一誠 中川 裕志
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.43, pp.25-28, 2007-05-17

Unigram Mixture(UM) は教師無し文書分類などで幅広く使われている確率的生成モデルである。UM は、混合モデルであり、実際の適用にはユーザーは混合数決定問題を常に抱えている。近年、このような混合モデルにおいて、Dirichlet Process(DP) を用いたノンパラメトリックベイズモデルが注目を集めている。DP を用いることでデータに合わせてモデル構造(混合数)を変化させることができる。本研究では、DP により拡張した UM に対して、collapsed Variational Bayes inferense を用いてモデル学習する手法を示す。対数尤度と F-score による評価により従来手法に対する有効性を確認した。UnigramMixture(UM) is a probabilistic generative model that is widely used in unsupervized clustering of documents. UM is a mixture model and have a problem of how to determine the number of clusters. Recently, a nonparametric Bayes model using Dirichlet Process(DP) has gotten a lot of attention in this problem. Models using DP can determine the number of cluster corresponding to data. In this paper, we expand UM by DP and present a scheme that learns the model by Collapsed Variational Bayes inference.