著者
児玉 理映子 石川 千里 高田 雅美 城和賞
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.128, pp.61-64, 2007-12-20

ユーザの嗜好に合致する商品を提示するレコメンド法が注目されているしかしながら,従来のレコメンド法では全てのユーザを満足させることはできないそこで,満足できないと考えられる特定ユーザの嗜好を抽出する新たなレコメンド法を提案する.本稿では,特定ユーザとして興味の有無が明確なオタクを採用したオタクの嗜好を抽出するにあたってまずオタクの定義をし,その定義に基づいて選出したユーザをオタクとする.またオタク以外のユーザを一般人とする.このオタクと一般人の Mb アクセスログから決定木を生成しネット上での行動パターンを抽出し分析する.分析結果からオタクは一般人と比べ膨大な情報量を持つコンテンツを閲覧していることが示された.Recommendation methods that offer goods to users according to their favorite attract at tention recently. However, existing recommendation methods cannot be applied to all users in even. So, we propose a new recommendation method that extracts specific users who are not happy with recommended goods. In this paper, we adopt Otakus, whose interest is clear, as specific users. First, for extracting Otaku's favorite, Otaku is defined, and several users selected according to the definition are regarded as otakus. The access pattern on the Internet is extracted from web access log of the otakus and other standard people to be analyzed. The result shows that otaku browses more copious contents than other standard people.
著者
森本 泰貴 藤本 典幸 萩原 兼一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.126, pp.177-180, 2008-12-10

インターネットを介した買い物や情報収集の際に有用なサービスとして,ユーザの行動履歴から推測したユーザの興味に合う情報等を推薦するリコメンドサービスがある.リコメンドサービスは行動履歴を得られる日常的な反復行為にも応用できると考えられる.我々はその一例として,衣服コーディネイトリコメンドシステムを開発した.本システムはベイジアンネットにより衣服コーディネイトをモデル化することで衣服コーディネイトの推薦を実現している.またシステムが推薦した衣服コーディネイトに対してユーザが評価を行い,その結果を反映してモデルを修正することで,各ユーザの嗜好に合わせた衣服コーディネイトの推薦が可能となっている.Recommendation services are useful for shopping or acquiring information on the internet. Such services provide appropriate contents from past actions. We think that recommendation can be applied to routine work, so we developed a system that recommends coordination of clothes. The system recommends coordination of clothes using bayesian network model. The system can recommend coordination subject to user preference with modification of the model reflecting user's evaluation of the coordination recommended by the system.
著者
榎本 友理枝 石川 千里 高田 雅美 城和貴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.126, pp.17-20, 2008-12-10

本稿では,芝生の色の保持と緑色塗料の関係を予測するためのモデルを構築する.モデル構築にあたって,実際に試験塗料を散布させた芝生の劣化変化の解析結果を利用する.このモデルを用いてシミュレーションを行うことにより,芝生の色の持続性と塗料の濃度の関係が分かり,芝の品質に影響を与えない緑色塗料を適切な時期に散布し,常に葉色の良い状態で芝生を維持することが可能になると期待される.By this study, we build a model to predict color maintenance for lawns and relations of the green paint. On the model construction, We use the analysis results of the deterioration change of lawns which get really scatter examination paint. We understand the durability of the color of lawns and relations of the density of paint by simulating with this model. We can scatter the green paint which does not affect the quality of the turf in an appropriate time. And it is always expected with good leaf color and can maintain lawns.
著者
山村雅幸 亀田祥平
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.64, pp.65-68, 2006-06-15

報技術の急速な発展とインフラ化に伴って、さまざまなソースからの時系列データが大量に蓄積されはじめている。時系列データの適切な解析手法の整備が急務である。従来、時系列のクラスタリングにおける類似性は系列間のユークリッド距離をベースに定義されてきたが、多変数に関する情報が失われる欠点がある。本研究では、時系列クラスタリングのために、クモの生態系にヒントを得た新しいアルゴリズムを提案する。そこでは、生態系を通じたクモの棲み分けによって、時系列データの特徴点を巣の位置として抽出し、それらの特徴点の順序相関に基づいてデータ間の距離を定義しクラスタリングに役立てる。オーストラリアの手話の軌跡データを用いて、分類性能が従来の方法より高いことを実験的に調べた。
著者
富永 大介 ポールホートン
雑誌
情報処理学会研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2006, no.13(2006-BIO-004), pp.17-23, 2006-02-09

生物学全般において、たとえば概日周期変動や個体数の通年での変化の解析など、定量的観測値の時間変化が周期性を持つかどうかの判断を必要とすることは多い。しかしその判断基準はデータの特性に応じて経験的に、ケースバイケースで決められており、研究者や状況によって判断が変わることがありえるため、客観性を欠いた解析、解釈が行われやすい。したがって、慈恵性を含まない判断基準が必要である。そこで我々は判断基準として情報量基準を導入し、悪意性を排除した判断を行うアルゴリズムを考案した。そのアルゴリズムを乱数データと遺伝子発現観測データに適用し、この手法の有効性を示した。
著者
小野 泰正 林 幸雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.126, pp.93-96, 2008-12-10

大規模な問題を分散処理で効率良く解くためには問題の分割粒度と相互依存関係によって分散処理システムを考えなくてはならない. ネットワークダイナミクスの問題の多くはパラメータ問題でありその相互依存度が低く粒度の細かい分割ができる. この特徴を使ったスケーラブルな分散環境を作り負荷の異なる問題を効率良くために動的負荷分散を行う. 結果, 簡潔な記述による分散処理環境の構築と効率の良いネットワークダイナミクスシミュレーションを提案し, そのシステムを使った結果, AS ネットワークでのサイバーテロに相当する攻撃に対しての危険を示唆する.Dependence and granularity is important for task divide of distributed processing of large and complex network analysis. It almost is the issue of parameter, so it can be split to low interdependence and the small granularity. We make distributed computing suitable for such a lot of careful tasks. It promotes efficiency of network dynamics simulation. We examined about dange of the cyberterrorism by the experiment that became possible by the system. Result, We warn that, AS network are in a dangerous state for cyberterrorism.
著者
岡田 吉史 藤渕航 ホートン・ポール
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.99, pp.17-23, 2006-09-15
被引用文献数
1

遺伝子発現データから,ある特定の条件下において類似の発現動態を示す"遺伝子発現モジュール"を抽出する方法として,Biclusteringが注目されつつある.本研究では,極大2部クリークの全列挙法に基づくBiclustering法(BiModule)を開発した.我々は,これを人工データおよびS.Cerevisiaeの遺伝子発現データに適用し,既存の代表的なBiclustering法によるモジュール抽出結果との比較実験を行った.本報告では,BiModuleが他手法に比較して,人工的に埋め込まれたBiclusterをより高い精度で検出し,さらには,Gene Ontologyにおける機能アノテーションや既知のタンパク質相互作用を良く反映したモジュールを抽出可能であることを示す.In recent years, biclustering methods have been suggested to discover gene expression modules with shared expression behavior under certain experimental conditions. In this report, we propose a new biclustering method, BiModule, based on a maximal biclique enumeration algorithm. Comparative experiments to existing salient biclustering methods are performed to test the validity of biclusters extracted by BiModule using synthetic data and real expression data. We show that BiModule provides high performance compared to the other methods in extracting artificially-embedded modules as well as modules strongly related to GO annotations and protein-protein interactions.
著者
小泉 和真 冨永 和人
雑誌
情報処理学会研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2007, no.128(2007-BIO-011), pp.93-96, 2007-12-21

人工化学とは仮想的な化学系を表現する計算モデルである.我々は文字列のパターンマッチと組み換えに基づく人工化学を提案している.人工化学を用いた一般的な研究では,設定をシミュレータに与えて計算機実験を行い,その結果を得る.これに対して我々は,とある結果を引き起こす設定がいかなるものであるか推論する手法の確立を目指している.本研究では,この目的のために自動推論器の試作を行なった.この推論器は,人工化学系の初期状態と目的の分子を与えろと,その分子の生成可能性を判定する.推論器の実装にはオブジェクト指向言語 Ruby を用いた.作成した推論器によって例題を解き,推論器が期待通りに動作することを確認した.
著者
藤本 知之 杉浦 忠男 長屋 岳志 佐藤哲大 湊 小太郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.99, pp.63-70, 2006-09-15
参考文献数
6

これまでに我々はガラス基板上にDNAを伸張固定してGC特異的に蛍光染色し,エバネッセント顕微鏡を用いてDNAを一分子イメージングすることでDNAのGCコンテントの一次元分布を計測できた.しかしガラス基板上に固定されたDNAの単位長さ当たりの塩基数が異なるため,データベースの予測と必ずしも一致しない.そこで,塩基数の違いを較正する新たな解析モデルとその適用結果について報告する.We have analyzed single molecular DNA with single molecular imaging by evanescent field microscope and identified the DNA by comparing measured results of one dimensional distribution of local GC content to estimation from genome database. The number of base pair within the unit length of the DNA fixed on the glass substrates are different from estimation, however, measured results have not matched with genome database well. We report on the new analytic-model and the new application result considering calibration of the difference of the base pair number.
著者
杉浦 忠男 長屋 岳志 佐藤哲大 湊 小太郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.13, pp.25-32, 2006-02-09
参考文献数
4
被引用文献数
1

ゲノムDNA上ではGCコンテントの分布は一様ではない。このことを利用すれば一分子イメージングしたDNAを識別できると考えられる。そこで我々はガラス基板上にDNAを伸張固定してGC特異的に蛍光染色し、エバネッセント顕微鏡を用いてDNAを一分子イメージングすることでDNAのGCコンテントの一次元分布を計測でき、その結果がゲノムデータベースからの予測とよく一致することを確認した。GC content on genome DNA is not uniform. By use of this feature we can analyze and identify single molecular DNA with one-dimensional distribution of local GC content. We propose a method to analyze single molecular DNA with single molecular imaging by evanescent field microscope and to identify the DNA by comparing measured results of one dimensional distribution of local GC content to estimation from genome database. We have performed the method and have confirmed good correspondence with each other.
著者
重見 早南 石川 千里 高田 雅美 城和貴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.126, pp.1-4, 2008-12-10

本稿では,Flash を用いた Web アルバムの提案と設計について述べる.アルバムの自動生成の作成を行うシステムで使用する,関連画像と関連文書の提示を行うツールの開発を行う.関連画像は,写真の代わりとなる画像を取得するために用いる.しかし,ただ画像を提示するだけでは,ユーザのオリジナルアルバムとは言えない.そこで画像に付随して生年月日などからその当時の流行や音楽等の関連文書を提示することで,オリジナルアルバムを作成することができる.In this paper, we report the design of a Web album using Flash. For the automatic generation of the Web album, tools are developed showing related images and documents. The related images are used instead of photograph. A web album for a person should not be generated just from his/her related images. Therefore, by having related documents such as the fashion or the music of the days of birth, we can make the web album.
著者
秋山 卓見 泉 直子 萩原 茂樹 米崎 直樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.21, pp.71-78, 2007-03-05
参考文献数
6

近年の分子生物学の進展の中において,遺伝子ノックダウン実験による遺伝子調節ネットワークの解明が進んでいる.本研究では,それらを計算論的モデルを用いて捉えなおし,形式手法を反映したかたちで解析したすなわち,化学反応の活性/抑制関係を表現した,資源の取り合いを基本概念とする意味論を持つ形式オントロジーの公理を満たす,遺伝子調節量を表す数値間の演算の代数的制約と,そのインスタンスとなる関数を提案した.また,遺伝子調節ネットワークを解析した実験結果に適用し,ダブルノックダウン実験による遺伝子調節値を推定する計算式を提案した.The gene regulatory network obtained from the gene knockdown experiment is clarified in the progress of the molecular biology. In this paper, we capture those results by using the computational model, and analyze by a formal method, i.e. we proposed a numeric model of gene regulation reflecting our formal ontology that conceptualized promoting/inhibiting relation of the chemical reactions. Moreover, we formally defined requirements for gene regulation and functions which satisfy this requirements. Finally, we estimated the numerical value of the gene regulation by the double-knockdown experiment with this model.
著者
富永 大介 ポールホートン
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.13, pp.17-23, 2006-02-09

生物学全般において、たとえば概日周期変動や個体数の通年での変化の解析など、定量的観測値の時間変化が周期性を持つかどうかの判断を必要とすることは多い。しかしその判断基準はデータの特性に応じて経験的に、ケースバイケースで決められており、研究者や状況によって判断が変わることがありえるため、客観性を欠いた解析、解釈が行われやすい。したがって、慈恵性を含まない判断基準が必要である。そこで我々は判断基準として情報量基準を導入し、悪意性を排除した判断を行うアルゴリズムを考案した。そのアルゴリズムを乱数データと遺伝子発現観測データに適用し、この手法の有効性を示した。For biological time series data, such as circadian expression of genes, population of individuals, etc., judgment whether time series is periodic or not is often done widely. However, in most cases, criteria of judgments are defined by arbitrary parameters based on characteristics of data and analysts experiences, and there is no universal judgment criterion. Non-arbitrary judgment is important and needed. We developed an algorithm for non-arbitrary periodicity judgment by introducing Information Criterion. We applied the algorithm to randomly generated time series data and gene expression profile of mice to find circadian genes, and compared with widely used conventional judgment methods. Our algorithm shows both high sensitivity and specificity.
著者
石榑 彩乃 吉田 裕亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.135, pp.85-88, 2006-12-22

不完全データの解析手法の代表的なものとしてEMアルゴリズムがある,本研究では,EMアルゴリズムのMステップにおいて,最尤解が陽に求まらない混合分布問題として,混合コーシ分布を考え,分布を特徴づけるパラメータである,中央値と四分位偏差によりMステップを擬似的最尤推定に置きかえた手法を提案する.EMアルゴリズムにおいて,分布数は既知であることが前提となっているため,分布の推定にはよく知られたAICを用いる.また,混合分布数を2とし,KL情報量により,真の分布と推定されたモデルとの距離を測り,2つの分布の分解能に関する数値実験を行った.The EM algorithm is known as one of tools for the data analysis of incomplete data set. In this study we shall give a technical method in the maximization step of the EM algorithm for the problem of mixture Cauchy distributions. It is quite difficult to estimate the parameters for a Cauchy distribution from given sampling data in maximum likelihood (ML), explicitly. Instead of ML estimator, we will use the median and the quartile, and estimate them by using the bootstrap method. We shall also give some numerical experimentation for the mixture of two Cauchy distributions.
著者
石榑 彩乃
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.128, pp.49-52, 2007-12-20

不完全データの解析手法の代表的なものとして EM アルゴリズムがある.本研究では, EM アルゴリズムの M ステップにおいて,最尤解が陽に求まらない分布の典型として混合コーシ分布を取りあげる.以前に提案した,中央値と四分位偏差でもって M ステップを擬似的最尤推定に置き換えた手法の有効性は,分布数3以下の場合には示されている.ここでは,さらに分布数が多い場合においてこのアルゴリズムの適用性を検証する.The EM algorithm is known as one of tools for the data analysis of incomplete data set. In this study we shall take up mixture Cauchy distribution as a typical model that is quite difficult to estimate the parameters on the maximization step (M-step) of the EM algorithm. We gave the modified EM algorithm for mixture Cauchy distribution, in which the maximum likelihood (ML) estimators of parameters for Cauchy distributions on the M-step are replaced by the median and quartiles. We have also seen that this method can be applicable to the case where the number of mixed distributions is smaller than or equal to three. Here as further study, we shall see the effectivity of our method in case of increasingly more mixed distributions.
著者
河村 元 瀬尾 茂人 竹中 要一 松田 秀雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.15, pp.39-46, 2008-03-04
参考文献数
15

創薬プロセスでは化合物の化学的、生物学的な活性情報を用いた薬物探索が非常に重要である.化合物の活性を見つけるための構造類似性検索は、化合物の構造の有無をピットで表わしたフィンガープリントとTanimoto係数を用いた化合物類似尺度を用いて評価されることが多い.しかしながら、実際の化合物探索では少数の教師データを用いて精度を向上させながら大量のデータから活性化合物を見つけ出す手法が重要になってくる.そこで本研究では従来のtanimoto係数とRandam ForestのProximity Measureを用いた化合物類似尺度を線形判別分析によって組み合わせる評価法を提案する.特に、proximity MeasureとTanimoto係数は学習手法と非学習手法という本質的に異った評価方法に基づいているので、これらの組合せによって活性化合物予測の精度が向上することが期待される.この手法を化合物データベースのいくつかのデータセットにおいて評価する.これらの結果から、提案手法が化合物活性の探索において有効であることが示される.Chemical and biological activities of compounds provide valuable information for discover ing new drugs. Since the number of compounds that are known to have some activities of a biological class is small in the drug discovery process, the accuracy of the prediction should be increased in databases that have a large number of un-annotated compounds and a small number of annotated compounds of the biological activity. In this paper, we propose a new similarity scoring method composed of a combination of the Tanimoto coefficient and the proximity measure of random forest. The score contains two properties that are derived from unsupervised and supervised methods for predicting active compounds. Thus, the proposed method is expected to indicate compounds that have accurate activities. By evaluating the performance of the prediction compared with the two scores of the Tanimoto coefficient and the proximity measure, we demonstrate that the prediction result of the proposed scoring method is better than those of the two methods by using the Linear Discriminant Analysis (LDA) method. It is also shown that the proposed method can identify active compounds in datasets including several un-annotated compounds.
著者
石榑 彩乃 吉田 裕亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.135, pp.85-88, 2006-12-22

不完全データの解析手法の代表的なものとしてEMアルゴリズムがある,本研究では,EMアルゴリズムのMステップにおいて,最尤解が陽に求まらない混合分布問題として,混合コーシ分布を考え,分布を特徴づけるパラメータである,中央値と四分位偏差によりMステップを擬似的最尤推定に置きかえた手法を提案する.EMアルゴリズムにおいて,分布数は既知であることが前提となっているため,分布の推定にはよく知られたAICを用いる.また,混合分布数を2とし,KL情報量により,真の分布と推定されたモデルとの距離を測り,2つの分布の分解能に関する数値実験を行った.The EM algorithm is known as one of tools for the data analysis of incomplete data set. In this study we shall give a technical method in the maximization step of the EM algorithm for the problem of mixture Cauchy distributions. It is quite difficult to estimate the parameters for a Cauchy distribution from given sampling data in maximum likelihood (ML), explicitly. Instead of ML estimator, we will use the median and the quartile, and estimate them by using the bootstrap method. We shall also give some numerical experimentation for the mixture of two Cauchy distributions.
著者
谷口 剛 原口 誠 伊藤公人
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.128, pp.251-258, 2007-12-21

インフルエンザウイルスの遺伝子は突然変異を起こしやすい.抗体による免疫圧力によって,抗原性が変化したウイルスのみが生き残り,次の流行を引き起こす.ウイルスの進化の詳細を理解するために,本論文では,インフルエンザウイルスの進化において,アミノ酸置換の起こる残基位置が時代と共に変化するか否かを明らかにすることを目的とする.コントラストセットマイニングの枠組みを用いて,隣接するグループ列間の特徴的違いを発見するアルゴリズムを提案し,進化系統解析と提案手法を組み合わせることによって,アミノ酸置換の起こる残基位置の時代的変化を解析する.The influenza viruses undergo antigenic drift to escape from antibody-mediated immune pressure. In order to predict possible structural changes of their molecules in future, it is important to analyze the patterns of ammo acid substitutions in the past. In this paper, we present a method to extract segment of ordered groups in a phylogenic tree constructed from influenza virus gene sequences. We develop an algorithm for segmentation of ordered groups based on a contrast set, which identifies differences between two groups. We apply our algorithm to given ordered groups obtained from the phylogenic tree.
著者
ジェービー・ブラウン 阿久津 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.89, pp.49-56, 2007-09-14

DNA 修復とは、紫外線や複製ミスなどの細胞損傷を修復するプロセスである。細胞の機能を維持する役割は大切だと思われているが、以前の DNA 修復研究はバイオインフォマティクスでほとんど行われていない。そこで、我々は機械学習を用いて、DNA 修復タンパク質の識別と分類という基本的な問題に取り組む。結果として機械学習によってうまく識別と分類ができるということを示す。DNA repair is a critical process in cells, repairing internal and external damage resulting from UV radiation and DNA replication errors, to name only a few. Despite its important role, bioinformatics research on DNA repair is limited. In this talk, we examine two basic problems for the application of bioinformatics to DNA repair: detection of DNA repair-related proteins, and subsequent classification. Results will show that machine learning techniques are highly capable in these two tasks.
著者
加藤有己 関 浩之 嵩 忠雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.99, pp.33-40, 2006-09-15

シュードノットを含むRNA の2次構造をモデル化する形式文法がいくつか提案されている.本論文では,文脈自由文法の自然な拡張でありシュードノットを表現できる多重文脈自由文法(MCFG)に着目し,確率MCFG(SMCFG)と呼ばれる確率モデルに拡張する.次に,多項式時間で確率最大の導出木を求める構文解析アルゴリズム及びEM アルゴリズムに基づく確率パラメータ推定アルゴリズムを与える.さらに,SMCFG の構文解析アルゴリズムを用いたRNA シュードノット構造予測に関する実験結果を示す.Several formal grammars have been proposed for modeling RNA secondary structure including pseudoknots. In this paper, we focus on multiple context-free grammars (MCFGs), which are natural extension of context-free grammars and can represent pseudoknots, and extend MCFGs to a probabilistic model called stochastic MCFG (SMCFG). We present a polynomial time parsing algorithm for finding the most probable derivation tree and a probability parameter estimation algorithm based on the EM algorithm. Furthermore, we show some experimental results on RNA pseudoknot prediction using the SMCFG parsing algorithm.