著者
楠村 幸貴 神谷 俊之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.7, pp.39-46, 2008-01-24

近年,電子化された文書の増加によりテキストマイニングのニーズが高まっている.テキストマイニングではシステムの開発時に構造化処理をどのように行うかが課題となっている.そこで我々は対話的なテキストの構造化を可能にする基盤技術の開発を目指している.このためには,タグの追記が容易であり高速に行えること,また,追記されたタグ情報を用いたパターン検索が高速に行えることの両方が重要である.本稿では,この目的のために開発したLRインデックスとタグ付け用検索基盤システムについて述べ,その評価を行う.The demand of text mining system is increasing. We aim at providing a data management system for interactive text mining. For this purpose, the data management system must be able to not only search ttext by the pattern of tags but also update tags. In this paper, we present the LR-index structure, which is an index structure for the fast searching and fast updating of tags.
著者
工藤 拓 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.107, pp.9-16, 2000-11-21
被引用文献数
18

本稿では,Support Vector Machine (SVM)に基づく一般的なchunk同定手法を提案し,その評価を行なう.SVMは従来からある学習モデルと比較して,入力次元数に依存しない極めて高い汎化能力を持ち,Kernel関数を導入することで効率良く素性の組み合わせを考慮しながら分類問題を学習することが可能である.SVMを英語の単名詞句とその他の句の同定問題に適用し,実際のタグ付けデータを用いて解析を行なったところ,従来手法に比べて非常に高い精度を示した.さらに,chunkの表現手法が異なる複数のモデルの重み付き多数決を行なうことでさらなる精度向上を示すことができた.In this paper, we apply Support Vector Machines (SVMs) to identify English base phrases (chunks). It is well-known that SVMs achieve high generalization performance even with input data of very high dimensional feature space. Furthermore, by introducing the Kernel principle, SVMs can carry out the training in a high-dimensional space with smaller computational cost independent of their dimensionality. In order to achieve higher accuracy, we also apply majority voting of 8 SVM-based systems which are trained using distinct chunk representations. Experimental results show that our approach achieves better accuracy than other conventional frameworks.
著者
森 信介 伊藤伸泰
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.69, pp.47-54, 2001-07-16

確率的言語モデルを基礎とする自然言語処理において、タグが付与された学習コーパスは重要であり、これを増量することが精度向上につながることがわかっている。しかしながら有意な精度向上のためには、学習コーパスを指数関数的以上に増加させる必要があり、このために必要なコーパスにタグを付与するコストは無視できない程度になっている。このような背景のもと、本論文では、タグなしコーパスの利用による形態素解析と仮名漢字変換の精度向上について述べる。実験では、タグなしコーパスの利用により、確率的言語モデルの予測力やそれに基づく仮名漢字変換の精度は有意に向上し、タグなしコーパスは0.87倍の量のタグつきコーパスに匹敵したが、形態素解析の精度向上は微小であった。A tagged corpus plays an important role in natural language processing based on a stochastic language model and increasing the corpus size improves the accuracy. It is, however, necessary for a meaningful improvement to incerase a corpus size more than expornentially and an annotation cost needed for it is not negligiable. In this paper, we discuss the usage of an untagged corpus. In the expreriments, using an untagged corpus improved the predictive power of a stochastic language model and the accuracy of a kana-kanji converter based on it. But for a tagger the improvement was slight.
著者
飯尾 和彦 木村 聡宏 小林 透 忠海 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.49, pp.7-14, 1997-05-23

既存の非SGML文書をSGML文書に変換するためにはDTDに従って多くのタグを人手で文書に埋め込む必要がある。これは、コストがかかり、SGML普及上の大きな問題点となっている。本論文では、既存の非SGML文書をSGML文書に変換する方式とその評価結果について述べる。変換方法は、以下の通りである。()テキスト文書に簡単なタグつけを施す。この結果できた文書を一次変換文書と呼ぶ。()これらのタグと一次変換文書に現れる位置や特徴を手がかりとして、SGML文書へ自動変換する。本方式により、SGMLの経験者がSGMLエディタを利用してSGML文書に変換するような場合と比較しても1/4?1/3の時間でタグつけできることが実験から明らかになった。It is needed to be put many tags into papers when we want to convert non SGML document into SGML document. However it is costly and is one of main problems for utilizing SGML. This paper describes the method to convert non SGML document into SGML document and the evaluation of it. The method is followings: (i) Insert small tag set into text. The resulting document is called first translated document. (ii) Translate first translated document into SGML document automatically by analyzing these tag, location and features. It is found that even SGML expert can convert document three or four times effectively than using SGML editor by using this method.
著者
亀田 卓 山口 敦由 福與 賢 中瀬 博之 高木 直 坪内 和夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. WBS, ワイドバンドシステム (ISSN:09135685)
巻号頁・発行日
vol.105, no.620, pp.31-36, 2006-02-22
被引用文献数
9

多数のタグが存在するRFID (radio frequency identification)やセンサネットワークシステムにおける,高速ID (identification)識別方式の検討を行う.タグ存在確認を行うランダムアクセス試行に1ピットのフラグを用いることで通信に要する情報量を最小化し,ID識別処理の高速化を図った.その結果,従来のISO/IEC (International Organization for Standardization and International Electrotechnical Commission)標準規格のID識別方式に比べ,最大で10倍程度の高速化が可能であることを示した.
著者
加藤 友康 清水 敬生 梅澤 聡 荷見 勝彦
出版者
社団法人日本産科婦人科学会
雑誌
日本産科婦人科學會雜誌 (ISSN:03009165)
巻号頁・発行日
vol.46, no.12, pp.1337-1342, 1994-12-01
被引用文献数
2

直腸に直接浸潤もしくは播種巣を形成した卵巣癌症例に対する, neoadjuvant 化学療法(NA化療)後の直腸合併切除の意義について検討した. 1988年7月から1992年12月までに当科でNA化療後に直腸合併切除を行ったIIIc期7例, IV期4例(漿液性腺癌10例, 類内膜腺癌1例)を対象とした. IIIc期例は試験開腹後にNA化療を開始した. IV期例ではPerformance status (PS)が悪いため試験開腹は施行せず, まず癌性胸腹水に対して免疫療法を施しPSの改善を図った後, ただちにNA化療を開始した. 化療のレジメンはCP (cyclophosphamide: 500mg/m^2, day 1; cisplatin: 10mg/m^2, day 1〜7)であり, 4〜6コース投与した. 効果はPartial Response 9例, Minor Response 1例, No Change 1例であった. NA化療後, 子宮・卵巣・直腸をen blocに摘出した. 人工肛門が造設されたのは計画的に骨盤内臓全摘術を行った1例のみであった. 上腹部臓器に転移巣が残存した5例は, 可及的に摘出した. 術後の残存腫瘍径は, 残存腫瘍なしが5例, 0.5cm未満が2例, 2cm未満が3例, 2cm以上が1例であった. 術後合併症例はみられず, 術後治療によるPSの改善が効を奏したと思われる. 11例の全生存期間(5例死亡)は平均26.8ヵ月であった. なお, 残存腫瘍径が0.5cm未満の症例7例(2例死亡)中, 2年未満の死亡例はなかった. 直腸合併切除及び播種巣の可及的切除により残存腫瘍径を0.5cm未満にすることが可能な症例では, NA化療後の直腸合併切除はQuality of Lifeを損ねることなく, 予後に大きなimpactを与えると期待できる.
著者
志久 修 三嶋 博文 姉川 正紀 中村 彰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.11, pp.2452-2455, 1993-11-25

本論文では平行線分の線幅に応じた直径をもつ円形テンプレートと画像との適合度(黒画素密度)を特徴量とした,平行線分の中心線抽出法を提案する.また,この方法を国土地理院発行の1/25,000地形図からの平行線分の抽出に適用した結果について述べる.
著者
崔 延敏 浅見 泰司
出版者
日本建築学会
雑誌
日本建築学会計画系論文集 (ISSN:13404210)
巻号頁・発行日
vol.68, no.564, pp.303-310, 2003
被引用文献数
4

For newly built condominium supply, it is crucial to uncover characteristics of the potential buyers' behavior as "rules" or "patterns" from historical data. A new approach is applied to extract informative and unexpected rules or patterns from a database with relatively few transactions but a huge number of attributes using data mining methodology. For the val idity of the proposed method, the real data of 798 condominium purchasers in Tokyo metropolitan area are analyzed. Results include that if access time to the nearest railway station to be over 10 minutes, then "accessibility" as a resigned factor increases, which implies that potential accessibility in mind would be around 10 minutes on walk or within about 350 meters from nearest railway station.
著者
稲田 貞俊 花岡 公司 近藤 正多嘉
出版者
社団法人日本材料学会
雑誌
材料 (ISSN:05145163)
巻号頁・発行日
vol.16, no.170, pp.883-889, 1967-11-15

We designed the measuring instrument of thickness variation of bulged foil, and by using this apparatus, studied the configuration of bulged surface of aluminum foil. (1) The bulged surface of aluminum foil is composed by two parts; one part near the appex is spherically constant in thickness, the other part is settled inside the sphere. (2) The instable state of bulged surface of alumium foil occurs before the initiating point destructions. (3) The bulged height corresponding to the initiating instable state is detected by measuring the thickness variation.
著者
神鳥 昭
出版者
公益社団法人 日本航海学会
雑誌
日本航海学会論文集 (ISSN:03887405)
巻号頁・発行日
vol.47, pp.79-91, 1972
被引用文献数
3 4

The recent abrupt increase in the sea accidents was due to the increasing marine traffic congestion for the purpose of supporting our rapidly developed economic activities. It is of urgent necessity to establish a countermove for the accidents, especially for the collision. The causality, of the accidents is complicated and differs case by case. Respective cases of accidents were examined in detail with much effort and time. But there lacks a consideration in broad aspects. And this report dealt, statistically, with the influence of the meteorological conditions on the frequencies of the collisions occurred in the Kanmon Strait during the period from 1962 to 1969. And the results obtained were summarized as follows: 1. The collision inclined to occur under the wind from SE or from NW, and that of weaker than 1.6m/s (especially, for the ships smaller than 3,000G.T. in the eastern half) or stronger than 10.8m/s (especially, in winter and spring, in the central area, for the ships smaller than 1,000G.T.) 2. More than 70% of the collisions occurred under the good visibility (better than 4km). When the different time length according to the visibility was taken into account, the poorer visibility than 4km inclined to induce the collisions (especially, in winter and spring, in the Hayatomo Seto, the western and the eastern areas, for the ships of the 100 to 1,000G.T. class). 3. The number of collisions per unit time under the poor visibility (poorer than 2km) was about 8 times as large as that under the good visibility (better than 2km). 4. The ships of the 100 to 1,000G.T. class were concerned with about 80% of the the collisions under the poor visibility; and about 55% of the collision under the poor visibility were those by the pair of the ships of this class. 5. The collision rate per ship passed (P_<PV>) under the poor visibility increased in accordance with the size of ship (x in gross tons) keeping the following relation: P_<PV>=0.10x^<0.79>×10^<-4> 6. The size of the ship had a clear relation to the influence of the visibility. Namely, the value of P_<PV> was 2.17x^<0.20> times as high as that under the good visibility.
著者
吉田 みゆき 高杉 由夫
出版者
日本海洋学会
雑誌
海の研究 (ISSN:09168362)
巻号頁・発行日
vol.10, no.2, pp.123-135, 2001-03-05
被引用文献数
6

瀬戸内海という器は経済の高度成長に伴う埋め立て等によって大きく変形してきた。これらの地形変化が潮汐に及ぼす影響を見るため, 過去30年間の潮汐の経年変化を調べた結果, 半日周潮(M_2)の振幅は, 大阪湾で減少(約2.3cm), 瀬戸内海中央部の備讃瀬戸では大きく増加(約4cm), 周防灘奥部ではやや減少, その西端に位置する関門海峡では大きく減少(約5cm)していた。関門海峡では日周潮も変化しており, 振幅は減少(約1cm)し位相は遅れてきていた。これらについて一次元理論より考察した結果, 埋め立て・浚渫・架橋などの影響により瀬戸内海の固有周期が短くなり, 半日周潮の明石海峡付近の節は東へ移動し, その結果大阪湾では減少してきていた。