著者
山田拓人 鈴木一徳 和良品友大 林隆史
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.635-637, 2011-03-02

近年、Hadoopなどの大規模のデータを分散処理するフレームワークが<br />普及したことにより、蓄積された大量のデータを分析する<br />データマイニングが盛んに行われている。<br /><br />しかしながら、複数の異なる種類のデータを組み合わせた分析では、<br />各々のデータフォーマットが異なるため、分析処理が複雑になってしまう。<br /><br />そこで我々は異なる種類のデータを組み合わせた分析を容易にするために、<br />様々なデータをある一定の形式に変換可能な情報基盤を構築した。<br />具体的には、すべてのデータを分析処理が容易なXML<br />または構造を持ったテキスト形式に変換する。<br /><br />構築した基盤を用いて、<br />各種センサー・医療用データ・天候データ<br />を組み合わせたデータマイニングの結果も含めて報告する。
著者
村田 賢一
雑誌
全国大会講演論文集
巻号頁・発行日
vol.40, pp.472-473, 1990-03-14

筆者らは、或る種の述語論理システムの翻訳という方法による形式的意味記述の研究を、動詞を対象に行ってきた。現在は、この方法の形容詞への適用について研究を進めている。動詞で扱った問題には、(1)意味を実質的意味と非実質的意味に分け、更に前者を基本的を味と付加的を味に分けることによって一つの類義語群に共通する意味を抽出すること(2)アスペクチュアルな分類を行うこと(3)状態遷移図を使った関連語群の分析を行うこと(4)派生語のを味を元の言葉の意味から導出すること、等があった。形容詞については何が問題になるであろうか?機能主義に徹した観点からすれば、形容詞は単純状態性動詞(stative verb)の一種にほかならず、特にとりあげる問題はないと思えるかもしれない。しかし、形容詞には尺度という要素があって、尺度による関連語群の分析が問題になる。なお、この場合関連語群には品詞論上の形容詞だけではなくて、機能的に形容詞的働きをする言葉(動詞や名詞の形容詞的用法を含む)をすべて扱わないと有意義な分析にはならない。他方、日本語形容詞には統語論上ガーガ構文とよばれる形式が豊富であるが、これは動詞一般とは異なった取り扱いが必要である。本稿では、これらの問題のうち、ガーガ構文の取り扱いについての考察を行う。
著者
手島 昌一 嘉数 侑昇
雑誌
全国大会講演論文集
巻号頁・発行日
vol.46, pp.125-126, 1993-03-01

識別システムにニューラルネットワーク(以下NNと略記)を適用しようとする試みは数多く行われており,紙幣識別についても,NNにより従来を上回る識別特性の結果が報告されている.識別のために,紙幣上の数箇所のライン状領域,すなわちセンシングラインにおける濃度等の特性値変化パターンを用いるが,センシングライン位置の決定については,定量的な方法はまだ見いだされていない.本研究では,紙幣を細かなライン状の領域に分割し,個々のラインごとの識別特性をSN比として求めた上で,SN比のよいラインの組み合わせが,最適なセンシングラインとなることを示す.さらに適切なライン本数の決定方法についても考察した.なお,SN比の定義および最適性の評価には,品質工学の手法を用いた.
著者
矢野 啓二郎 瀧口 伸雄 小谷 善行
雑誌
全国大会講演論文集
巻号頁・発行日
vol.48, pp.167-168, 1994-03-07

自然言語処理システムにおいて、未知語の処理を行うことは必須である。我々は処理対象を二字熟語に限定した未知語処理の研究を行っている。その方法は、形態素解析中の二字熟語の未知語の意味分類を推定し、その結果をフレーム構造によって表現するものである。これにより、二字熟語の意味を表現する。これまでに、二字の漢字のそれぞれが持つ意味分類、格支配構造から規則を作り、二字熟語の意味構造を推定する方法を提案した。さらに本稿では、二字の漢字の間の関係が比喩関係にある二字熟語についての考察を行う。
著者
池上 聡 浜田 雅樹 小松原 重之 三上 博英
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.285-286, 1997-03-12

インターネットのトラフィック管理においては、アプリケーションの種類、パケットの発信地、着信地などの統計情報と、パケットのTCP/IPヘッダが必要である。統計情報は、設備投資、トポロジの再構成、ユーザ管理などを行うために用いられ、パケットのヘッダはパケット欠落やルーティングの確認などに用いられる。今日、これらのトラフィックデータ収集の標準として、RMON (Remote Network Monitoring)、RMON 2が存在する。これらは、SNMP (Simple Network Management Protocol) のMIB2 (Management Information Base 2) を拡張したRMON-MIBと、それらにアクセスするためのインターフェースを定義したものである。RMONを用いた実際のトラフィック収集では、ルータやハブ等のネットワーク機器で収集する方法やプローブで収集する方法が存在する。プローブとは、セグメント上の全てのパケットを調査し、それを分析して統計情報を作成したり、後から分析できるようにパケットを保存しておくことができる専用ハード、WS、PC等である。これら2つの方法は一長一短であるが、RMONでは負荷の高い処理を必要とすることから、プローブを用いる方法が将来的に有望である。しかしながら、プローブを用いる際には多くのコストがかかるという問題がある。その理由は、インターネットではトラフィックが特定箇所に集まることがないためにプローブの設置数が多くなること、RMONは負荷の高い処理を要求するためにバックボーンなどの広帯械な伝送路では高性能なプローブを用いる必要があることである。そこで本稿では、処理能力の低い安価なマシンを複数協調させてRMONとして高い処理能力を実現することを目的とし、複数のマシン間での負荷分散方法について検討する。
著者
佐藤 将夫 新田 淳
雑誌
全国大会講演論文集
巻号頁・発行日
vol.49, pp.69-70, 1994-09-20

TPモニタBeTRANは、UNIXマシン上でOnline Transaction Processing Systemを構築するためのミドルレイヤソフトウェアである。TPモニタは、Online Transaction Processing System に必要な機能を実現するため、OSが提供するプロセス管理、プロセス間通信、ファイル管理など数多くの機能を使用する。本稿では、UNIXとWindows NTという全く異なるパラダイムに基づいて開発された2種類のOSについて提供機能の差異をまとめた上で、TPモニタBeTRANを例にOSの違いを吸収するための実装方式を説明し、Windows NT上に構築したBeTRANプロトタイプについてUNIX版BeTRANとの比較および評価報告を行なう。
著者
岡崎 平美 福岡 寛
雑誌
全国大会講演論文集
巻号頁・発行日
vol.47, pp.175-176, 1993-09-27

従来、メインフレームで実現していたDB/DCシステムの機能を踏襲し、安価で、スケラビリテイの高いシステムをUNIX上で実現する分散TPモニタ"BeTRAN"を開発した。BeTRANの通信サーバ機能の実現においては既存システムとの接続性を重視し、かつ、クライアント/サーバシステムとのメッセージ送受信を容易にしている。また、プロトコル支援のためのツールキットとして各種通信ライブラリを提供し、多種多様なプロトコルへの対応を容易にした。本稿ではその通信サーバ機能の実現方式について報告する。
著者
荒野 高志
雑誌
全国大会講演論文集
巻号頁・発行日
vol.41, pp.359-360, 1990-09-04

エキスパートシステムをはじめとするAI技術は、今やさまざまな応用分野で実用化され、運用されている。これらのソフトの多くはプログラミングの容易性や柔軟'性からLISPで書かれているが、LISPでこれらのソフトを書いた場合の問題は、主に(1)Cなどの言語に比べ、実行環境が劣る(実行速度が遅い/使用メモリ量が多い/GCが起こる/....)(2)保守性が悪い(=読解性が悪い)の2点に集約される。(1)については、LISPコンパイラの最適化の強化、LISP-to-Cトランスレータ、リアルタイムGC、並列LISP処理系など、さまざまな研究がなされており、ハードウェアの高性能化・廉価化にも助けられて、実用に耐えうるレベルに達している。しかし、(2)保守性の問題はこれまで未検討で残されてきた。本発表では、LISPの読解性について考察し、保守を支援するツールを試作したので、報告する。
著者
明石 修
雑誌
全国大会講演論文集
巻号頁・発行日
vol.41, pp.30-31, 1990-09-04

Lindaは、通信する相手を意識する必要がない、ポーダブルな並行プログラミング機能を提供することを目的として作られた言語である。しかし、現在はその特徴的な操作に注目し、疎結合、密結合マシンを問わずに並行計算を行なう計算モデルとして捉えられている。実現は、既存の言語に、Lindaモデルに特有な操作を加え、並行プログラミング機能を持った新しい派生言語を作ることにより行なう。本論文では、言語TAOの上に実現したTAO-Lindaに関して、その設計思想及び実現方法について述べ、評価を行なう。
著者
飯島 正 岡田 謙一 横山 光男 北川 節
雑誌
全国大会講演論文集
巻号頁・発行日
vol.33, pp.789-790, 1986-10-01

図形的なプログラム表現を利用するプログラム設計支援の一方式に、命令型(imparative)プログラムに直結する木構造制御流れ図を用いた段階的詳細化の支援があり、既に実用化の域に達している。しかし、木構造制御流れ図は、処理の時系列という命令型スタイルを受け継いでいるため、データの流れ・処理と処理の間の関係が不明確となりがちであり、仕様の変更の波及する範囲の把握も困難である。しかも、プログラムの導出履歴を複数の抽象レベルとして呈示する能力が要求されているにもかかわらず、その構造がプログラム言語レベルの構造化制御構文(連接・反復・選択)に基づくブロック構造に対応しているため、柔軟性に欠ける傾向にある。本論文は、これらの問題を克服する一方策として関数型(functional/applicative)プログラミング・スタイルに着目し、図的表現:T式を利用した関数型プログラム開発法について報告するものである。関数型プログラム開発法は、特に目新しい手法を含んでいるわけではない。関数型プログラミング・スタイルの枠組みの中で自然に取り扱うことのできる、既存の各種プログラム開発技法を総称して関数型プログラム開発法と呼んでいる。そのため、それが関数型プログラミングと相性が良いのは当然といえるが、構造化された命令型プログラミングへの応用も比較的容易である。基本方針は、段階的詳細化による機能分割の際に、バラメータ化を伴うことによってデータの依存関係の明確化を図り、人出力表明を明らかにしておくことによってモジュール間の不整合の発生を抑えることである。
著者
山守 一徳 白崎 昌俊 西垣 秀樹
雑誌
全国大会講演論文集
巻号頁・発行日
vol.33, pp.787-788, 1986-10-01

Lispを用いてプログラミングを行う時、生産的なプログラミングというよりもむしろ実験的なプログラミングを行なっていることが多く、システム設計、モジュール設計、プログラム設計、コーディング、プログラムテスト、システムテストといった段階をはっきり分けたWaterfa11型のソフトウェア開発工程に従っていることは少ない。しかし、大規模システムを開発する時、ソフトウェアの保守・管理面から考えると、種々の仕様書などのドキュメントは、非常に大切である。我々は、これまでのドキュメントが、手続き型言語向きであることに着目し、Lispなどの関数型言語に適したドキュメントについて考察した。本稿では、関数間の呼び出し関係を図示したLisp用の関数関連図の表現方法について報告する。
著者
嶺脇 隆邦 立川 道義
雑誌
全国大会講演論文集
巻号頁・発行日
vol.37, pp.1654-1655, 1988-09-12

名刺は個人情報として利用価値が高く、その自動入力によるデータベースシステムが望まれている。その方法として、名刺OCRへの要求が高まっている。名刺はその書式の違いにより、大きく分けて縦型名刺、横型名刺があり、また読み取り(スキャナへの挿入)方向の違いにより文字の向きは4方向の可能性がある(図1)。したがって名刺OCRにおいては、文字方向の自動判定処理が必要不可欠となる。従来、一般文書については、そのイメージの縦横斜影をとり、行間の比較を行うことによる縦横書式判定方法が報告されているが、名刺はそのレイアウトの複雑さにより単純な斜影のみでは判定ができず、文字列の並び方向がわかっても縦型と横型で文字の向きが異なるという問題があった。本稿では、名刺モデルの概念を導入し項目推定処理を行うことにより、文字認識、キーワード照合処理とあわせて文字の方向判定を効率良く行う方法について報告する。
著者
富樫 雅文
雑誌
全国大会講演論文集
巻号頁・発行日
vol.39, pp.810-811, 1989-10-16

JISで定める仮名文字は63字ある。これに対して文字キーの数は標準鍵盤では48鍵であり、さらに円滑な触指打鍵(touch typing)を考慮すれば、使用するキーは3段30鍵程度であることが要求される。このため、シフト機構を導入するか、または、ローマ字などによるマルチストローク化が考えられてきた。シフト方式とした場合、シフトキーの使用頻度は少なくとも16%程度となる。従来のシフト方式ではこのシフト操作を最も弱い指である小指や他の指と運動方向の異なる親指に割り当てている。本研究では、シフト操作の重要性に鑑み、これを中指に割り当て、鍵盤中央部の文字キーを前置型のシフトーとして使用する新しい文字配列を求める。新しい配列は標準鍵盤の使用を前提とし、使用するキーは3段32キーまたは33キーとする。
著者
米津 光浩 中西 正和
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.9-10, 1996-03-06

化学反応にヒントを得て計算モデルを構築しようという試みはいくつかある。ブロダクションシステムの自己組織化を化学反応に見立てた金田の化学的キャスティングモデル(CCM)、並行計算の理論的記述に化学反応メタファを生かしたBerry、Boudolの化学抽象機械CHAM(CHemical Abstract Machine)などであり、またペトリネットとの対応も古くから指摘されている。我々は特に創発計算を目指した化学反応のモデル化を試みてきている。 本稿では、最も基本的な抽象化学系と、その拡張である負触媒を持つ系について述べる。抽象化学系では特にセルオートマトンが記述可能であることを指摘し、負触媒を持つ系では特に抑止アークつきペトリネットとの等価性と計算万能性を指摘する。
著者
瀧口裕一 大石哲也 長谷川隆三 藤田博 越村三幸 倉門浩二
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.567-569, 2011-03-02

本研究では、Wikipediaの単語(記事)のアクセス数解析に基づいた単語、もしくはカテゴリ間にある関連度を算出し、関連度の高い単語、カテゴリを抽出する方法について提案する。Wikipediaの単語(記事)単位で1時間毎に集計されたアクセス数を基に回帰分析や単語毎にアクセス数が急激に増えた(以下バーストと呼ぶ)期間を検出する方法を用いて、ある単語との関連度の高い単語をWikipedia内の全単語と、その単語内に記載されているリンク先の単語からそれぞれ抽出する。また、Wikipediaの全カテゴリについても単語と同様の方法を用いて、あるカテゴリと関連度の高いカテゴリを抽出する。
著者
喜多村 晶子 竹島 由里子 市川 哲彦 藤代 一成 佐藤 浩史
雑誌
全国大会講演論文集
巻号頁・発行日
vol.48, pp.261-262, 1994-03-07

本研究は、純粋な関数型算譜言語(pure FP)とデータベース(DB)の操作体系との統合を目的としている。関数型データベース算譜言語(DBPL)の研究・開発が行われる一方で、pure FPは種々の参照透過な入出力機構を備えてきた。従って、Nikhilに指摘されたような、順次実行制御機構の欠落に起因する更新操作記述の困難さは解消可能である。関数型のDBPLではDBは記号束縛の環境で与えられ、更新は記号束縛の変更/生成、または記億域に束 縛された変数への代入により行われる。一方、pure FPでは実行時にトップレベルの束縛環境変更はできないため、なんらかの形で変数操作に対応する操作体系を持ち込む必要がある。本研究では、関数型算譜言語Haskell上に、モナド(Monad)による順次実行制御と、多重定義関数によるDB操作体系の導入を行った。多重定義はクラス(class)機構によって制御されているが、言語仕様の若干の変更が必要であったため、Glasgow Haskell Compilerに手を加える形で、これを実現した。簡単な操作例を図に示す。これは"university" DB中の学生データを更新する例であり、findStudentは名前で学生データを検索するためのユーザ定義関数である。以下、想定したデータモデルの簡単な説明に続いて、モナドの利用とDB操作体系の実現について順に説明をし、最後にまとめを行う。