著者
中川 裕志 角野 為耶
出版者
一般社団法人情報処理学会
雑誌
研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.12, pp.1-6, 2013-11-14

ビッグデータ利用において個人特定をできることがプライバシー保護の観点から問題であることが指摘され,プライバシー保護データマイニングの分野で匿名化手法の研究が進んできた.一方,個人が自分自身と直接関係しない情報で否定的な事情を疑われること,すなわち濡れ衣の被疑はこれまでプライバシー保護データマイニング分野では見過ごされてきた問題である.本研究では,このような問題意識から特定の事象と無関係な人にその事象に関する疑いがかかる濡れ衣現象を誘発する構造を明らかにし,対策を検討する.Identifying person in using the Big Data is problematic in privacy protection, resulting in the advancement of anonymization methods for privacy preserving data mining. On the other hand, a person is misleadingly suspected as a bad guy due to the information which actually has nothing to do with him/her. This is so called false light which we have not paid enough attention so far. In this report, we identify the mechanism which generates false light and also propose one of countermeasure.
著者
小宮山 純平 本多 淳也 鹿島 久嗣 中川 裕志
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21888833)
巻号頁・発行日
vol.2015-MPS-103, no.14, pp.1-8, 2015-06-16

バンディット問題 (multi-armed bandit problem) は,情報の活用と探索の間のトレードオフをモデル化した問題である.バンディット問題にはいくつかの亜種があるが,そのうち比較バンデイット問題 (dueling bandit problem) と呼ばれるものは,一対比較によるフィードバックを用いて最適化を行う.比較バンディット問題の枠組みを用いることによって,検索エンジンのランキング手法の比較や,人間の選好抽出の問題に対して,効率的な最適化を行うことができる.本研究では,比較バンディット問題における理論的な性能限界およびそれを達成するアルゴリズムを提案する.このアルゴリズムは,経験尤度を用いた通常のバンディット問題におけるアルゴリズム (本多,竹村,2010) の比較バンデイット問題への拡張である.提案手法を評価するため,検索エンジンの実データにおけるランキング手法の比較や,寿司データセット (神嶌,2003) などによる人間の選好抽出における性能を既存手法と比較する.
著者
森 辰則 瀧野 弘幸 中川 裕志
出版者
言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.2, no.4, pp.3-18, 1995-10

我々は,接続助詞「ので」による順接の複文と接続助詞「のに」による逆接の複文を対象とする理解システムを計算機上に構築することを目的とする.この際には,ゼロ代名詞の照応の解析が重要な問題となるが,文献(中川1994; Nakagawa and Nishizawa1994) にあるように,本論文で扱う形式の複文では動機保持者という語用論的役割を新たに定義し用いることにより,従属節と主節それぞれで設定される意味役割や語用論的役割の間の関係を制約として記述することができる.そこで,日本語の複文に対する形態素解析や構文解析の結果を素性構造で記述し,この結果に対して制約論理プログラミングの手法を用いることにより意味および語用論的役割間の制約を解消し,ゼロ代名詞照応などを分析する理解システムを計算機上に構築した.
著者
小宮山 純平 大岩 秀和 中川 裕志
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

MannらによるIterative Parameter Mixtureを代表例とした、データが多くのマシンに分散しており、各マシンでの学習を重みづけして統合する状況を考える。一部のマシンが故障などにより異常なデータを返し、学習の結果を悪化させることが懸念される。データ分布の間のダイバージェンスを考え、各マシンの重要度をそのデータから自動的に重みづけし、異常データの影響を抑える手法を提案する。
著者
大岩 秀和 松島 慎 中川 裕志
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.18, pp.1-6, 2011-02-28

オンライン学習 (逐次学習) とは,訓練データを 1 つ受け取るたびに逐次的に学習を行う手法であり,大規模な訓練集合からの学習が効率化される.L1 正則化とは,学習上不要なパラメータを零化する手法で,学習の高速化やメモリ効率の改善が期待される.2009 年に提案された FOBOS7) は上記の二手法を組み合わせた,教師あり学習のための L1 正則化付きオンライン学習手法である.しかし FOBOS では,特徴の出現回数が不均一な訓練集合では,低頻度の特徴が排除されやすい性質を持つ.FOBOS では各特徴の出現頻度やパラメータの累積更新幅とは無関係に全特徴に共通の零化を施すためである.しかし既存の L1 正則化付きオンライン学習アルゴリズムでは,この性質は分析されてこなかった.本稿では,特徴の出現回数の情報を用いた L1 正則化を導入した教師あり学習のためのオンライン学習手法 (HF-FOBOS) を提案する.さらに,HF-FOBOS は既存手法と同様の計算コスト.収束速度でパラメータの累積更新幅に応じた L1 正則化を実現する学習手法である事を確認する.また,HF-FOBOS と FOBOS に対して実問題に基づく実験を行い,出現頻度を利用した L1 正則化が精度向上へ寄与することを示した.Online learning is a method that updates parameters whenever it receives a single data. Online learning can learn efficiently from large data set. L1 regularization is used for inducing sparsity into parameters and exclude unnecessary parameters. FOBOS7) combines these two methods described above and presented a supervised online learning method with an efficient L1 regularization. FOBOS has the property the parameters of low frequency features are zeros in a heterogeneous data set. However, this property is not analyzed enough in the field of online learning. In this paper, we presented a new online supervised learning method with L1 regularization based on the number of occurrences of feature, named Heterogeneous Frequency FOBOS (HF-FOBOS). HF-FOBOS can solve optimization problems at same computational costs and convergence rate as FOBOS. Moreover, we examined the performance of our algorithms with classification tasks, and confirmed L1 regularization based on the frequency of features improve accuracy.
著者
佐野 直美 槙 健志 森 辰則 中川 裕志
雑誌
全国大会講演論文集
巻号頁・発行日
vol.44, pp.213-214, 1992-02-24

比喩表現は本質的に文脈依存が強い現象であるので、談話において比喩表現を的確に理解するには、その表現だけから解釈を引き出すのでは理解が不十分だったり、かえって理解を因難にしてしまう場合がある。このため、テキストを全体として捉え、文脈を考慮に入れた上で比喩解釈を行う必要がある。談話に一貫性を持たせる、すなわち結束性を充足させるように比喩を理解することは談話の正しい解釈を得るために必要であるだけでなく、比喩を正確に、また容易に理解する上でも不可欠である。本稿では、結束性を充足する解釈を得る手段の一つとしての比喩を考えるが、その重要な手がかりを与えるものとして、言語的制約の解析を次に9月11日の読売新聞のコラムからの抜粋を用いて行う。「ブロンディ」から「沈黙の艦隊」に至る40数年の問に、日本人の対米観が大きく揺れ動いたことは間違いない。なぜ、こうした振幅が起こるのだろうか。アメリカ史の猿谷要・東京女子大教授は「60年安保など、"夫婦げんか"はあったけれど、終戦から73年のオイルショックのころまでは、日米の蜜月(みつげつ)時代だった」と見る。これらの制転を充足する比喩理解についてはにおいて議論する。
著者
大岩 秀和 中川 裕志
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

オンライン学習は,データを受け取るたび逐次的に学習器を更新する手法である.そのため,過去の学習器で正答したデータに対し,学習器のルール更新後に誤答する事がある.所得効果より,この誤答コストは未知のデータに対する誤答コストよりも大きい事が示唆される.しかし,既存の枠組みでは前者のコストは考慮いない.本稿は所得効果を導入した枠組みを定式化し,所得効果付きオンライン学習に対応したアルゴリズムを提案する.
著者
楊 斌 中川 裕志
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

Numerous methods have been proposed for privacy-preserving data mining (PPDM). Most of these methods are based on an assumption that semi-honest is and collusion is not present. In other words, some parties may collude and share their record to deduce the private information of other parties. We considered a general problem in this issue - multiparty secure computation of functions on secure summations of data spreading around multiple parties. In order to solve above collustion problem, we have proposed a secure computation method that entails a high level of collusion-resistance. Unfortunately, the private inputs of some parties may be infered because unnecessary information is disclosed in the process of this method. In this paper, we will improve this method, so that the final result is directly computed without any intermediate information being revealed. Moreover, this method can be used to securely compute almost any kind of function on secure cummations.
著者
中川 裕志 中島 秀之 柳田 昌宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.27, no.3, pp.297-303, 1986-03-15

本論文では 多重世界機構を利用した世界の状態の時間的推移の表現法と推論について述べている.提案した方法は 時間情報として半順序関係を考え 時間軸を離散的時刻によって構成する.各時刻の状態変化をUranusにおける一つの世界とみなし 多重世界における継承(inheritance)を用いて 時間推移による世界の状態変化を表している. また より複雑な状態変化を扱うために 継承を選択的に打ち消すための述語も導入している.さらに可能性のある複数の時間的変化を表すための条件付き半順序関係とその遅延評価法 実時間を扱うためのTime Counterについても触れている.
著者
中川 裕志 湯本 紘彰 森 辰則
出版者
言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.10, no.1, pp.27-46, 2003-01

本論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する.本論文では名詞(単名詞と複合名詞) を対象として専門用語抽出について検討する.基本的アイデアは,単名詞のバイグラムから得られる単名詞の統計量を利用するという点である.より具体的に言えば,ある単名詞が複合名詞を形成するために連接する名詞の頻度を用いる.この頻度を利用した数種類の複合名詞スコア付け法を提案する.NTCIR1 TMREC テストコレクションによって提案方法を実験的に評価した.この結果,スコアの上位の1,400 用語候補以内,ならびに,12,000 用語候補以上においては,単名詞バイグラムの統計に基づく提案手法が優れていることがわかった.
著者
中川 裕志 湯本 紘彰 森 辰則
出版者
言語処理学会
雑誌
自然言語処理 = Journal of natural language processing (ISSN:13407619)
巻号頁・発行日
vol.10, no.1, pp.27-45, 2003-01-10
被引用文献数
40

本論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する.本論文では名詞(単名詞と複合名詞) を対象として専門用語抽出について検討する.基本的アイデアは,単名詞のバイグラムから得られる単名詞の統計量を利用するという点である.より具体的に言えば,ある単名詞が複合名詞を形成するために連接する名詞の頻度を用いる.この頻度を利用した数種類の複合名詞スコア付け法を提案する.NTCIR1 TMREC テストコレクションによって提案方法を実験的に評価した.この結果,スコアの上位の1,400 用語候補以内,ならびに,12,000 用語候補以上においては,単名詞バイグラムの統計に基づく提案手法が優れていることがわかった.In this paper, we propose a new idea of automatically recognizing domain specific terms from monolingual corpus. The majority of domain specific terms are compound nouns that we aim at extracting. Our idea is based on single-noun statistics calculated with single-noun bigrams. Namely we focus on how many nouns adjoin the noun in question to form compound nouns. In addition, we combine this measure and frequency of each compound nouns and single-nouns, which we call FLR method. We experimentally evaluate these methods on NTCIR1 TMREC test collection. As the results, when we take into account less than 1,400 or more than 12,000 highest term candidates, FLR method performs best.
著者
湯本 紘彰 森 辰則 中川 裕志
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2001, no.86(2001-NL-145), pp.111-118, 2001-09-10

本論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する。本論文では名詞(単名詞と複合名詞)を対象として専門用語抽出について検討する。基本的アイデアは、単名詞のバイグラムから得られる単名詞の統計量を利用するという点である。より具体的に言えば、ある単名詞が複合名詞を形成するために連接する名詞の頻度を用いる。この頻度を利用した数種類の複合名詞スコア付け法を提案する。NTCIR1 TMREC テストコレクションによって提案方法を実験的に評価した。この結果、スコアの上位の1 400用語候補以内においては 単名詞バイグラムの統計に基づく提案手法が優れていた。
著者
石井 聡一 福原 知宏 増田 英孝 中川 裕志
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

本研究では,アフィリエイトスパムのフィルタリングを目的とするアフィリエイト分析支援システムを提案する. 提案システムでは利用者からのアフィリエイトID,URL,商品名をクエリとし,クエリに応じてアフィリエイトIDが出現するブログ数,商品数,価格帯,商品ジャンル等を解析する. これによって,複数のブログサイトにまたがったアフィリエイタの分析やアフィリエイタの掲載商品の傾向の分析が可能となる.
著者
西澤 信一郎 中川 裕志
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.41-42, 1996-03-06

一般に,談話には構造があるといわれている[Hob90].これは発話者の「思考の流れ」を示していると考えられ,発話者は,地図課題対話など目的の定まった会話の場合はもちろんのこと,雑談など特定の目的に左右されない自由会話の場合でも,この構造をある程度認識し,協調的な会話を進めているものと考えられる.そのため,会話の持つ文脈情報の獲得,さらには人間同士の会話への計算機システムの参加,などを考える際には,談話の持つ構造の獲得や理解が必要となると考えられる.本稿では.飲み会の席上での会話データを用いて,接続助詞「から」や接続詞「だから」「だって」などで表される因果関係のもつ発話間の構造について考察する.
著者
木曽 宏顕 森 辰則 中川 裕志
雑誌
全国大会講演論文集
巻号頁・発行日
vol.46, pp.169-170, 1993-03-01

文A,Bを接続助詞「ながら」でつないだ文「AながらB」には,AとBが同時進行的に起こっていることを表すものと、AであるにもかかわらずBという逆接的意味合いを生じるものと二通りあることが知られている。本稿では、「AながらB」がどちらの解釈になるのかを文Aの持つ性質により決定する方法についと論じ、特に取り立て助詞との関係について見ていく。
著者
宗片 健太朗 福原 知宏 山田 剛一 絹川 博之 中川 裕志
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第22回全国大会(2008)
巻号頁・発行日
pp.97, 2008 (Released:2009-07-31)

本研究では、Web上で人々が注目しているページの収集と分析を行うことを 目的とし、ソーシャルブックマークを用いた情報収集・分析ツールの 開発を行った。 提案ツールについて述べ、 本ツールを用いて得られたソーシャルブックマーク上の タグやコメントデータの分析結果について述べる。
著者
吉田 稔 中川 裕志
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

Suffix Array索引付けによるWikipedia検索支援システムを提案する。提案システムでは、クエリの連接語や同義語等を動的に抽出し、クエリの入力と同時にインタラクティブに提示する。