著者
上野山 勝也 松尾 豊 大澤 昇平
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

経済の成熟に伴いベンチャー企業への期待が高まっている. 一方で,ベンチャー企業の成功要因の分析はその重要性から多く行われてきたが,情報が限られていた. 本稿ではWeb 上に近年増加する人材情報を活用し成功の予兆を発見する新たな手法を提案する. Cruchbaseという人材データベースを活用し人材の転職履歴情報を元に2 万社に対し人材の転職情報を元にベンチャー企業の評価を行った
著者
上野山 勝也 大澤 昇平 松尾 豊
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.10, pp.2309-2317, 2014-10-15

経済の成熟にともないベンチャー企業への期待が高まっている.ベンチャー企業の上場または事業売却(以降Exit)を高い精度で予測できれば,資金や人材はより適正なベンチャー企業に移動するため価値は高い.一方で,ベンチャー企業のExitを予測するモデルは,データ取得の制約からベンチャー企業の「社内資源」特に資金調達に関する素性を元にしたものが多かった.一方で本稿は「社外資源」である創業メンバーや従業員が持つ過去の人間関係に関わる資産がExitに寄与しているという仮説に基づきExitを予測する手法を提案する.Web上に構築されているCruchbaseという人材データベースを活用することで,これまでデータ取得が困難であった転職履歴情報を活用することでExitを予測する手法を提案する.2万社に対し人材の転職履歴情報を用いてExitの予測を行うことで,用いない手法より10ポイント高い精度でExitを予測できることを確認した.
著者
中原 健一 島田 史也 宮崎 邦洋 関根 正之 大澤 昇平 大島 眞 松尾 豊
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

株式市場における売買審査業務をより効率的かつ合理的に行うために,定量的に見せ玉を検知する手法を提案する.本手法においては,教師ラベルを使用せずに相場操縦行為中に見られる不自然な取引履歴を発見するため,密度比推定による異常検知手法を用いた.東京証券取引所の上場銘柄の中より無作為に選択され,専門家チームによってラベル付けされた118 件の半日単位の一銘柄取引履歴による検証結果によると,見せ玉が疑われる事例の80%は,モデルが予測した異常度順にソートした事例の上位50%に含まれ,実務で使用されている単純な規則によるスクリーニングの結果と比較して更なる精緻化が達成できていることが示された.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.5, pp.469-482, 2014-09-01 (Released:2014-08-15)
参考文献数
22
被引用文献数
1

In social networking service (SNS), popularity of an entity (e.g., person, company and place) roles an important criterion for people and organizations, and several studies pose to predict the popularity. Although recent papers which addressing the problem of predicting popularity use the attributes of entity itself, typically, the popularity of entities depends on the attributes of other semantically related entities. Hence, we take an approach exploiting the background semantic structure of the entities. Usually, many factors affect a person's popularity: the occupation, the parents, the birthplace, etc. All affect popularity. Predicting the popularity with the semantic structure is almost equivalent to solving the question: What type of relation most affects user preferences for an entity on a social medium? Our proposed method for popularity prediction is presented herein for predicting popularity, on a social medium of a given entity as a function of information of semantically related entities using DBpedia as a data source. DBpedia is a large semantic network produced by the semantic web community. The method has two techniques: (1) integrating accounts on SNS and DBpedia and (2) feature generation based on relations among entities. This is the first paper to propose an analysis method for SNS using semantic network.
著者
大澤 昇平
出版者
東京大学
巻号頁・発行日
2015

審査委員会委員 : (主査)東京大学特任准教授 松尾 豊, 東京大学教授 元橋 一之, 東京大学特任教授 阿部 力也, 東京大学特任講師 森 純一郎, 国立情報学研究所教授 武田 英明
著者
大澤 昇平
出版者
東京大学
雑誌
特別研究員奨励費
巻号頁・発行日
2013-04-01

■ウェブマイニングのための検索APIを利用したサンプリング手法に関する研究サンプリングはウェブマイニングにおいて重要な問題であり,アプリケーション・プログラミング・インターフェース(以下,API)を通して効率的にサンプリングする問題を扱う研究が盛んにおこなわれている.本活動ではその中でも特に検索 API に着目したサンプリング問題に焦点を当て,Wikipediaのようなオントロジを活用した辞書ベースのサンプリング手法を提案する.実験では,Facebook からデータを独自にクローリングしたデータに基づき仮想的な APIを構築し,ε-グリーディやε-ファーストなどの強化学習に基づく方策を比較する.■OSS コミュニティおよびクラウドソーシングの統合によるソフトウェア開発者の能力予測に関する研究クラウドソーシングサービスを対象に開発者の能力の推定が行われている.ソフトウェア開発プロジェクトの成功は,開発者の能力に依存するが,こうした能力を推定するのは自明な問題でない.一般に,クラウドソーシングサービスでは,能力はユーザによって評価付けされる.本活動では,オープンソースソフトウェア(OSS)コミュニティとクラウドソーシングサービスを統合することにより,ソフトウェア開発者の能力を推定することを目的とする.まず,能力の推定問題が OSS コミュニティからの素性生成の問題に帰着されることを示し,開発物に基づき開発者の能力を抽象化した値であるs-indexを提案する.具体的には,oDesk (クラウドソーシングサービス)および GitHub (OSS コミュニティ)を統合し,oDesk から得られるデータを教師データする評価値予測モデルを構築する.実験結果では,s-index を用いたモデルが nDCG の観点から用いないモデルよりも上回っていることを示す.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.A-F24, (Released:2016-01-06)
参考文献数
22

Success of software developping project depend on skills of developers in the teams, however, predicting such skills is not a obvious problem. In crowd sourcing services, such level of the skills is rated by the users. This paper aims to predict the rating by integrating open source software (OSS) communities and crowd soursing services. We show that the problem is reduced into the feature construction problem from OSS communities and proposes the s-index, which abstract the level of skills of the developers based on the developed projects. Specifically, we inetgrate oDesk (a crowd sourcing service) and GitHub (an OSS community), and construct prediction model by using the ratings from oDesk as a training data. The experimental result shows that our method outperforms the models without s-index for the aspect of nDCG.
著者
大澤 昇平 松尾 豊
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.10, pp.870-881, 2017-10-01

FacebookやTwitterなどのソーシャルメディアを対象にした分析研究では,分析対象となるエンティティの属性情報を収集するために,ソーシャルメディアの提供するAPI (application programming interface)に対するサンプリングが行われることがある.APIの中でも,検索APIに対するサンプリングはこれまで事例が少なく,効率的なサンプリング手法については明らかになっていない.本論文では,Wikipediaから得られるオントロジーを用いることで,検索APIを利用したサンプリングの効率を高めることができることを示す.具体的に,オントロジーから複数の辞書を生成し,収集したいトピックに合わせて適応的に用いる辞書を変える手法を提案する.また,辞書の評価指標として推定Jaccard指標を提案する.実験では,提案手法がFacebookから25.8%にあたる1800万件のエンティティをサンプリングでき,推定Jaccard係数を用いた手法が既存手法よりも効率が高いことを報告する.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2014, pp.1I23in, 2014

<p>近年、ソーシャルメディアの台頭により、人間関係に関連する膨大な情報がウェブ上に蓄積されるようになり、信頼性に関する指標を定量化することが可能になっている。 本研究では、従来の組織内の文書を対象にしたエキスパート検索と、ソーシャルメディアに蓄積されている信頼性に関する情報を統一的に扱う枠組みを実現する。</p>
著者
大澤 昇平 天笠 俊之 北川 博之
雑誌
全国大会講演論文集
巻号頁・発行日
vol.第72回, no.データベースとメディア, pp.827-828, 2010-03-08
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.5, pp.469-482, 2014
被引用文献数
1

In social networking service (SNS), popularity of an entity (e.g., person, company and place) roles an important criterion for people and organizations, and several studies pose to predict the popularity. Although recent papers which addressing the problem of predicting popularity use the attributes of entity itself, typically, the popularity of entities depends on the attributes of other semantically related entities. Hence, we take an approach exploiting the background semantic structure of the entities. Usually, many factors affect a person's popularity: the occupation, the parents, the birthplace, etc. All affect popularity. Predicting the popularity with the semantic structure is almost equivalent to solving the question: What type of relation most affects user preferences for an entity on a social medium? Our proposed method for popularity prediction is presented herein for predicting popularity, on a social medium of a given entity as a function of information of semantically related entities using DBpedia as a data source. DBpedia is a large semantic network produced by the semantic web community. The method has two techniques: (1) integrating accounts on SNS and DBpedia and (2) feature generation based on relations among entities. This is the first paper to propose an analysis method for SNS using semantic network.
著者
松嶋 達也 大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.3A101, 2018 (Released:2018-07-30)

近年,人工知能の活用による社会の生産性向上への期待が高まっている.この期待の背景として,深層学習が人工知能技術のブレイクスルーになったことが挙げられる.しかし,実世界環境で活用可能な人工知能の構築には,いくつかの課題が残されている.特に,観測が部分的であること,タスクに対する報酬の設計が難しいことの2 点が挙げられる. 部分的な観測を扱うニューラルネットワークのモデルとして,注意機構を持つモデルが提案されている.しかし,これらのモデルでは,注意機構の学習がタスクから定義される外的な報酬信号を用いた強化学習によって行われており,外部からの報酬信号が得られない問題設定下では注意機構の学習を行うことができない. 本研究では,注意機構の学習に外的な報酬を用いる代わりに,観測に対する予測の誤差を注意機構の内的な報酬として与え,観測の予測モデルと注意機構を敵対的な学習により訓練する手法を提案する.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.A-F24_1-10, 2016-03-01 (Released:2016-02-18)
参考文献数
22

Success of software developping project depend on skills of developers in the teams, however, predicting such skills is not a obvious problem. In crowd sourcing services, such level of the skills is rated by the users. This paper aims to predict the rating by integrating open source software (OSS) communities and crowd soursing services. We show that the problem is reduced into the feature construction problem from OSS communities and proposes the s-index, which abstract the level of skills of the developers based on the developed projects. Specifically, we inetgrate oDesk (a crowd sourcing service) and GitHub (an OSS community), and construct prediction model by using the ratings from oDesk as a training data. The experimental result shows that our method outperforms the models without s-index for the aspect of nDCG.
著者
中原 健一 島田 史也 宮崎 邦洋 関根 正之 大澤 昇平 大島 眞 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.1M204, 2018 (Released:2018-07-30)

株式市場における売買審査業務をより効率的かつ合理的に行うために,定量的に見せ玉を検知する手法を提案する.本手法においては,教師ラベルを使用せずに相場操縦行為中に見られる不自然な取引履歴を発見するため,密度比推定による異常検知手法を用いた.東京証券取引所の上場銘柄の中より無作為に選択され,専門家チームによってラベル付けされた118 件の半日単位の一銘柄取引履歴による検証結果によると,見せ玉が疑われる事例の80%は,モデルが予測した異常度順にソートした事例の上位50%に含まれ,実務で使用されている単純な規則によるスクリーニングの結果と比較して更なる精緻化が達成できていることが示された.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.A-F24_1-10, 2016

Success of software developping project depend on skills of developers in the teams, however, predicting such skills is not a obvious problem. In crowd sourcing services, such level of the skills is rated by the users. This paper aims to predict the rating by integrating open source software (OSS) communities and crowd soursing services. We show that the problem is reduced into the feature construction problem from OSS communities and proposes the <i>s</i>-index, which abstract the level of skills of the developers based on the developed projects. Specifically, we inetgrate oDesk (a crowd sourcing service) and GitHub (an OSS community), and construct prediction model by using the ratings from oDesk as a training data. The experimental result shows that our method outperforms the models without <i>s</i>-index for the aspect of nDCG.
著者
宮崎 邦洋 村山 菜月 山本 裕樹 牛山 史明 大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2018, pp.1E203, 2018

<p>サブスクリプション方式のサービスを採用している企業が増えつつある昨今,ユーザ離脱予測はより重要な課題となっている.既存研究では既に多くの機械学習モデルを用いた研究が行われているが,ユーザ離脱予測は時系列データと非時系列データなどの多様なデータ組み合わせて学習させねばならず,それらを上手く組み合わせた学習モデルは十分に研究されていない. 一方で,深層学習の技術は依然発達しており,その特徴としては様々なデータとモデルをEnd-to-Endで学習できることが挙げられる. 本研究では,ロボアドバイザーのサービスを運営するウェルスナビ株式会社のデータを用い,深層学習を用いたユーザ離脱予測モデルを提案する.具体的には時系列データや非時系列データを一つのモデルで学習させる手法を提案する. 実験ではベンチマークとなる既存研究の分類器の精度を上回る結果を得たことで,本手法の有効性が実証された.</p>
著者
金子 貴輝 大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2018, pp.3Pin114, 2018

<p>逐次モンテカルロ(SMC)は、系列的な確率モデルから順にサンプリングできる代表的なサンプリング手法である.しかし,サンプルの縮退(degeneration)のせいで,少ない粒子数ではSMCは尤度の低いサンプルを生成する場合がある.本研究では,サンプルを縮退させる原因としてSMCのリサンプリング目標がサンプルごとに同一であることに注目する.この制約を緩和したいが,非対称な逐次リサンプリング目標の解析的な導出は困難である.そこで,下界近似した系列全体の目標から逐次リサンプリング目標を学習することで,SMCのリサンプリング戦略を非対称に拡張する.これによりSMCと同じ粒子数で,正確な潜在変数の推定を学習によって実現できると期待される.</p>
著者
宮崎 邦洋 村山 菜月 山本 裕樹 牛山 史明 大澤 昇平 松尾 豊
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

サブスクリプション方式のサービスを採用している企業が増えつつある昨今,ユーザ離脱予測はより重要な課題となっている.既存研究では既に多くの機械学習モデルを用いた研究が行われているが,ユーザ離脱予測は時系列データと非時系列データなどの多様なデータ組み合わせて学習させねばならず,それらを上手く組み合わせた学習モデルは十分に研究されていない.一方で,深層学習の技術は依然発達しており,その特徴としては様々なデータとモデルをEnd-to-Endで学習できることが挙げられる.本研究では,ロボアドバイザーのサービスを運営するウェルスナビ株式会社のデータを用い,深層学習を用いたユーザ離脱予測モデルを提案する.具体的には時系列データや非時系列データを一つのモデルで学習させる手法を提案する.実験ではベンチマークとなる既存研究の分類器の精度を上回る結果を得たことで,本手法の有効性が実証された.