著者
上野山 勝也 松尾 豊 大澤 昇平
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

経済の成熟に伴いベンチャー企業への期待が高まっている. 一方で,ベンチャー企業の成功要因の分析はその重要性から多く行われてきたが,情報が限られていた. 本稿ではWeb 上に近年増加する人材情報を活用し成功の予兆を発見する新たな手法を提案する. Cruchbaseという人材データベースを活用し人材の転職履歴情報を元に2 万社に対し人材の転職情報を元にベンチャー企業の評価を行った
著者
上野山 勝也 大澤 昇平 松尾 豊
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.10, pp.2309-2317, 2014-10-15

経済の成熟にともないベンチャー企業への期待が高まっている.ベンチャー企業の上場または事業売却(以降Exit)を高い精度で予測できれば,資金や人材はより適正なベンチャー企業に移動するため価値は高い.一方で,ベンチャー企業のExitを予測するモデルは,データ取得の制約からベンチャー企業の「社内資源」特に資金調達に関する素性を元にしたものが多かった.一方で本稿は「社外資源」である創業メンバーや従業員が持つ過去の人間関係に関わる資産がExitに寄与しているという仮説に基づきExitを予測する手法を提案する.Web上に構築されているCruchbaseという人材データベースを活用することで,これまでデータ取得が困難であった転職履歴情報を活用することでExitを予測する手法を提案する.2万社に対し人材の転職履歴情報を用いてExitの予測を行うことで,用いない手法より10ポイント高い精度でExitを予測できることを確認した.
著者
中原 健一 島田 史也 宮崎 邦洋 関根 正之 大澤 昇平 大島 眞 松尾 豊
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

株式市場における売買審査業務をより効率的かつ合理的に行うために,定量的に見せ玉を検知する手法を提案する.本手法においては,教師ラベルを使用せずに相場操縦行為中に見られる不自然な取引履歴を発見するため,密度比推定による異常検知手法を用いた.東京証券取引所の上場銘柄の中より無作為に選択され,専門家チームによってラベル付けされた118 件の半日単位の一銘柄取引履歴による検証結果によると,見せ玉が疑われる事例の80%は,モデルが予測した異常度順にソートした事例の上位50%に含まれ,実務で使用されている単純な規則によるスクリーニングの結果と比較して更なる精緻化が達成できていることが示された.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.5, pp.469-482, 2014-09-01 (Released:2014-08-15)
参考文献数
22

In social networking service (SNS), popularity of an entity (e.g., person, company and place) roles an important criterion for people and organizations, and several studies pose to predict the popularity. Although recent papers which addressing the problem of predicting popularity use the attributes of entity itself, typically, the popularity of entities depends on the attributes of other semantically related entities. Hence, we take an approach exploiting the background semantic structure of the entities. Usually, many factors affect a person's popularity: the occupation, the parents, the birthplace, etc. All affect popularity. Predicting the popularity with the semantic structure is almost equivalent to solving the question: What type of relation most affects user preferences for an entity on a social medium? Our proposed method for popularity prediction is presented herein for predicting popularity, on a social medium of a given entity as a function of information of semantically related entities using DBpedia as a data source. DBpedia is a large semantic network produced by the semantic web community. The method has two techniques: (1) integrating accounts on SNS and DBpedia and (2) feature generation based on relations among entities. This is the first paper to propose an analysis method for SNS using semantic network.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.A-F24, (Released:2016-01-06)
参考文献数
22

Success of software developping project depend on skills of developers in the teams, however, predicting such skills is not a obvious problem. In crowd sourcing services, such level of the skills is rated by the users. This paper aims to predict the rating by integrating open source software (OSS) communities and crowd soursing services. We show that the problem is reduced into the feature construction problem from OSS communities and proposes the s-index, which abstract the level of skills of the developers based on the developed projects. Specifically, we inetgrate oDesk (a crowd sourcing service) and GitHub (an OSS community), and construct prediction model by using the ratings from oDesk as a training data. The experimental result shows that our method outperforms the models without s-index for the aspect of nDCG.
著者
大澤 昇平
出版者
東京大学
巻号頁・発行日
2015

審査委員会委員 : (主査)東京大学特任准教授 松尾 豊, 東京大学教授 元橋 一之, 東京大学特任教授 阿部 力也, 東京大学特任講師 森 純一郎, 国立情報学研究所教授 武田 英明
著者
大澤 昇平 松尾 豊
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.10, pp.870-881, 2017-10-01

FacebookやTwitterなどのソーシャルメディアを対象にした分析研究では,分析対象となるエンティティの属性情報を収集するために,ソーシャルメディアの提供するAPI (application programming interface)に対するサンプリングが行われることがある.APIの中でも,検索APIに対するサンプリングはこれまで事例が少なく,効率的なサンプリング手法については明らかになっていない.本論文では,Wikipediaから得られるオントロジーを用いることで,検索APIを利用したサンプリングの効率を高めることができることを示す.具体的に,オントロジーから複数の辞書を生成し,収集したいトピックに合わせて適応的に用いる辞書を変える手法を提案する.また,辞書の評価指標として推定Jaccard指標を提案する.実験では,提案手法がFacebookから25.8%にあたる1800万件のエンティティをサンプリングでき,推定Jaccard係数を用いた手法が既存手法よりも効率が高いことを報告する.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.5, pp.469-482, 2014

In social networking service (SNS), popularity of an entity (e.g., person, company and place) roles an important criterion for people and organizations, and several studies pose to predict the popularity. Although recent papers which addressing the problem of predicting popularity use the attributes of entity itself, typically, the popularity of entities depends on the attributes of other semantically related entities. Hence, we take an approach exploiting the background semantic structure of the entities. Usually, many factors affect a person's popularity: the occupation, the parents, the birthplace, etc. All affect popularity. Predicting the popularity with the semantic structure is almost equivalent to solving the question: What type of relation most affects user preferences for an entity on a social medium? Our proposed method for popularity prediction is presented herein for predicting popularity, on a social medium of a given entity as a function of information of semantically related entities using DBpedia as a data source. DBpedia is a large semantic network produced by the semantic web community. The method has two techniques: (1) integrating accounts on SNS and DBpedia and (2) feature generation based on relations among entities. This is the first paper to propose an analysis method for SNS using semantic network.
著者
松嶋 達也 大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.3A101, 2018 (Released:2018-07-30)

近年,人工知能の活用による社会の生産性向上への期待が高まっている.この期待の背景として,深層学習が人工知能技術のブレイクスルーになったことが挙げられる.しかし,実世界環境で活用可能な人工知能の構築には,いくつかの課題が残されている.特に,観測が部分的であること,タスクに対する報酬の設計が難しいことの2 点が挙げられる. 部分的な観測を扱うニューラルネットワークのモデルとして,注意機構を持つモデルが提案されている.しかし,これらのモデルでは,注意機構の学習がタスクから定義される外的な報酬信号を用いた強化学習によって行われており,外部からの報酬信号が得られない問題設定下では注意機構の学習を行うことができない. 本研究では,注意機構の学習に外的な報酬を用いる代わりに,観測に対する予測の誤差を注意機構の内的な報酬として与え,観測の予測モデルと注意機構を敵対的な学習により訓練する手法を提案する.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.A-F24_1-10, 2016-03-01 (Released:2016-02-18)
参考文献数
22

Success of software developping project depend on skills of developers in the teams, however, predicting such skills is not a obvious problem. In crowd sourcing services, such level of the skills is rated by the users. This paper aims to predict the rating by integrating open source software (OSS) communities and crowd soursing services. We show that the problem is reduced into the feature construction problem from OSS communities and proposes the s-index, which abstract the level of skills of the developers based on the developed projects. Specifically, we inetgrate oDesk (a crowd sourcing service) and GitHub (an OSS community), and construct prediction model by using the ratings from oDesk as a training data. The experimental result shows that our method outperforms the models without s-index for the aspect of nDCG.
著者
中原 健一 島田 史也 宮崎 邦洋 関根 正之 大澤 昇平 大島 眞 松尾 豊
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.1M204, 2018 (Released:2018-07-30)

株式市場における売買審査業務をより効率的かつ合理的に行うために,定量的に見せ玉を検知する手法を提案する.本手法においては,教師ラベルを使用せずに相場操縦行為中に見られる不自然な取引履歴を発見するため,密度比推定による異常検知手法を用いた.東京証券取引所の上場銘柄の中より無作為に選択され,専門家チームによってラベル付けされた118 件の半日単位の一銘柄取引履歴による検証結果によると,見せ玉が疑われる事例の80%は,モデルが予測した異常度順にソートした事例の上位50%に含まれ,実務で使用されている単純な規則によるスクリーニングの結果と比較して更なる精緻化が達成できていることが示された.
著者
大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.A-F24_1-10, 2016

Success of software developping project depend on skills of developers in the teams, however, predicting such skills is not a obvious problem. In crowd sourcing services, such level of the skills is rated by the users. This paper aims to predict the rating by integrating open source software (OSS) communities and crowd soursing services. We show that the problem is reduced into the feature construction problem from OSS communities and proposes the <i>s</i>-index, which abstract the level of skills of the developers based on the developed projects. Specifically, we inetgrate oDesk (a crowd sourcing service) and GitHub (an OSS community), and construct prediction model by using the ratings from oDesk as a training data. The experimental result shows that our method outperforms the models without <i>s</i>-index for the aspect of nDCG.
著者
金子 貴輝 大澤 昇平 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2018, pp.3Pin114, 2018

<p>逐次モンテカルロ(SMC)は、系列的な確率モデルから順にサンプリングできる代表的なサンプリング手法である.しかし,サンプルの縮退(degeneration)のせいで,少ない粒子数ではSMCは尤度の低いサンプルを生成する場合がある.本研究では,サンプルを縮退させる原因としてSMCのリサンプリング目標がサンプルごとに同一であることに注目する.この制約を緩和したいが,非対称な逐次リサンプリング目標の解析的な導出は困難である.そこで,下界近似した系列全体の目標から逐次リサンプリング目標を学習することで,SMCのリサンプリング戦略を非対称に拡張する.これによりSMCと同じ粒子数で,正確な潜在変数の推定を学習によって実現できると期待される.</p>
著者
大澤 昇平 天笠 俊之 北川 博之
雑誌
全国大会講演論文集
巻号頁・発行日
vol.第72回, no.データベースとメディア, pp.827-828, 2010-03-08
著者
宮崎 邦洋 村山 菜月 山本 裕樹 牛山 史明 大澤 昇平 松尾 豊
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

サブスクリプション方式のサービスを採用している企業が増えつつある昨今,ユーザ離脱予測はより重要な課題となっている.既存研究では既に多くの機械学習モデルを用いた研究が行われているが,ユーザ離脱予測は時系列データと非時系列データなどの多様なデータ組み合わせて学習させねばならず,それらを上手く組み合わせた学習モデルは十分に研究されていない.一方で,深層学習の技術は依然発達しており,その特徴としては様々なデータとモデルをEnd-to-Endで学習できることが挙げられる.本研究では,ロボアドバイザーのサービスを運営するウェルスナビ株式会社のデータを用い,深層学習を用いたユーザ離脱予測モデルを提案する.具体的には時系列データや非時系列データを一つのモデルで学習させる手法を提案する.実験ではベンチマークとなる既存研究の分類器の精度を上回る結果を得たことで,本手法の有効性が実証された.
著者
巣籠 悠輔 大澤 昇平 松尾 豊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.2, pp.744-752, 2015-02-15

近年,ビジネスの現場において,ソーシャルネットワークサービス(SNS)を人脈構築に利用するケースが増加してきている.特に,人脈形成に特化したSNSはビジネスSNSと呼ばれる.ビジネスSNS上での人脈の構築は,新規顧客開拓や転職先の確保など,何らかの効用を得ることを目的として行われるのが一般的である.ここでいう効用とは,地位や収入などのステータスが高い人と知り合いであることによって,よい取引に一緒に参加する,何か自分の身に不都合が生じた際に助けを求めることができたり,転職などにおいて自分に有利な情報を得ることができたりするなどの経済的なメリットを得られることを指す.人脈の持つ性質として,人脈の維持に時間的な制約が存在することから,1人の人物が持てる人脈の量に限りがあることがあげられる.また,人脈から獲得できる効用は必ずしも一定ではなく,時間軸に沿って変動する.そのため,人脈の構築は期待効用とリスクという2つの尺度に沿って行う必要がある.本研究では,期待効用とリスクの2つの尺度から人脈の最適化を行うことを目的とし,金融工学の理論の1つである現代ポートフォリオ理論をビジネスSNS上の人脈に適用する枠組みについて提案する.また,本研究はビジネスSNSの1つであるWantedlyのデータに対して実験を行い,クラスタ係数の大きな人脈ほど,リスクが高く最適ポートフォリオから乖離していることを示す.A professional network service is a social network service (SNS) which enable users to construct their connections for business use. In professional network services, the users expect utility by making connection with other users who have a high rank. The utility is economic merit such as participating efficient deal, get assistance when causing inconvenience, and get information in turnover situation. However, the total amount of connection has a limitation because there is a time constraint: the most of business users would be busy, and thus their available time to keep connection with other users is highly limited. In computational finance, connection is one of social capital, and is dealt as financial good. Hence, constructing connection is equivalent to investment for social relationship, and thus a set of connections which a user has is a portfolio, a set of financial goods which a user has. This paper presents a framework applying modern portfolio theory to connection on SNS. Besides, we perform an experiment to Wantedly, and show that connections which have higher cluster coefficient have higher risk and differ from optimal portfolio.
著者
巣籠 悠輔 大澤 昇平 松尾 豊
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.2, pp.744-752, 2015-02-15

近年,ビジネスの現場において,ソーシャルネットワークサービス(SNS)を人脈構築に利用するケースが増加してきている.特に,人脈形成に特化したSNSはビジネスSNSと呼ばれる.ビジネスSNS上での人脈の構築は,新規顧客開拓や転職先の確保など,何らかの効用を得ることを目的として行われるのが一般的である.ここでいう効用とは,地位や収入などのステータスが高い人と知り合いであることによって,よい取引に一緒に参加する,何か自分の身に不都合が生じた際に助けを求めることができたり,転職などにおいて自分に有利な情報を得ることができたりするなどの経済的なメリットを得られることを指す.人脈の持つ性質として,人脈の維持に時間的な制約が存在することから,1人の人物が持てる人脈の量に限りがあることがあげられる.また,人脈から獲得できる効用は必ずしも一定ではなく,時間軸に沿って変動する.そのため,人脈の構築は期待効用とリスクという2つの尺度に沿って行う必要がある.本研究では,期待効用とリスクの2つの尺度から人脈の最適化を行うことを目的とし,金融工学の理論の1つである現代ポートフォリオ理論をビジネスSNS上の人脈に適用する枠組みについて提案する.また,本研究はビジネスSNSの1つであるWantedlyのデータに対して実験を行い,クラスタ係数の大きな人脈ほど,リスクが高く最適ポートフォリオから乖離していることを示す.
著者
保住 純 飯塚 修平 大澤 昇平 中山 浩太朗 高須 正和 嶋田 絵理子 須賀 千鶴 西山 圭太 松尾 豊
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

世界各国のコンテンツ消費トレンドを統一的に把握するプラットフォームを構築するための、Web上のデータマイニングで得られる情報から消費トレンド指数を算出するシステムの設計手法を提案し、その精度を検証する。具体的には検索エンジンやTwitter、Wikipediaのページ情報を素性に用いた、日本のマンガ消費のトレンド指数を6ヶ月先まで予測するシステムを設計し、その精度の検証を行う。