著者
梶村 俊介 馬場 雪乃 梶野 洸 鹿島 久嗣
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.K-F79_1-9, 2016-03-01 (Released:2016-02-18)
参考文献数
20

Crowdsourcing allows human intelligence tasks to be outsourced to a large number of unspecified people at low costs. However, because of the uneven ability and diligence of crowd workers, the quality of their work is also uneven and sometimes quite low. Therefore, quality control is one of the central issues in crowdsourcing research. In this paper, we address a quality control problem of enumeration tasks, in which workers are asked to enumerate as many answers satisfying certain conditions as possible. As examples of enumeration tasks, we consider text collection tasks in addition to POI collection tasks. Since workers neither necessarily provide correct answers nor provide exactly the same answers even if the answers indicate the same object because of orthographic or numerical variations, we propose a two-stage quality control method consisting of an answer clustering stage and a reliability estimation stage. The answer clustering stage with a new constrained exemplar clustering method groups answers indicating the same object into a cluster and requires a representative answer from each cluster, and then the reliability estimation stage with a modified HITS estimates the reliabilities of representative answers and removes unreliable ones. Implemented with a new constrained exemplar clustering and a modified HITS algorithm, the effectiveness of our method is demonstrated as compared to baseline methods on several real crowdsourcing datasets of POI collection tasks and text collection tasks.
著者
梶野 洸 坪井 祐太 佐藤 一誠 鹿島 久嗣
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

教師付き学習における教師データをクラウドソーシングを利用して作成する試みが広まっている.このようなデータは信頼性が低いため,真の教師データの推定や,このデータを用いた識別器の学習に関する研究が行われているが,真の教師データが一部存在する場合の研究は行われていない.本研究ではクラウドソーシングで得られた教師データと真の教師データを併用して直接識別器を構成する手法を提案し,その性能を検証する.
著者
梶野 洸 鹿島 久嗣
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.27, no.3, pp.133-142, 2012 (Released:2012-03-27)
参考文献数
16
被引用文献数
18 35

It has attracted considerable attention to use crowdsourcing services to collect a large amount of labeled data for machine learning, since crowdsourcing services allow one to ask the general public to label data at very low cost through the Internet. The use of crowdsourcing has introduced a new challenge in machine learning, that is, coping with low quality of crowd-generated data. There have been many recent attempts to address the quality problem of multiple labelers, however, there are two serious drawbacks in the existing approaches, that are, (i) non-convexity and (ii) task homogeneity. Most of the existing methods consider true labels as latent variables, which results in non-convex optimization problems. Also, the existing models assume only single homogeneous tasks, while in realistic situations, clients can offer multiple tasks to crowds and crowd workers can work on different tasks in parallel. In this paper, we propose a convex optimization formulation of learning from crowds by introducing personal models of individual crowds without estimating true labels. We further extend the proposed model to multi-task learning based on the resemblance between the proposed formulation and that for an existing multi-task learning model. We also devise efficient iterative methods for solving the convex optimization problems by exploiting conditional independence structures in multiple classifiers.
著者
梶野 洸
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

原子価を守った分子グラフを常に生成可能なグラフ文法とそのデータからの学習方法を提案する。
著者
梶野 洸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.3E104, 2018 (Released:2018-07-30)

原子価を守った分子グラフを常に生成可能なグラフ文法とそのデータからの学習方法を提案する。
著者
梶野 洸 馬場 雪乃 鹿島 久嗣
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

クラウドソーシングでは写真のタグ付けや音声書き起こしなど様々なデータ処理の仕事が依頼できる。しかしワーカーに渡すデータに不特定多数に公開すべきでない情報が含まれる場合はプライバシの問題が生じるため、クラウドソーシングを用いるのは不適切となる。本発表では写真中の顔を隠す仕事を題材とし、この仕事におけるプライバシ定義を行うと共に、プライバシを保護しつつデータ処理を行う手法の提案及び実験的な評価を行う。
著者
梶野 洸 坪井 祐太 佐藤 一誠 鹿島 久嗣
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.28, no.3, pp.243-248, 2013 (Released:2013-03-13)
参考文献数
9
被引用文献数
2

Crowdsourcing services are often used to collect a large amount of labeled data for machine learning. Although they provide us an easy way to get labels at very low cost in a short period, they have serious limitations. One of them is the variable quality of the crowd-generated data. There have been many attempts to increase the reliability of crowd-generated data and the quality of classifiers obtained from such data. However, in these problem settings, relatively few researchers have tried using expert-generated data to achieve further improvements. In this paper, we apply three models that deal with the problem of learning from crowds to this problem: a latent class model, a personal classifier model, and a data-dependent error model. We evaluate these methods against two baseline methods on a real data set to demonstrate the effectiveness of combining crowd-generated data and expert-generated data.
著者
横井 祥 梶野 洸 鹿島 久嗣
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

生物・化学や社会科学など多くの研究分野において、またSNSなど実用的に大規模データを扱う側面において、インスタンス間の関係予測は重要なタスクとして現れる。本研究では、接続行列の低ランク分解による統一的な関係予測手法を提案する。特にデータが疎な場合に、隣接行列分解やテンソル分解といった既存手法に対して予測性能や計算量の点で優位性があることを示す。