著者
川村 隆浩 桂樹 哲雄 稲冨 素子 鐘ヶ江 弘美 江口 尚
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.2O4GS1304, 2020 (Released:2020-06-19)

昨今,研究データの有効活用による研究の加速化や新たな知の創造が強く求められている.そのため,各国研,大学では研究データ基盤の整備が進められており,我々,農研機構では農研機構統合DB(以下,統合DB)を構築し,2020年4月より運用を開始した.統合DBでは,農業に関する様々な研究データ(ゲノムや品種,病害虫や環境に関する情報)にFAIR原則に基づく共通メタデータを付けてカタログ化する.一方,自然科学特有の複雑に絡み合ったデータ間の関係をRDF(Resource Description Framework)やProperty Graph,またはRDB形式で記述し,統計分析や機械学習の適用を容易にする仕組みを提供している.特に,農業や環境など研究期間が長期に渡る研究データをより早いサイクルで分野横断的研究に繋げるべく,日常的に利用するファイルサーバーと研究データレポジトリを一体的に運用できる点を特徴としている.本稿では,研究データレポジトリの動向を概観した後,統合DBのシステム構成,農研機構共通メタデータを紹介し,今後の展望を示す.
著者
小林 暁雄 坂井 寛章 桂樹 哲雄 伊藤 研悟 稲冨 素子 江口 尚 川村 隆浩
出版者
国立研究開発法人 農業・食品産業技術総合研究機構
雑誌
農研機構研究報告 (ISSN:24349895)
巻号頁・発行日
vol.2023, no.13, pp.23-33, 2023-03-31 (Released:2023-03-31)
参考文献数
15

農研機構内のプロジェクトや研究部門・センター毎に進められているバイオ研究課題では,データ管理や解析ツール開発が一元化しておらず,データの分散や個別化が問題となっている.これを解決するため,研究課題のニーズに基づきリソースを集約・重点化することにより資源の活用を効率化し,研究成果の最大化に繋げるためのプロジェクトが機構内組織横断的に進められている.本プロジェクトでは,機構の持つ高度計算資源を連携してオミクス情報を収集・解析し,研究データの来歴保証と研究の効率化を実現する解析パイプラインシステムの構築が取り組まれている.この計算資源には,機構内のゲノム解析サーバ及びスーパーコンピュータ「紫峰」を用いるとともに,ゲノムデータと解析されたデータを保存・機構内横断で提供する基盤として,農研機構統合DB を用いる.さらに,DDBJ Sequence Read Archive に準ずるメタデータを採用し,機構内で横断的にゲノムデータを解析・検索可能な解析パイプラインシステム を実現する. 本稿では,メタデータ入出力システムの詳細について解説するとともに,パイプラインシステムの現状と課題について議論を行う.
著者
小林 暁雄 桂樹 哲雄 伊藤 研吾 稲冨 素子 山崎 啓太 川村 隆浩
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.3Yin214, 2022 (Released:2022-07-11)

ムーンショット型研究開発「フードロス削減とQoL向上を同時に実現する革新的な食ソリューションの開発」では、美味しく、かつ、一人ひとりの体質や体調改善に効果的な料理を自動的に提供する、AIシェフマシンの実現を目指している。農研機構では、このAIシェフマシンの実現に向けて、栄養・機能性食品データ、調理レシピデータ、プロファイルなどを適切に構造化した知識グラフ(ナレッジグラフ)を構築し、一人ひとりの嗜好、健康状態に合わせたレシピデータを3Dフードプリンタに出力するシステムを構築している。知識グラフの構築にあたっては、食に関する大規模オントロジーであるFoodOnとリンクすることで、コンソーシアムが独自に解析・収集したデータでは網羅しきれない成分や調理手法などについても取り込んでいる。知識グラフに基づく推論技術としては、食に関する知識をビックデータで確率的に取り扱う手法の適用を検討している。本稿では、構築された知識グラフ及び収録されたデータについて解説するとともに、知識グラフに対する推論手法の適用実験について解説する。