著者
川村 隆浩 桂樹 哲雄 稲冨 素子 鐘ヶ江 弘美 江口 尚
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.2O4GS1304, 2020 (Released:2020-06-19)

昨今,研究データの有効活用による研究の加速化や新たな知の創造が強く求められている.そのため,各国研,大学では研究データ基盤の整備が進められており,我々,農研機構では農研機構統合DB(以下,統合DB)を構築し,2020年4月より運用を開始した.統合DBでは,農業に関する様々な研究データ(ゲノムや品種,病害虫や環境に関する情報)にFAIR原則に基づく共通メタデータを付けてカタログ化する.一方,自然科学特有の複雑に絡み合ったデータ間の関係をRDF(Resource Description Framework)やProperty Graph,またはRDB形式で記述し,統計分析や機械学習の適用を容易にする仕組みを提供している.特に,農業や環境など研究期間が長期に渡る研究データをより早いサイクルで分野横断的研究に繋げるべく,日常的に利用するファイルサーバーと研究データレポジトリを一体的に運用できる点を特徴としている.本稿では,研究データレポジトリの動向を概観した後,統合DBのシステム構成,農研機構共通メタデータを紹介し,今後の展望を示す.
著者
三中 信宏 岩田 洋佳 伊達 康博 曹 巍 Harshana Habaragamuwa 桂樹 哲雄 小林 暁雄 山中 武彦 櫻井 玄
出版者
日本計量生物学会
雑誌
計量生物学 (ISSN:09184430)
巻号頁・発行日
vol.44, no.1, pp.55-82, 2023-10-31 (Released:2023-12-06)
参考文献数
100

This review provides a comprehensive introduction to recent developments in agricultural statistics. Agricultural statistics, which began with Fisher’s design of experiments, has developed in various directions as the nature of the data it handles has changed. The ability to rapidly measure omics data, including DNA sequences, has led to methods such as genomic selection. It has become possible to comprehensively measure even the metabolites of living organisms, giving birth to a new field called metabolomics. The development of machine learning, including deep learning, has enabled the use of image data, which has been difficult to connect with agriculture and is creating new areas such as disease diagnosis of crops. In this review, we first refer to the statistics of Fisher’s era, recall the philosophy of science in statistics, and look at the prospects of modern agricultural statistics by taking a broad overview of new fields.
著者
小林 暁雄 坂井 寛章 桂樹 哲雄 伊藤 研悟 稲冨 素子 江口 尚 川村 隆浩
出版者
国立研究開発法人 農業・食品産業技術総合研究機構
雑誌
農研機構研究報告 (ISSN:24349895)
巻号頁・発行日
vol.2023, no.13, pp.23-33, 2023-03-31 (Released:2023-03-31)
参考文献数
15

農研機構内のプロジェクトや研究部門・センター毎に進められているバイオ研究課題では,データ管理や解析ツール開発が一元化しておらず,データの分散や個別化が問題となっている.これを解決するため,研究課題のニーズに基づきリソースを集約・重点化することにより資源の活用を効率化し,研究成果の最大化に繋げるためのプロジェクトが機構内組織横断的に進められている.本プロジェクトでは,機構の持つ高度計算資源を連携してオミクス情報を収集・解析し,研究データの来歴保証と研究の効率化を実現する解析パイプラインシステムの構築が取り組まれている.この計算資源には,機構内のゲノム解析サーバ及びスーパーコンピュータ「紫峰」を用いるとともに,ゲノムデータと解析されたデータを保存・機構内横断で提供する基盤として,農研機構統合DB を用いる.さらに,DDBJ Sequence Read Archive に準ずるメタデータを採用し,機構内で横断的にゲノムデータを解析・検索可能な解析パイプラインシステム を実現する. 本稿では,メタデータ入出力システムの詳細について解説するとともに,パイプラインシステムの現状と課題について議論を行う.
著者
桂樹 哲雄 森 翔太郎 十一 浩典 石川(高野) 祐子 小林 暁雄 伊藤 研悟 山本(前田) 万里 川村 隆浩
出版者
国立研究開発法人 農業・食品産業技術総合研究機構
雑誌
農研機構研究報告 (ISSN:24349895)
巻号頁・発行日
vol.2023, no.13, pp.47-61, 2023-03-31 (Released:2023-03-31)
参考文献数
15

農研機構では,2012-2015 年度に実施した機能性農林水産物・食品開発プロジェクトの成果物を元に,農林水産物が持つ機能性成分について文献情報と共に整理し,「機能性成分・評価情報データベース」として2018 年より公開している.一方,2019 年から,農研機構は島津製作所と共同で「食品機能性成分解析共同研究ラボ(NARO 島津ラボ)」を設置し,機能性農林水産物に関する様々な分析を実施してきた.また,農研機構内には戦略的イノベーション創造プログラム第2 期「スマートバイオ産業・農業基盤技術」(SIP2)の分析データも存在する.このたび農研機構では,機構内で得られた食品機能性成分データを一か所に集める狙いから,「機能性成分・評価情報データベース」,「NARO 島津ラボ」のデータ,SIP2 の成果等を集約し,「農研機構食品機能性成分統合データベース」を開発した.収録するデータには,公開情報だけでなく閲覧者を制限すべきクローズドデータが含まれるため,柔軟なユーザ認証機能を導入し,適切なアクセス管理を行えるようにした点に特徴がある.本データベースでは,データの属性に応じて検索結果をグループ化して表示するファセット検索機能やグラフ表示機能などを実装した.
著者
小林 暁雄 桂樹 哲雄 伊藤 研吾 稲冨 素子 山崎 啓太 川村 隆浩
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.3Yin214, 2022 (Released:2022-07-11)

ムーンショット型研究開発「フードロス削減とQoL向上を同時に実現する革新的な食ソリューションの開発」では、美味しく、かつ、一人ひとりの体質や体調改善に効果的な料理を自動的に提供する、AIシェフマシンの実現を目指している。農研機構では、このAIシェフマシンの実現に向けて、栄養・機能性食品データ、調理レシピデータ、プロファイルなどを適切に構造化した知識グラフ(ナレッジグラフ)を構築し、一人ひとりの嗜好、健康状態に合わせたレシピデータを3Dフードプリンタに出力するシステムを構築している。知識グラフの構築にあたっては、食に関する大規模オントロジーであるFoodOnとリンクすることで、コンソーシアムが独自に解析・収集したデータでは網羅しきれない成分や調理手法などについても取り込んでいる。知識グラフに基づく推論技術としては、食に関する知識をビックデータで確率的に取り扱う手法の適用を検討している。本稿では、構築された知識グラフ及び収録されたデータについて解説するとともに、知識グラフに対する推論手法の適用実験について解説する。