著者
大山 敬三 大須賀 智子
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.59, no.2, pp.105-112, 2016-05-01 (Released:2016-05-01)
参考文献数
2
被引用文献数
1

情報学研究においては大規模データセットが不可欠となってきているが,実際には多くの課題がある。そこで国立情報学研究所では,民間企業などからデータセットを受け入れて研究者に提供する共同利用の取り組みとして情報学研究データリポジトリ(IDR)の活動を行っている。本稿では,最初にその背景にある大学や民間企業の状況を概観し,次に研究コミュニティーにおけるデータセットの位置付けの進展に沿ってその共同利用の意義を明らかにしている。また,IDRがデータセット提供のために民間企業や研究者に向けて行っている活動内容や,提供中のデータセットとそれらの利用状況について紹介し,最後に今後の展望を示している。
著者
大須賀智子 堀内靖雄 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.58, pp.1-6, 2003-05-27
被引用文献数
3

本研究では、音声の韻律情報のみを用いた文の構造の推定手法について検討した。推定に用いる韻律パラメータとして、今回は新たに、先行するアクセント句末1モーラにおける局所的な韻律的特徴を用いて文の木構造の生成を試みた。ATR503文を対象として実験を行った結果、部分木のレベルで約76?%の推定精度を得ることができた。これは従来の、後続音声区間にまたがる、より大局的なパラメータを用いた場合に対し、約4?%の低下にとどまり、ほぼ遜色のない結果が得られた。すなわち、先行する音声区間の局所的な韻律情報のみから、後続の音声区間への係り受け関係がある程度推定可能であることが確かめられた。この結果から、局所的特徴も文構造の理解へ貢献しており、韻律情報が我々人間の実時間および実環境での発話理解を支えるために、頑健な構造となっている可能性が示唆されたといえる。In this study, we introduce a method of estimating the syntactic tree structure of Japanese speech from the F0 contour and time duration. We formed the hypothesis that we can infer a syntactic relation with the following part by listening only to the leading part of speech, and we proposed an estimating method which uses only the local prosodic features of the final part of the leading phrase. We applied the method to the ATR 503 speech database. The experimental results indicated an estimation accuracy of 76\% for the branching judgment for each sequence of three leaves. We consider this result to be fairly good for the difficult task of estimating a syntactic structure that includes a future part by using only local prosodic features in the past, and also consider prosodic information to be very effective in real-time communication with speech.
著者
大須賀 智子 大山 敬三
雑誌
情報処理学会論文誌デジタルプラクティス(DP) (ISSN:24356484)
巻号頁・発行日
vol.2, no.2, pp.47-56, 2021-04-15

データサイエンス研究の進展には,現実性のある十分な規模のデータを多くの研究者が共通に利用できることが不可欠であるが,多くの領域ではそのようなデータの確保に種々の課題がある.国立情報学研究所の情報学研究データリポジトリ(IDR)では,情報学および関連分野に資するため,産学界等と大学等の研究者とを媒介し,データセットの共同利用に取り組んでいる.本稿ではまず,データセット共同利用の意義について述べる.次に,IDRにおけるデータセットの取り扱いに関して,企業等からの受け入れ,研究者への提供,提供後の利用者の管理と利用状況の把握,およびデータDOIの付与について各処理内容を説明する.続いてデータセット提供実績および利用者による研究成果の状況,並びに研究者コミュニティに対する活動支援の取り組みについて示す.筆者らは本活動を通してデータセット共同利用の実現における課題を発掘し理解を深化させ,対応策を案出して実践しており,データセットの受け入れにおける調整事項や利用上の制限事項などはこれらの知見を反映させたものとなっている.