著者
久保田 康裕 楠本 聞太郎 塩野 貴之 五十里 翔吾 深谷 肇一 高科 直 吉川 友也 重藤 優太郎 新保 仁 竹内 彰一 三枝 祐輔 小森 理
出版者
日本計量生物学会
雑誌
計量生物学 (ISSN:09184430)
巻号頁・発行日
vol.43, no.2, pp.145-188, 2023 (Released:2023-06-28)
参考文献数
110

Biodiversity big data plays an essential role in better understanding of biodiversity pattern in space and time and its underpinning macroecological mechanisms. Biodiversity as a concept is inductively quantified by the measurable multivariate data relative to taxonomic, functional and phylogenetic/genetic aspects. Therefore, conservation is also argued by using particular biodiversity metrics, context dependently, e.g., spatial conservation prioritization, design of protected areas network.Individual descriptive information accumulated in biogeography, ecology, physiology, molecular biology, taxonomy, and paleontology are aggregated through the spatial coordinates of biological distributions. Such biodiversity big data enables to visualize geography of 1) the richness of nature, 2) the value of nature, and 3) the uncertainty of nature, based on statistical models including maximum likelihood, machine learning, deep learning techniques. This special issue focuses on statistical and mathematical methods in terms of the quantitative visualization of biodiversity concepts. We hope that this special issue serves as an opportunity to involve researchers from different fields interested in biodiversity information and to develop into new research projects related to Nature Positive by 2030 that aims at halting and reversing the loss of biodiversity and ecosystem service.
著者
椿 真史 新保 仁 松本 裕治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.O-FA2_1-10, 2016-03-01 (Released:2016-06-09)
参考文献数
40

The notion of semantic similarity between text data (e.g., words, phrases, sentences, and documents) plays an important role in natural language processing (NLP) applications such as information retrieval, classification, and extraction. Recently, word vector spaces using distributional and distributed models have become popular. Although word vectors provide good similarity measures between words, phrasal and sentential similarities derived from composition of individual words remain as a difficult problem. To solve the problem, we focus on representing and learning the semantic similarity of sentences in a space that has a higher representational power than the underlying word vector space. In this paper, we propose a new method of non-linear similarity learning for compositionality. With this method, word representations are learnedthrough the similarity learning of sentences in a high-dimensional space with implicit kernel functions, and we can obtain new word epresentations inexpensively without explicit computation of sentence vectors in the high-dimensional space. In addition, note that our approach differs from that of deep learning such as recursive neural networks (RNNs) and long short-term memory (LSTM). Our aim is to design a word representation learning which combines the embedding sentence structures in a low-dimensional space (i.e., neural networks) with non-linear similarity learning for the sentence semantics in a high-dimensional space (i.e., kernel methods). On the task of predicting the semantic similarity of two sentences (SemEval 2014, task 1), our method outperforms linear baselines, feature engineering approaches, RNNs, and achieve competitive results with various LSTM models.
著者
東 藍 新保仁 松本 裕治 Azuma Ai Shimbo Masashi Matsumoto Yuji
雑誌
データマイニングと統計数理研究会(第 12 回)

When we apply machine learning or data mining technique to sequential data, it is often required to take a summation over all the possible sequences. We cannot calculate such a summation directly from its definition in practice. Although the ordinary forward-backward algorithm provides an efficient way to do it, it is applicable to quite limited types of summations. In this paper, we propose general algebraic frameworks for generalization of the forward-backward algorithm. We show some examples falling within this framework and their importance.
著者
濱口 拓男 大岩 秀和 新保 仁 松本 裕治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.33, no.2, pp.F-H72_1-10, 2018-03-01 (Released:2018-04-03)
参考文献数
31
被引用文献数
5

Knowledge base completion (KBC) aims to predict missing information in a knowledge base. In this paper, we address the out-of-knowledge-base (OOKB) entity problem in KBC: how to answer queries concerning test entities not observed at training time. Existing embedding-based KBC models assume that all test entities are available at training time, making it unclear how to obtain embeddings for new entities without costly retraining. To solve the OOKB entity problem without retraining, we use graph neural networks (GNNs) to compute the embeddings of OOKB entities, exploiting the limited auxiliary knowledge provided at test time. The experimental results show the effectiveness of our proposed model in the OOKB setting. Additionally, in the standard KBC setting in which OOKB entities are not involved, our model achieves state-of-the-art performance on the WordNet dataset.
著者
原 一夫 鈴木 郁美 新保 仁 松本 裕治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.28, no.4, pp.379-390, 2013 (Released:2013-05-23)
参考文献数
27

We propose a new measure of semantic similarity between words in context, which exploits the syntactic/semantic structure of the context surrounding each target word. For a given pair of target words and their sentential contexts, labeled directed graphs are made from the output of a semantic parser on these sentences. Nodes in these graphs represent words in the sentences, and labeled edges represent syntactic/semantic relations between them. The similarity between the target words is then computed as the sum of the similarity of walks starting from the target words (nodes) in the two graphs. The proposed measure is tested on word sense disambiguation and paraphrase ranking tasks, and the results are promising: The proposed measure outperforms existing methods which completely ignore or do not fully exploit syntactic/semantic structural co-occurrences between a target word and its neighbors.
著者
新保 仁男 荒岡 史人 後藤 正直 高西 陽一 石川 謙 竹添 秀男 ゴレツカ エヴァ ポチーハ ダミアン ミエツコウスキー ヨゼフ
出版者
THE JAPANESE LIQUID CRYSTAL SOCIETY
雑誌
日本液晶学会討論会講演予稿集
巻号頁・発行日
vol.2007, pp.190, 2007

ウレア液晶の極性カラムナー相(ColhPA相)において、極性構造を高速に緩和するモードが報告されている。我々は、ポリカテナーベントコア液晶の極性カラムナー相においても同種の高速緩和が存在することを確認し、光第二次高調波発生(SHG)によりダイナミクスの詳細な解析を行った。その結果、本モードの緩和速度は7マイクロ秒より高速であることがわかった。
著者
吉本 暁文 新保 仁 原 一夫 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.5, pp.1-6, 2015-05-18

一般的に依存構造解析のアルゴリズムでは,句構造を扱わないために並列構造を考慮することが難しい.そこで,依存構造解析のための Eisner アルゴリズムを,並列構造解析ができるように拡張した.その規則の導出木は,既存の依存構造のアノテーションから導出することができる.
著者
小嵜 耕平 新保 仁 小町 守 松本 裕治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.28, no.4, pp.400-408, 2013 (Released:2013-06-20)
参考文献数
30

Graph construction is an important step in graph-based semi-supervised classification. While the k-nearest neighbor graphs have been the de facto standard method of graph construction, this paper advocates using the less well-known mutual k-nearest neighbor graphs for high-dimensional natural language data. To evaluate the quality of the graphs apart from classification algortihms, we measure the assortativity of graphs. In addition, to compare the performance of these two graph construction methods, we run semi-supervised classification methods on both graphs in word sense disambiguation and document classification tasks. The experimental results show that the mutual k-nearest neighbor graphs, if combined with maximum spanning trees, consistently outperform the k-nearest neighbor graphs. We attribute better performance of the mutual k-nearest neighbor graph to its being more resistive to making hub vertices. The mutual k-nearest neighbor graphs also perform equally well or even better in comparison to the state-of-the-art b-matching graph construction, despite their lower computational complexity.
著者
壇辻 正剛 新保 仁 堂下 修司 梅崎 太造 大西 雅行 土岐 哲
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
1996

日本語音声に対するIPA(the International Phonetic Alphabet,国際音声記号、国際音声表記、国際音声字母、国際音標文字)表記の基準作成を求めて、人文系と工学系の研究者が協力して研究を推進した。音声学的側面、音韻論的側面などの言語学的側面および日本語教育などの語学教育的側面、音声の音響分析、音声認識、音声合成などの音響工学、音声情報処理的側面など様々な方面からの研究を統合することによって、日本語音声の記述にIPAという一種のグローバルスタンダードを導入する基盤を確立した。分析対象の音声資料の収集に関しては、既存の音声データベースを活用するだけでなく、独自に音声データの録音、収集、編集を行なった。アンケート調査の結果、相違の著しかった音声を中心に、精緻な音響分析を施し研究の進展を図った。また、比較検討のため他の諸言語の音響分析も行った。主観的な判断に傾きがちであった聴覚印象に頼る音声転写に音響分析を積極的に活用して客観的な基準の作成に努め、定量的な比較や定性的な比較が可能になる新たな音響素性の導入を提案した。また、日本語教育や障害者教育など教育の現場にどのようにIPA表記の問題を活用していくのかを各側面より検討した。その成果の一部をコンピュータ支援型日本語教育システムの開発に導入することが可能になった。IPAのコンピュータ処理に関して、従来のIPAの数値コードの問題点を指摘すると共に、改善案としてより合理的な新たな数値コード化の導入を提案した。さらに、音声合成や音声認識など音声情報処理の分野にIPA表記の問題を導入し、日本語の合成音の記述、表記に関して基準を提供した。音声認識に関しては、特定言語にとらわれない記号系の利用としてIPAを利用する研究を進めるなど、各分野の研究の進展とIPAの応用に新しい側面から視点を与える研究を推進した。
著者
鈴木 郁美 原 一夫 新保 仁 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.2, pp.65-70, 2009-01-15

コーパスから抽出した文脈情報により作成する専門用語グラフに対し,グラフを辿ることで節点間の類似度を計算する手法を適用し,類義語獲得に応用した.雑誌 「蛋白質・核酸・酵素」 をコーパスとして用いた実験で,コーパスでの出現頻度が少ない専門用語をクエリとして与えた場合,ラプラシアン拡散カーネル行列を用いた手法が比較的高い精度を示した.この結果は,専門性の高いレアな用語を既存のシソーラスに登録する場面において,ラプラシアン行列ベースの手法の有効性を示唆するものである.We apply graph-based methods to problems of biomedical synonym acquisition. Given a graph of biomedical terms constructed from a corpus, the methods calculate term similarities by traversing the graph to capture shared features between nodes. An experimental study shows that, for query terms appearing less than three times in the corpus, the Laplacian diffusion kernel gives better accuracy than the methods based on the adjacency matrix.
著者
伊藤敬彦 堀部 史郎 新保仁 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.51, pp.181-188, 2003-05-22
被引用文献数
2

ある文献が他のどの文献を参照しているか、という文献の参照情報は、その文献の参考文献一覧の各一文(参考文献文)が指し示している文献を、文献データベース(著者、題目、掲載誌等からなる文献を表す文献データ集合)中から同定することで獲得できる。この同定を、参考文献文と文献データの単なる文字列の完全一致判定で行なうことはできない。参考文献文に表記の多様性や誤りが存在するためである。本稿では参照情報の自動獲得手法を提案する。始めに、単一のベクトル空間とその上での類似度を用いて粗く候補を絞る。次に、参考文献と文候補が同一の文献であるかを多数の尺度に基づく類似度を特徴量として判定する。複数の尺度それぞれの重みを人手でつけることは現実的ではないため本稿ではサポートベクターマシーンを用い、各尺度の最適な重みを自動で算出した結果、F値0.992が得られた。Citation indices are invaluable for the retrieval of related papers. With the increase in the volume of scientific literature, a demand is growing for methods to automatically construct such indices. However, a naive method such as using exact string matches makes errors because of the various ways references can be formatted. In this paper, we propose a new citation indexing method that uses many features to evaluate similarity between references and bibligoraphic data. Unlike the previous work which typically uses only a few features to compute similarity, our method computes a weighted sum of more than 1200 feature values, each of which reflects one of the diverse similarity measures. An F-measure of 0.992 was obtained when Support Vector Machines were used to compute optimal weights to each feature.
著者
小町 守 工藤 拓 新保 仁 松本 裕治
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.2, pp.233-242, 2010 (Released:2010-01-26)
参考文献数
27
被引用文献数
5 6

Bootstrapping has a tendency, called semantic drift, to select instances unrelated to the seed instances as the iteration proceeds. We demonstrate the semantic drift of Espresso-style bootstrapping has the same root as the topic drift of Kleinberg's HITS, using a simplified graph-based reformulation of bootstrapping. We confirm that two graph-based algorithms, the von Neumann kernels and the regularized Laplacian, can reduce the effect of semantic drift in the task of word sense disambiguation (WSD) on Senseval-3 English Lexical Sample Task. Proposed algorithms achieve superior performance to Espresso and previous graph-based WSD methods, even though the proposed algorithms have less parameters and are easy to calibrate.
著者
坂田 浩亮 新保仁 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.94, pp.113-119, 2007-09-26
被引用文献数
1

言語教育において,学習者の言語習得度を知ることは教師にとって重要なことであるまた,言語学習者の言語習得度を客観的に量る手段があれば 学習者は教師がいなくても自分の言語習得度を評価できるため,学習効率の向上につながると考えられる.本発表では 言語学習者の作文と習得度別コーパスとの類似度に基づいて 学習者の言語習得度を推定する手法を提案する.NICT JLEコーパスを用いて行った提案手法の評価実験と,その結果について紹介する.We propose methods for automatically evaluating second language learners' proficiency levels. These methods not only help teachers evaluate students' proficiency levels, but also accelerate students' learning, since they can evaluate their proficiency levels whenever they like without consulting their teachers. The proposed methods compute students' proficiency levels on the basis of the similarity between their free compositions and the corpus of compositions divided into skill levels.