著者
北 研二 川端 豪 斎藤 博昭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.31, no.3, pp.472-480, 1990-03-15
被引用文献数
32

高精度の連続音声認識システムを構築するためには 言語情報の利用が不可欠であり これまでにも 統計的言語モデル 正規文法 文脈自由文法等を用いて音声認識システムの認識率を向上させる方法が提案されている.本論文では これらとは異なる新しい方法HMM-LR法を提案する.HMM-LR法は 拡張LR構文解析法で用いられる構文解析動作表から入力音声データ中の音韻を予測し 予測された音韻の尤度をHMM音韻照合で調べることにより 音声認識と言語処理を同時進行させる.この方式では 音声認識と言語処理の間に音韻ラティス等の中間的なデータを介する必要がなく 高精度のかつ効率的な認識処理系を構成することができる.また HMM-LR法に基づく日本語の文節認識システムを作成し 評価を行った.評価には 日本語の一般的な文節構造を扱うことのできる一般的文法(語彙数約1 000語)と認識対象となるタスクに現れる現象のみを扱うタスク向き文法(語彙数約270語)の2種類の文法を用いた.一般的文法に対する第1位での正答率は72.0% 第5位までで95.3%の正答率を達成した.タスク向き文法に対しては それぞれ79.9% 98.6%の正答率を達成した.
著者
獅々堀 正幹 小泉 大地 柘植 覚 北 研二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.2, pp.154-163, 2004-02-01
被引用文献数
7

検索キーに適した両像をWWW(World Wide Web)から検索するWWW両像検索システムの一つとして,フィードバック情報を格納した両度知識データベースを用いた検索システムを提案する.本システムは既存システムの結果をフィルタリングすることで適切な面謝を優先的に提示するエンドユーザ向けのシステムである.検索キーが画像知識データベースに未登録の場合,既存システムの結果からユーザが選択した正解両度の画像的特微量をフィードバック情報としてデータペー-スに登録する,登録の際,特徴量の類似性を考慮し,代表的な特微量のみを晋録することでデータベースの冗長性を防ぎ,検索キーの類義語も登録することで登録キーワードの帽を広げている.次回の検索の際,このデータベースが検索キーに対する教師データとなるので,教師データにより類似している両度を優先的に提示することができる.従来システムとしてGoogle ImageSearchを用い,130個の検索キーに対する評価実験を行った結果,106個のキーに対して精度が向上し,全体でも11.6%の精度向上が確認できた.また,5〜15枚程度の画像をフィードバックすることで十分な検索精度の向上が得られた.
著者
小田 裕樹 森 信介 北 研二
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.6, no.7, pp.93-108, 1999-10-10 (Released:2011-03-01)
参考文献数
11
被引用文献数
1 2

日本語処理において, 単語の同定, すなわち文の単語分割は, 最も基本的かつ重要な処理である. 本論文では, 日本語文字のクラス分類により得られた文字クラスモデルを用いる新しい単語分割手法を提案する. 文字クラスモデルでは, 推定すべきパラメータ数が文字モデルより少ないという大きな利点があり, 文字モデルより頑健な推定を可能とする. したがって, 文字クラスモデルを単語分割へ適用した場合, 文字モデルよりもさらに頑健な未知語モデルとして機能することが期待できる. 文字クラスタリングの基準はモデルの推定に用いるコーパスとは別に用意したコーパスのエントロピーであり, 探索方法は貧欲アルゴリズムに基づいている. このため, 局所的にではあるが最適な文字のクラス分類がクラスの数をあらかじめ決めることなく得られる. ATR対話データベースを用いて評価実験を行った結果, 文字クラスモデルを用いた提案手法の単語分割精度は文字モデルによる精度より高く, 特に, 文字クラスを予測単位とする可変長n-gramクラスモデルではオープンテストにおいて再現率96.38%, 適合率96.23%の高精度を達成した.
著者
北 研二
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.4, no.3, pp.71-82, 1997-07-10 (Released:2011-03-01)
参考文献数
12

本論文では, 言語のクラスタリングに関する新しい手法を提案する.提案する手法では, まず各言語の言語データから確率的言語モデルを構築し, 次に確率的言語モデルの間に導入した距離に基づき, 元の言語に対するクラスタリングを実行する.本論文では, 以上の手法をN-gramモデルの場合について詳しく述べている.また, 提案した手法を用いて, ECI多言語コーパス (European Corpus Initiative Multilingual Corpus) 中の19ヶ国語のテキスト・データから, 言語の系統樹を再構築する実験を行った.本実験で得られた結果は, 言語学で確立された言語系統樹と非常に似ており, 提案した手法の有効性を示すことができた.
著者
柘植 覚 獅々堀正幹 北 研二
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.20, pp.1-6, 2001-03-05
被引用文献数
4

ベクトル空間モデル(Vector Space Model; VSM)は情報検索における代表的な検索モデルであり,検索対象文書および検索質問を多次元ベクトルで表現するという特徴を持っている.しかし,これらのベクトルは一般にスパースかつ高次元であるため,計算機のメモリによる制限や検索時間の増大などの問題が生じる.また,次元が増加するに連れ,文書中に含まれる不必要な単語がノイズ的な影響を及ぼし検索精度を低下させてしまうという現象も起こってくる.本稿では,Non-negative Matrix Factorization(NMF)を用いたベクトル空間モデルの次元圧縮手法を提案する.NMFは非負行列を2つの非負行列の積に分解する手法であり,分解された非負の2行列は基底行列とその基底のもとでの座標値から成る行列とみなすことができる.基底行列のランクを元の行列のランクより小さくすることにより,次元圧縮が可能となる.NMFは,主成分分析や特異値分解などと異なり,非負制約条件で行列分解を行うため,元の行列を減算を伴わない加算のみの線形結合で表現することができる.これは部分から全体を構成するという我々の直観を反映している.また,NMFは単純な繰り返し演算のみで実行可能であるため,大規模な行列に対して,計算コストや記憶容量の点で他の次元削減手法よりも優れている.MEDLINEコレクションを用いた検索実験を行い,NMFは通常のベクトル空間モデルよりも高い検索性能を示すことができた.The Vector Space Model(VSM) is a conventional information retrieval model, which represents a document collection by a term-by-document matrix. Since term-by-document matrices are usually high-dimensional and sparse, they are susceptible to noise and are also difficult to capture the underlying semantic structure. Additionally, the storage and processing of such matrices places great demands on computing resources. Dimensionality reduction is a way to overcome these problems. Principal Component Analysis(PCA) and Singular Value Decomposition(SVD) are popular techniques for dimensionality reduction based on matrix decomposition, but they contain both positive and negative values in the decomposed matrices. In the work described here, we use non-negative matrix factorization(NMF) for dimensionality reduction of the vector space model. Since decomposed matrices by NMF only contain non-negative values, the original data is represented by only additive, not subtractive, combinations of the basis vectors. This characteristic of parts-based representation is appealing because it reflects the intuitive notion of combining parts to form a whole. Also NMF computation is based on the simple iterative algorithm, it is therefore advantageous for applications involving large matrices. Using MEDLINE collection, we experimentally showed that NMF offers great improvement over the vector space model.
著者
獅々堀正幹 大西 泰代 柘植 覚 北 研二
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.1, pp.300-311, 2007-01-15
被引用文献数
1

近年,楽曲配信サービスの普及により,容易に音楽データをダウンロードして試聴できるようになった.しかし,サーバ側で蓄積している音楽データが膨大になるにつれ,音楽データに対する効率的な検索手法が必要になっている.特にハミングを入力とする検索手法が近年活発に研究されており,音楽特徴量間の類似度計算にDP マッチングやユークリッド距離を用いる手法が主流であった.本論文では,距離尺度としてEarth Mover's Distance(EMD)を用いたハミング検索手法を提案する.EMD は輸送問題における輸送コストの最適解であり,本手法では輸送問題における各供給地が有する資源量を各音符の音長,輸送コストを各音符の出現時間と音高情報から算出することで,リズムと音程との類似度を同じ距離尺度で計り,全体の曲調が類似した曲を検索する.さらに,EMD の計算量が音符数に対して指数関数的に増加することに着目し,検索精度を維持しつつ計算コストを低減可能な音楽特徴量を提案する.約500 曲の音楽データベースに対してハミングデータ40 曲を入力とした評価実験を行った結果,ユークリッド距離を用いる手法より検索結果上位10 位以内に正解データが出現する割合が約30%向上した.また,DP マッチングを用いる手法と比べて,極端に音高の外れた音符を含むハミングデータに対する柔軟性を確認した. 付録:<a href="http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28"target="_brank">http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28</a>Music retrieval systems are extremely useful for collecting digital music data from on-line music distribution sites. Especially, there is a great need to develop effective techniques for content-based music retrieval systems, which can retrieve by humming query. The main issues in this research is how to decide the similarity of each music features extracted from music data. In order to calculate the similarity, some conventional methods use Euclid distance or DP matching, but it is very hard to solve the problem of the vagueness of humming query. In this paper, we propose a new similar music retrieval method based on humming query using the Earth Mover's Distance as the distance measure. Computing the EMD is based on a solution to the transportation problem, and the EMD is applied as the distance measure on similar image retrieval systems. In addition, we focus that the time complexity of the EMD is exponential worst case toward the number of notes, the improved method to decrease the number of notes in the music feature is also proposed. Experimental results show that the proposed method can improve the retrieval precision of conventional systems.appendices:<a href="http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28"target="_brank">http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28</a>
著者
好田 勲 柘植 覚 獅々堀正幹 北 研二
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.23, pp.17-22, 2003-03-06
被引用文献数
4

ベクトル空間モデル(Vector Space Model;VSM)は情報検索における代表的な検索モデルであり,検索対象文書および検索質問を多次元ベクトルで表現するう特徴を持っている.しかし,これらのベクトルは一般にスパースかつ高次元であるため,計算機のメモリによる制限や検索時間の増大などの問題が生じる.また,次元が増加するに連れ,文書中に含まれる不必要な索引語がノイズ的な影響を及ぼし検索精度を低下させてしまうという現象も起こってくる.以前,我々はこの問題を解決するため,Non-negative Matrix Factorization(NMF)を用いたVSMの次元圧縮手法を提案した.しかし,メモリの問題がまだ存在する.そこで,本稿では,k-means NMF を用いたVSMの次元圧縮手法を提案する.また,スパースな行列に対し有効な検索手法である検索質問拡張にNMFを用いる手法を提案する.MEDLINEコレクションを用いた検索実験を行った結果,NMFを用いた場合とk-means NMFを用いた場合では,検索精度を劣化することなく計算に必要なメモリを約$1/10$に軽減することができた.また,NMFを用いた検索質問拡張もVSMよりも高い検索精度を示すことができた.The Vector Space Model (VSM) is a conventional information retrieval model, which represents a document collection by a term-by-document matrix. Since term-by-document matrices are usually high-dimensional and sparse, they are susceptible to noise and are also difficult to capture the underlying semantic structure.Additionally, the storage and processing of such matrices places greatdemands on computing resources. Dimensionality reduction is a way toovercome these problems. We proposed non-negative matrix factorization(NMF) for dimensionality reduction of the vector space model.However,this method did not overcome memory problems. Hence, we proposek-means NMF for dimensionality reduction of the vector space model. And,we propose query expansion using NMF in this paper.Using MEDLINE collection, we experimentally showed that k-means NMF offers great improvement over the vector space model.
著者
鳥井 浩平 誉田 栄一 北 研二
出版者
特定非営利活動法人 日本歯科放射線学会
雑誌
歯科放射線 (ISSN:03899705)
巻号頁・発行日
vol.62, no.1, pp.24-34, 2022 (Released:2022-10-04)
参考文献数
24

Research and development of AI-based diagnostic systems in the medical and dental fields is flourishing worldwide. However, there are few practical dental support systems and dental databases. Support for medical record input is needed to reduce the burden at diagnosis. We have been developing a dental database with detailed annotation information and building an AI system for automatic teeth detection, teeth numbering, teeth contour estimation, and disease diagnosis from panoramic X-ray images since 2019. Three dentists and one expert of dental radiology created our database, which includes teeth number based on FDI method, coordinates of teeth contour, and various dental conditions, using Anotee, a software developed for creating dental databases. Our system consists of multiple deep neural networks that were trained using 1,781 panoramic X-ray images and annotations, which excluded deciduous teeth and rare dental conditions. The deep neural network to classify dental conditions is based on EfficientNetV2-S and can diagnose multiple dental conditions. To verify our system’s usefulness, we evaluated two dental condition classifications for 20 dental conditions and 10 dental conditions such as caries, periodontitis, root canal filling, inlay, composite resin, crown, pontic, implant, and impacted tooth. We performed 5-fold cross validation and calculated precision, sensitivity, and specificity. Experimental results were encouraging. For the diagnosis of 20 conditions, precision was 90.4%, sensitivity was 86.1%, and specificity was 99.4%; for the diagnosis of 10 conditions, precision was 92.9%, sensitivity was 90.0%, and specificity was 99.1%. The system achieved high accuracy, suggesting that AI systems are useful in assisting medical record input support.
著者
松本 流星 吉田 稔 松本 和幸 北 研二
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2017, no.AM-15, pp.08, 2017-03-03 (Released:2021-08-28)

本研究の目的は,Twitterから感染症に関する発言を抽出し,感染症マップを作成することである.その手法として,抽出した発言に対して事実性解析を行い,その結果から感染者の過去のツイート抽出をし,その人物の住んでいる場所を推定する.既存研究と比べより多くの感染症に対応することができ,さらに位置推定に対しても事実性解析を行うことで,より正確な位置推定を実現する.
著者
北 研二 獅々堀正幹 大恵俊一郎
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2003, no.98(2003-NL-157), pp.9-16, 2003-09-29

高次元空間における最近傍検索(nearest neighbor search)は、マルチメディア・コンテンツ検索、データ・マイニング、パターン認識等の分野における重要な研究課題の1つである。高次元空間では、ある点の最近点と最遠点との間に距離的な差が生じなくなるという現象が起こるため、効率的な多次元検索手法を設計することが極度に困難となる。本稿では、線形探索アルゴリズムにおける距離計算中の不要な演算を削減することにより、きわめて高速な最近傍検索アルゴリズムを提案する。さらに、不必要な演算を早期検出するために、要素の分散値を用いた次元ソート法、並びに主成分分析に基づくデータ変換法を提案する。実験によると、従来の SR-tree や VP-tree 等よりも 20倍?50倍高速であり、高次元の場合にも性能の劣化はほとんどない。
著者
三宅 剛史 松本 和幸 吉田 稔 北 研二
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料
巻号頁・発行日
vol.2017, no.15, 2017

<p>近年,ソーシャルメディア上での炎上と呼ばれる現象が問題となっている.発生を未然に防ぐことが望ましいため,投稿内容に炎上の原因になる表現が含まれているかを確認し,訂正を促すシステムは有用と考えられる.本研究では悪口表現や差別表現といった侮蔑表現と,口論になりがちな表現の2つの有害表現を対象とする.提案手法は,メディアを基に作成した有害表現辞書を用いてSVMにより分類器を構築し,炎上の可能性がある文の判定を行う.</p>
著者
中川 祥平 鈴木 基之 松本 和幸 北 研二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (ISSN:18804535)
巻号頁・発行日
vol.97, no.3, pp.533-539, 2014-03

本論文では,音声からの感情推定において特徴量を正規化して識別を行う方法を提案する.従来感情識別に用いられている平均パワーやピッチといった韻律的特徴量は,感情による変化だけではなく発話内容そのものによって大きく変化する.そのため,たとえ同じ感情で発話されたとしても発話内容が異なれば異なる韻律となり,感情推定の性能低下を招き得る.そこで本論文では,平静の感情で同じ発話内容を発話した音声からも特徴量を抽出し,それとの差分に注目することで感情による特徴量の変化のみを抽出する方法を提案する.使用している5種類の特徴量(平均パワー,ピッチ等)ごとに減算による正規化,除算による正規化,正規化なし,の三つの方法で正規化し,全ての組み合わせの中で最も性能が向上する組み合わせを探索した.その結果,最適な組み合わせによる識別性能は,正規化を行わない従来法と比較して5.98%向上した.正規化法に関する分析を行ったところ,平均パワーは正規化が必要(演算は減算でも除算でも大きな差はない)であり,一方ピッチとMFCCは正規化なし,残りの二つの特徴量についてはどちらでも性能は大きくは変化しないことがわかった.
著者
北 研二
出版者
科学基礎論学会
雑誌
科学基礎論研究 (ISSN:00227668)
巻号頁・発行日
vol.16, no.1-2, pp.69-75, 1982-12-25 (Released:2009-07-23)
参考文献数
7
著者
西川 伸紀 獅々堀正幹 柘植 覚 北 研二
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.20, pp.28-38, 2007-12-15
参考文献数
15

本研究では映像内の文字情報である字幕に着目した字幕検索システムを開発する.従来,字幕検索は映像内に出現する字幕に対して文字認識を行う手法が主流であった.しかし,この手法では,事前に文字認識を行うための時間コストが必要であり,また,完全な文字認識結果が得られない場合には検索精度が低下するという問題があった.本論文では,上記の問題点を解決した高精度かつ高速な字幕検索手法を提案する.字幕検索を実現するためには,映像中に出現するすべての字幕を正確に認識する必要はなく,検索キーに対する字幕だけを認識できれば適切な検索結果を得ることができる.そこで本手法では,各字幕の文字画像特徴量と検索キーに対応する文字画像特徴量との距離に基づいて該当の字幕が出現するフレームを検索する.また,各字幕の文字画像特徴量を多次元索引化することで,検索キーの文字画像特徴量との距離計算を高速化する.さらに,本手法では検索過程で特徴量照合を行うため,前処理で文字認識処理が必要でなく,時間コストを軽減することができる.実際に3時間分の映像データに対して映像中の出現頻度が比較的多い91単語を用いて検索実験を行った結果,1-gram特徴量を用いた場合には最大98.61%,2-gram特徴量を用いた場合には最大99.59%の平均適合率を得ることができた.検索時間に関しても,2-gram特徴量を用いた場合でも約0.5秒で検索結果を得ることができた.Video telop retrieval methods based on telop characters can retrieve the corresponding telops to the query from the huge video data. The conventional methods make the text data from the image data of telop characters by recognizing all telop characters in the video data, and then the full text search is operated toward the recognized text data. The conventional methods can not retrieve with high precision, because all telop characters can not recognize as their right characters perfectly. In this paper, a new video telop retrieval method based on telop characters is proposed. In order to specify the suitable telop, this method recognizes the only corresponding telop characters to the query keyword not all characters. This method calculates the distance between each image features of telop characters and template image features of query keyword. The number of distance calculations can decrease by indexing the multidimensional data for image features of telop characters. Experimental results, using 91 query keywords, show that the average precision of proposed method using 1-gram feature becomes 98.61%, and using 2-gram feature becomes 99.59%. Moreover, the retrieval time can be obtained in about 0.5 seconds when using 2-gram feature.
著者
北 研二 小倉 健太郎 森元 逞 矢野 米雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.9, pp.1937-1943, 1993-09-15
被引用文献数
30

自然言語処理では、形態素レベルにおける曖昧性や統語的な曖昧性などさまざまな曖昧性に対処する必要がある。このような曖昧性を軽減するための実際的な方法の一つに、慣用表現や定型表現等の複合的な表現を一つのまとまりとして処理することがあげられる。近年、世界各地で大規模コーパスの構築が行われており、大量な言語データが容易に手に入るようになってきている。本論文では、頻繁に使用される定型的な表現をコーパスから自動的に抽出する基準として「仕事量」という概念を導入する。仕事量は、いくつかの単語を一まとまりの単位と考えることにより、各単語を別個に処理するよりも、どれだけの処理が削減できるかということを定量的に測る尺度である。また、仕事量基準を用いた定型表現の自動抽出方法について述ぺ、提案した方法を実際の日本語のコーパスに適用することにより、その有効性を示す。また、コーパスから抽出された定型表現を形態素解析に組み入れることにより、単語区切りや単語誤りをはじめとする形態素レベルの誤りを削減できることを示す。
著者
北 研二 肖 清梅
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.4, pp.1-6, 2011-05-06

楽曲検索では,ノイズ等による楽曲の劣化や,検索質問曲の演奏開始位置が不明であることから,一般に膨大な検索空間を探索する必要がある.多くの楽曲検索システムでは,楽曲の音響的・知覚的な特性に基づくオーディオ指紋 (audio fingerprint) を特徴量として用いているが,本稿では,オーディオ指紋に適した高速検索手法を提案する.また,8,740 曲の楽曲データベースを用いた評価実験を行い,提案手法の有効性を示す.In music information retrieval, a huge search space has to be explored because a query audio clip can start at any position of any music in the database, and also a query is often corrupted by highly significant noise and distortion. Audio fingerprints have attracted much attention recently in music information retrieval, because they provide compact representation of the perceptually relevant parts of audio signals. In this paper, we propose an extremingly fast method for exploring a huge hamming space that is suitable for audio fingerprinting systems. The effectiveness of the proposed method has been confirmed by evaluation experiments using a database of 8,740 songs.