森 信介 山地 治
情報処理学会論文誌 (ISSN:18827764)
vol.38, no.11, pp.2191-2199, 1997-11-15

本論文では,形態素単位のn?gramモデル(1〓n〓16)による日本語の情報量の上限の推定方法とその結果を示す.各n?gramモデルは,データスパースネスの問題に対応するため,低次のn?gramモデルとの補間を行ってある.補間係数は,最も有効であると考えられている削除補間法により求める.実験ではEDRコーパスの約9割からモデルのパラメータを推定し,残りの1割に対して情報量を計算した.その結果,n=16のときに1文字あたりの情報量は最小の4.30330ビットであった.また,学習コーパスの大きさとモデルの次数による情報量の変化を調べた結果,モデルの次数を上げることによる情報量の減少量は微小であるが,学習コーパスを大きくすることによる情報量の減少量はかなりあるということが分かった.さらに,パラメータ数とエントロピーの関係についても議論する.これは,実際の日本語処理にn?gramモデルを応用する際に,適切にnの値を選ぶ指標となる.In this paper we present an estimate of an upper bound for the entropy of Japanese by morpheme n-gram model(1〓n〓16).Each n-gram model is interpolated with lower order n-gram models.The deleted interpolation method is applied for estimating interpolation coefficients.We estimated the parameters from 90% of the EDR corpus and calculated the entropy on the rest 10%.As the result,the minimum entropy was 4.30330[bit]a character with n=16.The relation between the size of learning corpus or the order of model and entropy showed that incresing the order decreases entropy slightly and increasing the size of learning corpus decreases it noteworthily.In addition,we discuss the relation between the number of parameters and entropy.This is usefull to select the value of n to apply n-gram model to the practical Japanese processing.
小杉 尚子 小島 明 片岡 良治 串間 和彦
情報処理学会論文誌 (ISSN:18827764)
vol.43, no.2, pp.287-298, 2002-02-15

本稿では,我々が研究開発しているハミングを用いた音楽検索システム(ハミング検索システム)について述べるとともに,このシステムを構築するために採用している技術やパラメータの値について,その効果を定量的に評価する.音楽データベースに対して,音情報をキーにした検索は直感的で非常に有効である.しかし人の歌唱は曖昧で,検索キーとして使用するのは難しい.そこで本システムでは類似検索技術を用いて,ハミングに似ている部分を持つ曲を似ている順にリストアップしたものを検索結果とする.目標は,ハミングされたフレーズを含む曲(正解)を,類似度順の曲名リストの1位に出力することである.従来のハミング検索システムに比べて本システムがきわめて優位である点は,データの処理の基本単位を「音符」ではなく「拍」にしていることと,多次元特徴ベクトルを用いたインデクスを検索に使用していることに起因する.これによって,様々なエラーを含むハミングを検索キーにしても,精度の高い高速な類似検索を実現している.実験では1万余曲を登録したデータベースを構築し,検索時間は約1秒というレスポンスを達成した.また人が聞いて分かるレベルのハミングの約70%については5位以内に正解を出力することを確認した.A music retrieval system that accepts hummed tunes as queries isdescribed. Technologies and the values of parameters that are used in the systemare also described and their effectiveness is quantitatively evaluated.Retrieval using sound information as queries for a music database isintuitive and very useful.However, it is difficult to use hummed tunes as queries because theyare often unclear. Thus, the system employs a similarity retrieval technique to overcomethis problem. The retrieval result is a ranked list of songs that has a part whichis similar to the hummed tune according to the closeness of the match. Our goal for the system is to retrieve the correct song at the top ofthe song list. The most significant ways in which our system is superior to generalquery-by-humming systems are that 1) musical data is processed basedon ``beats'' instead of ``notes'', and 2) the retrieval is donethrough the use of indices based on multi-dimensional feature vectors. These features allow the system to retrieve songs quickly andprecisely even if erroneously hummed tunes are used as queries.The database currently holds over 10,000 songs,and the retrieval timeis about one second.The system is able to recognize the song and rank it within the firstfive places on the list for about 70% of hummed tunes that arerecognizable to human beings as a part of a song.
相原 健郎 堀 浩一
情報処理学会論文誌 (ISSN:18827764)
vol.42, no.6, pp.1377-1386, 2001-06-15

本論文は,人間の創造的な思考を支援するための手法と,それに基づく支援システムを提案する.まず,創造性についての認知科学研究に基づいた思考過程のモデルを提示し,思考の制約となっているものを変更することで創造的な思考が進むことを述べる.そして,思考の制約のうち,記憶の想起の障害となっている時間的な制約に着目し,それをシステムによってユーザに変更を促すことで創造的な思考を支援することを提案している.提案手法では,時間的な制約を空間的な制約に変換してユーザに提示することで,ユーザの想起を促し,それによって思考を支援することを行う.支援システムEn Passant 2は,思考活動で最もよく用いられる紙に書かれたメモを利用し,それをシステムに入力することで,ユーザの記憶の想起のきっかけを与えるのに利用している.ユーザは,システム上でメモのマークをつけることでメモを特徴づける.それを用いてシステムはメモ間の関連度を算出し,メモを2次元空間上にマップしてユーザに提示する.システムを用いた長期実験を行い,システムの有用性を示している.In this paper,we propose a method and its implementation to aid the process of creative thought.The objective of this research is to enhance the human creativity with computers.This paper deals with a scientific creativity.In order to aid the process of creative thought,we have implemented a system named En Passant 2,which stores the user's research notes.The user can put his/her own mark as an index onto his/her notes in the system.The unique feature of En Passant 2 lies in the function to deal with indices and a time attribute of the user's thought explicitly.Using indices and time information,the system shows the user's notepads related to his/her awareness of the issues.The recall of his/her memories in present context makes a collision of two contexts,and that triggers the user's creativity.We have carried out several experiments and show the results.
坂崎 尚生 側高幸治 長谷部 高行 山田 朝彦 大岩寛
情報処理学会論文誌 (ISSN:18827764)
vol.53, no.9, pp.2194-2203, 2012-09-15

池畑 望 伊藤 毅志
情報処理学会論文誌 (ISSN:18827764)
vol.52, no.12, pp.3817-3827, 2011-12-15

2007年よりIEEEのCIGシンポジウムの中でMs. Pac-Manの自動操作を競う大会が開かれている.この大会以来,Ms. Pac-Manは,デジタルゲームAIの研究対象として注目を集めつつある.これまでの大会では,知識ベースを用いた古典的な手法によるAIが最も良い成績を収めているが,その性能には限界が見え始めており,知識ベースに代わる新しいアプローチが求められている.そこで,本稿では囲碁で成功したモンテカルロ木探索によるMs. Pac-Manの自動操作システムを実現し,その有効性を検証した.モンテカルロ木探索は乱数によって生成された未来局面についてのシミュレーションを繰り返すことで,専門的知識に頼らずに期待値の高い次の手を求めることができる.性能評価実験ではモンテカルロ木探索による自動操作システムは過去にMs. Pac-Man Competitionに参加したすべてのプログラムよりも優秀な成績を示し,Ms. Pac-Manにおけるコンピュータの世界記録を上回る結果を得た.The competition of controller program for Ms. Pac-Man has been held in the CIG symposium of IEEE every year from 2007. Since this competition was held, Ms. Pac-Man has become to an attractive subject of research on digital game AI. In the competition by this year, the classical AI method by using the knowledge base has gotten the best result. But, since the improvement by this method is becoming a limit, a new approach is required. In this paper, we realized the Ms. Pac-Man controller by the using Monte-Carlo tree search which is effective on Go, and examined the effectiveness. By repeating the simulation about the future phase generated with the random number, the Monte Carlo tree search can select the next move with a high expected value, without depending on professional expertise. In an evaluation experiment, the controller by the Monte Carlo tree search showed results more excellent than all the programs which participated in Ms. Pac-Man Competition in the past.
末田 航 味八木 崇 暦本純一
情報処理学会論文誌 (ISSN:18827764)
vol.52, no.4, pp.1465-1474, 2011-04-15

モバイル機器では,位置情報を利用したアプリケーションが多用されている.GPSなどの位置測位手段から得られる緯度経度は,数値情報でありそのままでは利用者にとって直感的ではないので,それを住所や番地の表現に変換するリバースジオコーディングが必要である.しかし,現状のリバースジオコーディングでは行政的な地番に基づいて変換を行うため,モバイルアプリケーションを利用する利用者の主観的な空間意識とは必ずしも一致しない(たとえば「表参道」「ハチ公前」のような表現は地番ではないため利用不可能だった).本研究では,インターネット上の緯度経度情報付きの大量の写真とそのタグを実世界での集合知と見なし,それを集積・解析することで,人々の主観的な感覚に合致したリバースジオコーディングを自動的に行う「Social Reverse Geocoding」(SRG)を提案し,その構築の方式と,モバイルアプリケーション応用例を示す.SRGでは,統計学的手法であるカーネル密度推定法とSVMを用いることで,都市生活者としての利用者の空間意識により近い空間語とその範囲を自動推定する一連の方式を提案している.そして各種モバイル使用下での位置情報表現がより自然になり,また位置情報つき写真への自動タグレコメンデーションや,ライフログのサマライズが可能なアプリケーションを提案実装した.また,提案手法の都市計画やマーケティング分野への有効性を検証するために,従来手法による認知地図との比較,今後解決すべき問題と,関連分野への応用について議論する.
川嶋 宏彰 西川 猛司 松山 隆司
情報処理学会論文誌 (ISSN:18827764)
vol.48, no.12, pp.3715-3728, 2007-12-15

円滑な会話を進めるうえでは,参与者間で自然な間合いの発話権受け渡し(話者交替)が行われる必要がある.従来研究では,一方の発話終了からもう一方の発話開始までの時間(発話移行区間長)がしばしば解析されてきたが,実際の対面会話においては,相手話者の視線や口元の動きなどの視覚的に観察可能な身体動作も,発話権受け渡しの「間合い」を支えていると考えられる.そこで本研究では,話者が1 人であるにもかかわらず複数の役柄間での円滑な話者交替を表現している落語に着目し,演者の頭部動作の開始と発話開始・終了の時間的構造の解析を行った.その結果,先行発話終了に対する頭部動作の開始タイミングは,二者間会話の漫才における後続話者の発話開始タイミングと類似しているという知見が得られた.これは,視覚的な刺激の制御が,話者交替において受け手が感じる冗長な間合いを補間可能であることを示唆し,実際に被験者実験によってその評価を行った.Coordination of turn-taking with natural timing is important to realize a smooth conversation among multiple speakers. The existing studies often analyze an utterance transition interval, which is the interval from the end of the previous speaker's utterance to the beginning of the succeeding speaker's utterance. However, the effect of visually observable motions (e.g., gazing and lip motions) is also important to coordinate timing of turn-taking in face-to-face interaction. In this paper, we therefore focus on Japanese traditional Rakugo performances, in which smooth conversations among multiple roles are displayed by only one performer's act based on the control of the head motion timing during switching the roles. The result of analysis shows that the dynamic structure of intervals from the end of the previous utterance to the beginning of the head motions in Rakugo performances is similar to the structure of utterance transition intervals in Manzai dialogs, which are two-speaker conversations. The result suggests that the control of visual stimuli have the capability of filling redundancies in the pauses of turn-taking. We therefore examined the effectiveness based on psychological experiments.
門林 理恵子 西本 一志 角 康之 間瀬 健二
情報処理学会論文誌 (ISSN:18827764)
vol.40, no.3, pp.980-989, 1999-03-15

博物館の展示は 学芸員の専門知識や関心の体系的表現であるが ある視点からの構造化の一実現例であり しかも一方的に見学者に提示される. このため 様々な興味や知識を持つ見学者の知的欲求をつねに満たすことは難しい. そこで本論文では 学芸員と見学者を仲介し 博物館展示の意味的関連に基づく構造を見学者ごとに個人化する手法を提案する. 本手法では 展示物などに付与される説明文を キーワードを基に統計処理することで 展示物間の関連に基づく構造を2次元空間に可視化する. まず元の展示の構造を示す展示空間を構成し 次に見学者の興味に基づく興味空間を作る. 最後に両者を融合して個人化空間を作成する. 個人化空間に可視化された展示の構造は 学芸員の視点からの関連を保持しつつ 同時に見学者の視点を反映したものとなる. こうすることにより 既存の 見学者の立場を中心とした個人化手法における 展示が断片化して関連が失われ かえって理解が困難になるという問題を回避することができる. これらの空間を用いることで 同じ展示を見学者ごとに個人化することが可能となる. さらに これらの空間が学芸員へもフィードバックされることにより 学芸員自身が展示についての新たな視点を獲得できるが これは従来の博物館の展示や既存の個人化手法では困難であったものである. 本論文では 本手法の詳細とその実施例 さらに評価についても述べる.Museum exhibitions are thought to be well organized representations of the expert knowledge of curators, but they are just one example of structures of knowledge among many possibilities, given to museum visitors in a one-sided way. Therefore, traditional museum exhibitions can hardly meet the vast requirements of general visitors who possess a variety of interests. In this paper, we propose a method for personalizing the semantic structure of museum exhibitions by mediating curators and visitors. The semantic relations of displays are visualized as a two-dimensional spatial structure based on the viewpoints of the curators and visitors separately, and then together. The structures reflect the interests of the visitors, while maintaining the knowledge of the curators. We disucuss the detail of the method and show an example of personalization. Evaluation results through a subjective experiment is also given.
小窪 浩明 畑岡 信夫 李晃伸 河原 達也 鹿野 清宏
情報処理学会論文誌 (ISSN:18827764)
vol.50, no.11, pp.2597-2606, 2009-11-15

PC向け連続音声認識プログラムJuliusのSuperHマイコン(SH-4A)への搭載に関して行った処理の高速化と,評価実験について報告する.計算リソースの限られたマイコン上で動作させるため,仮説探索時のメモリ管理の最適化や音響尤度計算の高速化を実施した.語彙数5,000語での評価実験では,最適化前のJuliusの実行速度に対して3.7倍の高速化を実現し,SH-4A上での実時間動作を達成した.また,語彙数20,000単語での評価でも実時間の1.25倍で動作すること確認した.最後に,応用アプリケーションとしてT-Engine上に実装した質問応答システムについて報告する.To expand CSR (continuous speech recognition) software to the mobile environmental use, we have developed embedded version of Julius (Embedded Julius). In this paper, we describe an implementation of the "Embedded Julius" on a SH-4A microprocessor. SH-4A is a high-end MPU with on-chip FPU. However, further computational reduction is necessary for the CSR software to operate real-time. Applying some optimizations (efficient memory management, modified GMS), the "Embedded Julius" achieves real-time processing on the SH-4A. The experimental results show 0.73 x real-time, resulting 3.7 times faster than baseline CSR. We also evaluated the "Embedded Julius" on a large vocabulary task (20,000 words). It shows almost real-time processing (1.25 x RT). Finally, We introduced Q & A guidance systems developed for embedded applications.
蜷川 繁 津田 伸生 服部 進実
情報処理学会論文誌 (ISSN:18827764)
vol.41, no.2, pp.517-520, 2000-02-15

うわさに代表されるような集団における情報の伝播を調べるために,構成要素間にランダムに張りめぐらされたネットワーク上を情報が伝播する,うわさの伝播モデルを提案し,個人の間の関係と情報の伝播との関係を計算機シミュレーションを用いて調べた結果,各個人が平均して3人に情報を伝達すると,ほぼ集団全体に情報が伝搬することが明らかになった.この結果から,物理的あるいは経済的な制約条件によって構成要素間の接続が限られているようなネットワークで,ほぼ全体に情報を行きわたらせるためには,各構成要素から3本の出力を出し,それをランダムに接続すればよいことが分かる.We propose a model of information diffusion in a community, that is,a network in which the individuals are connected at random andeach individual passes information on to one's acquaintances.We investigate the spread of information with the modelwhen the number of the connections between the individuals varies.The computer simulation reveals that if each individual passesinformation on to three acquaintances on average,information spreads over almost whole community.The result tells that we can construct a networkin which each node connects to other three nodes at randomin order to diffuse information almost always in the almost whole network.
櫻井敦史 平田 富夫
情報処理学会論文誌 (ISSN:18827764)
vol.41, no.12, pp.3344-3351, 2000-12-15

モルフォロジー演算は画像の特徴抽出やノイズ除去など 様々な画像処理に用いられる基本的処理である. 2値画像入力に対するその時間計算量は, 入力画像のサイズを $n?times n$, フィルタのサイズを $r?times r$ とすると? $O(n^2r^2)$ となり,処理時間がフィルタサイズに大きく依存する. しかし距離変換を用いることで処理時間がフィルタサイズに依存しな いモルフォロジー演算を行うことが可能である. 本研究ではフィルタ形状のあるクラスに対しては, $O(n^2)$ 時間でモルフォロジー演算ができることを示す. このクラスに入るフィルタ形状の例をあげると,円,長円形, 正三角形,長方形,台形などであり, 画像処理で用いられるフィルタのほとんどが含まれる.Mathematical morphology is used for feature extractionand noise elimination in image processing.Morphological operation for a binary image of size $n\times n$with a filter of size $r\times r$ is performed in $O(n^2r^2)$ time,and thus the computation time depends heavily on the filter size.By using distance transformation,morphological operation can be donein time independent of the filter size.In this paper,we show that morphological operation can be donein $O(n^2)$ time for some class of filter shapes.This class contains most of filter shapes which appear in image processing,such as circle, rectangle, equilateral triangle, trapezoid, etc.
神原 啓介 永田 周一 塚田 浩二
情報処理学会論文誌 (ISSN:18827764)
vol.52, no.4, pp.1621-1634, 2011-04-15

Web上では人々によって描かれた多くの絵が公開・共有されているが,それらを再利用することは難しく,あまり行われていない.もし他の人の描いた絵を簡単に再利用でき,また再利用しやすい形で公開することができれば,より多くの人が手軽に絵を活用できるようになると考えられる.そこで我々はWebブラウザ上で絵を編集でき,他の人の描いた絵から「派生」させて新しい絵を作成することのできる2種類のWebアプリケーション:「Willustrator」と「TwitPaint」を開発した.ドロー系であるWillustratorは絵を再編集/再利用しやすいという特徴を持つ.一方,ペイント系のTwitPaintはTwitterと連携した絵によるコミュニケーションを特徴とする.両ツールを長期運用し,得られた派生データや事例,知見などをもとに,相違や特徴,問題点を分析した.さらに今後のWeb上で編集/派生可能なイラストツールの課題や将来の可能性についても検討を行った.Although many illustrations are shared on the Web, most people feel difficulty to reuse them. To solve this problem, we propose a social illustration system which supports people draw illustrations in reusable format and share them in social web sites. Based on the above concept, we developed two Web applications, Willustrator and TwitPaint, which allow people to draw images derived from other illustrations and edit them easily on common Web browsers. Willustrator is a "drawing" tool which focuses on drawing illustrations in reusable format. TwitPaint is a "painting" tool which allows people to share their illustrations easily in Twitter. We have put these applications into practice for a long period, and examined various aspects based on the experiences. Finally, we discuss the future work of the social illustration system.
福山 惠士 澤田 秀之
情報処理学会論文誌 (ISSN:18827764)
vol.52, no.4, pp.1562-1570, 2011-04-15

我々はこれまでに,形状記憶合金の細線を微小振動アクチュエータとして利用した触覚ディスプレイを開発し,素材の手触り感覚を呈示できることを見い出した.呈示触覚と実素材との比較実験を行った結果,触覚刺激のみによる呈示では個人差が大きく,同じ条件の刺激を呈示しても人によって異なる素材として認識される場合があることが分かった.人間は物体のテクスチャを触覚によって認識する際,視覚情報や体性感覚も有効に活用している.そこで,視覚ディスプレイ上に表示したテクスチャ画像に対応した触覚刺激を,マウス上に実装した薄型触覚ディスプレイによってユーザの手掌部に呈示するシステムを構築した.本システムは,複数のテクスチャ画像を視覚ディスプレイに表示し,ユーザがマウス操作によって各画像上でカーソルを移動させることにより,その速度に応じた触覚刺激を呈示して,能動的に物体の表面を撫でているかのような感覚を呈示することが可能である.システムの評価実験から,視覚情報が触覚認識に有意に影響を与えていることが示され,また触覚刺激と同時に適切な視覚情報を呈示することで,よりリアリティのある触覚感覚の呈示が可能となることが分かった.The authors have developed a tactile display using shape memory alloy wires, and constructed a presentation system of various texture sensations. However, different subjects perceive different sensations by one tactile stimulus generated by certain conditions. A human recognizes a texture of an object by referring not only to the tactile sensations, but also to the visual and other physical sensations. This paper introduces a texture presentation system, which consists of the tactile display and a visual display, and describes the evaluation of the system and effects of visual stimuli to texture sensations by several experiments.
三島 健 櫻井 英俊 吉元 昭裕 野下浩平
情報処理学会論文誌 (ISSN:18827764)
vol.49, no.12, pp.4007-4015, 2008-12-15

鈴木 茂哉 石原 知洋 ビルマニング 村井 純
情報処理学会論文誌 (ISSN:18827764)
vol.53, no.1, pp.385-402, 2012-01-15

中西 健一 高汐 一紀 徳田 英幸
情報処理学会論文誌 (ISSN:18827764)
vol.46, no.9, pp.2260-2268, 2005-09-15

堀口 悟史 井垣 宏 井上 亮文 山田 誠 星 徹 岡田 謙一
情報処理学会論文誌 (ISSN:18827764)
vol.53, no.1, pp.61-71, 2012-01-15

山本 昌弘 中崎 良成 横田 実 箱崎 勝也
情報処理学会論文誌 (ISSN:18827764)
vol.23, no.1, pp.65-71, 1982-01-15

本論文は開発したCOBOLマシンのアーキテクチャについて その特徴と設計思想に重点をおいて論じている.COBOLマシンはCOBOLで書かれたソースプログラムに簡単な変換を行って作られた中間言語プログラムを直接実行する高級言語マシンで 汎用計算機に接続されて付加プロセッサとして動作する.そして COBOLの演算処理 データ操作 表操作 実行順序制御などの機能はCOBOLマシンで実行し 入出力処理や通信制御などの機能はホストプロセッサである汎用計算機で実行される.COBOLマシンのアーキテクチャはCOBOLの言語仕様にできる限り近づけるように設定されており (1)多種類の内部データ形式 (2)複雑な属性のデータを効率良く表現するデータディスクリプタ (3)高度なデータアクセス機構 (4)ソースステートメントと直接対応する高機能命令 (5)ホストプロセッサとの高度なインタフェース機能 などを備えている.その結果 COBOLの大部分のステートメントはCOBOLマシンの1命令へ展開でき 翻訳処理が高速化され オブジェクトメモリ量も大幅に減少することが明らかになった.また COBOLマシンを高性能なハードウェアで実現することにより 実行速度も向上する.
古宮嘉那子 但馬 康宏 小谷 善行
情報処理学会論文誌 (ISSN:18827764)
vol.49, no.7, pp.2679-2691, 2008-07-15

敬語は,たくさんの要因によって使い分けられており,これまで,これらの使い分けを補助するシステムが開発されている.しかし,従来のシステムでは,言語知識をあらかじめ与える必要があり,また,入力情報に序列関係を含むなど,人間関係のとらえ方の知識を必要とするものであった.そのため,筆者らは敬語選択システム(HEDS)を作成し,決定木学習を用いた敬語に関する知識獲得の手法を提案する.HEDSは,人間関係についての複雑な判断を必要としない情報を入力とし,最も適切なタイプの敬語を選択するルールを決定木学習によって用例から自動的に作成するものである.そのため,本システムでは,使い分けに関する言語学の知識を必要とせず,実データから,自動的に敬語に関する言語知識獲得を行うことができる.敬語には,(1)尊敬語/謙譲語,(2)丁寧語の2つのタイプがある.HEDSはそれぞれのデータを用意することによって,両方に適用可能である.(1)尊敬語/謙譲語を決定するHEDSは,1つの動詞につき,敬語が尊敬語,謙譲語,敬語でない普通語の3つのうちから1つに選択し,(2)丁寧語については,動詞に丁寧語を付加するかどうかを決定する.A speaker must choose suitable honorific expressions in a sentence depending on many features. Some computer systems have developed that help people determine the suitable expressions. However, existing systems need to be previously provided knowledge of language and need knowledge about human relationships to use them. Hence we made a system honorific expression determining system (HEDS) and proposed a method of knowledge acquisition using decision tree learning. It generates automatically a set of rules to determine the most suitable type of honorific expression from examples, by decision tree learning. HEDS needs knowledge about neither human relationship nor linguistics about Japanese honorific expressions and it can acquire knowledge about Japanese honorific expressions from pragmatic data automatically. Japanese honorific expressions have two independent systems: (1) respect/modesty expressions and (2) polite expressions. HEDS can be applied to both of them if we gave it learning data for each. The HEDS for respect/modesty expressions determines what type of honorific expression a verb should be out of three types: a respect expression, a modesty expression and a non-honorific expression, and the HEDS for polite expressions determines whether or not a sentence includes a verb needs a polite expression for a set of features for the verb.
獅々堀正幹 大西 泰代 柘植 覚 北 研二
情報処理学会論文誌 (ISSN:18827764)
vol.48, no.1, pp.300-311, 2007-01-15

近年,楽曲配信サービスの普及により,容易に音楽データをダウンロードして試聴できるようになった.しかし,サーバ側で蓄積している音楽データが膨大になるにつれ,音楽データに対する効率的な検索手法が必要になっている.特にハミングを入力とする検索手法が近年活発に研究されており,音楽特徴量間の類似度計算にDP マッチングやユークリッド距離を用いる手法が主流であった.本論文では,距離尺度としてEarth Mover's Distance(EMD)を用いたハミング検索手法を提案する.EMD は輸送問題における輸送コストの最適解であり,本手法では輸送問題における各供給地が有する資源量を各音符の音長,輸送コストを各音符の出現時間と音高情報から算出することで,リズムと音程との類似度を同じ距離尺度で計り,全体の曲調が類似した曲を検索する.さらに,EMD の計算量が音符数に対して指数関数的に増加することに着目し,検索精度を維持しつつ計算コストを低減可能な音楽特徴量を提案する.約500 曲の音楽データベースに対してハミングデータ40 曲を入力とした評価実験を行った結果,ユークリッド距離を用いる手法より検索結果上位10 位以内に正解データが出現する割合が約30%向上した.また,DP マッチングを用いる手法と比べて,極端に音高の外れた音符を含むハミングデータに対する柔軟性を確認した. 付録:<a href="http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28"target="_brank">http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28</a>Music retrieval systems are extremely useful for collecting digital music data from on-line music distribution sites. Especially, there is a great need to develop effective techniques for content-based music retrieval systems, which can retrieve by humming query. The main issues in this research is how to decide the similarity of each music features extracted from music data. In order to calculate the similarity, some conventional methods use Euclid distance or DP matching, but it is very hard to solve the problem of the vagueness of humming query. In this paper, we propose a new similar music retrieval method based on humming query using the Earth Mover's Distance as the distance measure. Computing the EMD is based on a solution to the transportation problem, and the EMD is applied as the distance measure on similar image retrieval systems. In addition, we focus that the time complexity of the EMD is exponential worst case toward the number of notes, the improved method to decrease the number of notes in the music feature is also proposed. Experimental results show that the proposed method can improve the retrieval precision of conventional systems.appendices:<a href="http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28"target="_brank">http://www.ipsj.or.jp/08editt/contents/JNL4801/index.html#28</a>