著者
堀内 靖雄 三井 卓 井宮 淳 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.53, pp.21-26, 1996-05-25
被引用文献数
3

本論文では人間二人の演奏を収録、分析することにより、人間がリアルタイムで協調して演奏を行なう動作について考察する。演奏者はお互いに相手の音しか聞こえない条件でアンサンブル演奏を行ない、その演奏が収録された。リハーサル前後の演奏(初合わせの演奏と十分なリハーサル後の演奏)における時間的なタイミングのずれやテンポの変化について分析を行なった。結果として、リハーサルの前に比べて、リハーサル後の演奏の方がずれが減少した。また、収録したテープを演奏者に聞かせ、ずれを指摘させることにより、100[ms]程度以内のずれならば、ずれとして指摘されず、またフレーズの頭のずれに対しては敏感であるということが観察された。Performances by two players were recorded under the condition where they can't see their partner each other, Analysing the performances, the total of time lag between two players performance was reduced after some rehearsal. Then players were asked to point out the part of the score where they had time lag. The results are (1) the time lag within 100[ms] were not perceived as time lag and (2) they were sensitive to the head of a phrase so that they could point out the time lag within 100[ms].
著者
宮城 愛美 西田 昌史 堀内 靖雄 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.90, no.3, pp.732-741, 2007-03-01
参考文献数
17
被引用文献数
2

本研究では,視覚と聴覚に障害のある盲ろう者が,指点字を使用して参加可能な会議システムについて検討した.盲ろう者が指点字,健常者が文字を使用する会議システムを想定する際,メディアの違いに起因して,盲ろう者の発言と読取りが困難な状況が予想される.指点字による発信・受信を保証するため,発言の伝達情報量と呈示速度を制御する「発言権」という機能を導入した.指点字の入出力を模擬したインタフェースを使用して,32人の被験者によるシミュレーション実験を行い,「発言権」を評価した.提案システムにおいてグループ内の被験者で同程度の発言回数・発言文字数が達成され,機能の有効性が示された.また,盲ろう者が参加したシステム評価実験により,試作した会議システムの実現の可能性が見出せた.
著者
前田 真季子 堀内 靖雄 市川 熹
雑誌
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI)
巻号頁・発行日
vol.2002, no.9(2002-HI-102), pp.39-46, 2003-01-30

人は視線の動きやうなずきなどのジェスチャーを用いて、対話の円滑なやり取りを行なっている。自然対話は話者同士の音声情報、視覚情報を用いた相互作用によって進行していくものであるため、音声におけるあいづち現象などと同様に、ジェスチャー同士にも話者間に相互作用が生じていることが推測される。そこで、本論文では、特にうなずきに着目し、ジェスチャーによる相互作用を分析した。分析に用いたデータは、6組の親しい友人同士による対話であり、収録には正面映像を撮ることが可能な、2つのプロンプターを使用した。そして、その収録データを一般に公開されているアノテーションツール“ANVIL”を用いて、アノテートし、分析を行なった。分析の結果、うなずきは、あいづちと同様に相手話者の発話に対する何らかの応答動作として生じる場合よりも、自己発話内の方が多く生じる傾向が見られた。また、うなずきが二人の話者で同時に発生する現象が多いことも示唆された。
著者
堀内 靖雄 中野 有紀子 小磯 花絵 石崎 雅人 鈴木 浩之 岡田 美智男 仲 真紀子 土屋 俊 市川 熹
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.14, no.2, pp.261-272, 1999-03-01
被引用文献数
16

The Japanese Map Task Corpus was created between 1994 and 1998 and contains a collection of 23 hour digital recordings, digitized maps and orthographic transcriptions of 128 dialogues by 64 native Japanese speakers. Map task dialogues are dialogues participated in by two speakers, the instruction giver who has a map with a route and the instruction follower who has a map without a route. The giver verbally instructs the follower to draw a route on his map. The two maps are slightly different so that there may emerge a natural interaction in spite of the fact that the flow of information internal to the task is basically one way. The principle and design of the recordings are described with special reference to the augmentations and improvements to the original HCRC Map Task corpus. Annotations to the orthographic transcriptions are viewed as "tags" that provide the start and end times of utterances, the duration of pauses, non-verbal events and synchronization of overlapping utterances, in a format which provides a view to giving a basis for further tagging in terms of linguistic and discourse phenomena in a interchangeable and sharable manner. Discourse and linguistic phenomena peculiar to spontaneous spoken dialogues, such as overlapping, are analyzed and the method of recording such phenomena in the transcription is discussed and proposed, with an implication for the requirement that one dialogue be represented in one digitized sound file for the preservation and reference of the information on timing. The tags emp1oyed in the corpus also provide an easy way of characterizing it in terms of the number and the duration of utteraI1ces and pauses. The statistical figures thus ob-tained are relatively independent of design factors like kinds of maps, but familiarity does significantly correlate with the duration and number of utterances.
著者
渡邉 実 堀内 靖雄 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.338, pp.17-22, 1997-10-23
参考文献数
6
被引用文献数
3

数式の構造は欧米語に近く、日本語とは非常に異なるため、その日本語の音声表現は決まったものがない。視覚障碍者がインターネット等を通して電子化された情報を得る場合を想定し、HTMLやLATEXで記述されている表形式や数式を音声で表現するための基礎検討を進めている。
著者
大須賀智子 堀内靖雄 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.58, pp.1-6, 2003-05-27
被引用文献数
3

本研究では、音声の韻律情報のみを用いた文の構造の推定手法について検討した。推定に用いる韻律パラメータとして、今回は新たに、先行するアクセント句末1モーラにおける局所的な韻律的特徴を用いて文の木構造の生成を試みた。ATR503文を対象として実験を行った結果、部分木のレベルで約76?%の推定精度を得ることができた。これは従来の、後続音声区間にまたがる、より大局的なパラメータを用いた場合に対し、約4?%の低下にとどまり、ほぼ遜色のない結果が得られた。すなわち、先行する音声区間の局所的な韻律情報のみから、後続の音声区間への係り受け関係がある程度推定可能であることが確かめられた。この結果から、局所的特徴も文構造の理解へ貢献しており、韻律情報が我々人間の実時間および実環境での発話理解を支えるために、頑健な構造となっている可能性が示唆されたといえる。In this study, we introduce a method of estimating the syntactic tree structure of Japanese speech from the F0 contour and time duration. We formed the hypothesis that we can infer a syntactic relation with the following part by listening only to the leading part of speech, and we proposed an estimating method which uses only the local prosodic features of the final part of the leading phrase. We applied the method to the ATR 503 speech database. The experimental results indicated an estimation accuracy of 76\% for the branching judgment for each sequence of three leaves. We consider this result to be fairly good for the difficult task of estimating a syntactic structure that includes a future part by using only local prosodic features in the past, and also consider prosodic information to be very effective in real-time communication with speech.
著者
市川 熹 大橋 浩輝 仲 真紀子 菊池 英明 堀内 靖雄 黒岩 眞吾
出版者
科学・技術研究会
雑誌
科学・技術研究 (ISSN:21864942)
巻号頁・発行日
vol.5, no.1, pp.113-122, 2016 (Released:2016-07-07)

母語話者の話者交替時の重複タイミング現象である話者移行適格場(TRP)に注目し、日本語と英語について、それぞれの母語話者とその言語を十分に習得している非母語話者の実時間対話を分析した。両言語ともに、対話者が母語話者の組み合わせ以外ではTRPの制約が成立していなかった。このことは、非母語話者が発信している言語情報は話者交替の予告情報にはならず、言語情報の裏に必然的に存在するプロソディにあることを示唆している。また日本語母語話者の5歳児と6歳児と成人の対話を分析し、さらに先行研究結果を参考にしたところ、日本語母語のTRPの制約は5歳児ころまでに獲得されることが推察された。母語話者の話者交替タイミング制御のモデルを提案した。
著者
大高 崇 西田 昌史 堀内 靖雄 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. WIT, 福祉情報工学 (ISSN:09135685)
巻号頁・発行日
vol.103, no.747, pp.7-12, 2004-03-19

現状の手話CGアニメーションでは,手動作が不自然に見えてしまうという問題が指摘されている.その要因の一つに,手話を表現する時間長が文の構造や強調表現などによって変化するという点を考慮していないことが挙げられる.この問題の解決には手話の時間構造に関する詳細な検討が必要不可欠であるが,これを厳密に分析した研究はあまり行われていない.そこで本研究では,手話の時間構造に関する初期検討として,時間構造の基準となる単位(時間構造単位)について分析を行った.分析の結果,手話の時間構造は動作転換点を中心に構成され,時間構造の単位は単語以下の単位であるという点が示唆された.
著者
山崎 志織 堀内 靖雄 西田 昌史 黒岩 眞吾 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.435, pp.31-36, 2008-01-18

人間の手話動作と同程度の速度でも十分に読み取り可能な手話文CG合成システムを実現するために,モーションキャプチャにより収録した単語データを用い,わたりを自動補間する手話文CG合成システムの構築を行った.わたりに対しては時間長を移動距離から算出する手法を用い,速度を力学的モデルである躍度最小モデルによって算出した.構築したシステムによるアニメーションに関して,市販されている手話文CG合成ソフトとの比較評価を行った結果を報告する.
著者
石毛 大悟 堀内 靖雄 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.16, pp.7-12, 2003-02-21

本論文では、独奏に休符がある場合の人間の合奏制御のふるまいについて述べる。まず、休符がある分析用の楽譜を作成し、計算機の独奏と人間の伴奏者が合奏を行うデータを収録した。独奏に休符がある場合の伴奏者の合奏制御についていくつかの仮説を立て、重回帰分析によりモデル式を作成し、人間の演奏データとの誤差により評価を行い合奏制御の推定を行った。結果、ある時点において、その直前の独奏者との「ずれ」など差の情報を用いることができる部分では、その差の情報を利用しているが、相手が休符で差の情報を使うことができない部分では、1小節程度過去の演奏情報に従い演奏を行っていることが示唆された。This paper describes behavior human performance when there is some rests in his/her partner's score. 96 ensembles by acoputer and a human performance were recorded. Some hypotheses were formed sbout a model of human performance for synchronicity when a rest exisits in his/her pertner's part and multiple regression analysis is applied the recorded data. It is suggested that when the difference between two performance can be used, a human performer plays using the information for good synchronicity, but when the difference between two performers cannot be used of a rest, a human performer plays based on the information at about one bar line past.
著者
堀内 靖雄 三井 卓 財津 茜 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.74, pp.103-108, 1998-08-07
被引用文献数
4

本論文では人間二人の演奏およびテンポ一定で演奏を行なう計算機と人間による演奏を収録し、人間の演奏制御がどのように行なわれているのかということを調査する。相手に合わせるように教示された演奏者(伴奏者)は、ずれに敏感に反応し、テンポを修正して合わせようとすることが示された。また、テンポを早くしたいという欲求があるとき、その分をバイアスしてテンポ変化を行なうということが示唆された。相手をリードするように教示された独奏者は、伴奏者ほど敏感にテンポ変化をせず、テンポをキープしようとする意図がみられた。さらにずれが小さい場合には、ずれとはあまり相関のないテンポ変化を行なうことが観察された。We recorded several performances where two performers play together or one performer plays with a computer which can play with a fixed tempo. We analyzed the timing information of these performances. The result shows a performer who is instructed to be an accompanist changes her tempo according to the time lag between her and another performer (soloist). A performer who is instructed to be a soloist does not change her tempo according to the lag so much in order to keep their tempo. When the lag is very short, they change their tempo regardless of their time lag.
著者
長嶋 祐二 市川 熹 神田 和幸 原 大介
出版者
工学院大学
雑誌
基盤研究(A)
巻号頁・発行日
2002

本研究の目的は,手話の非手指信号の言語学的機能やコミュニケーションのための認知機能を解明し,その結果を手話画像の符号化,アニメーション生成などに適用することである.本研究では,下記の主な項目について成果を得た.1.認知的機構の解析では,事象関連電位N400計測に基づいた意味処理過程解析の検討を行った.その結果,手話・文字による意味的逸脱単語でN400が観察され電位は文字刺激で大きいことがわかり,呈示モダリティによって処理過程の違いを示した.対視線データの計測では,視線の停留と習熟度との相関を示し,理解度が上がれば顔への停留率が向上する結果を得た.2.解析支援システムでは,電子タグ付けならびに,磁気センサーからの3次元データを描画するシステムの構築を行った.この支援システムにより,映像と生理データを同期して解析することが可能となり,解析時間の効率化が図れた.3.記述・解析部では,手話の階層的形態素NVSモデルの非手指信号の記述機能の強化を行なった.4.対話モデルの解析では,抑制-非抑制手話を解析し,抑制部位の調動が表出可能な身体動作へ変形するメカニズムの存在が示唆された.また,手話の遅延検知限は100〜200msであることを明らかにした.音声会話と比較して,手話は遅延に関して寛容であることを示した.5.画像符号化では,さまざまなサイズの手話映像の評価から読み取りには,空間解像度より画像のフレームレートが重要であることがわかった.上記の成果を基に手話動画像符号化として新しいAdapSync符号化を提案した.本研究を通して得られた成果は,国際会議をはじめ電子情報通信学会論文誌・学会誌,ヒューマンインタフェース学会論文誌・学会誌などに掲載あるいは掲載予定である.尚,本研究の成果をうけ、手話の対話解析を通し脳科学的な認知科学的側面からの理解機構解明の作業を続行している。
著者
大平 栄二 阿部 正博 小松 昭男 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.3, pp.586-595, 1993-03-25
被引用文献数
5

本論文では,自然言語によるデータベース検索を主なタスクとするシステムを対象として,制限の少ない柔軟なユーザインタフェースを実現するための対話制御の枠組みについて述べている.ここでは,(1)まず対話管理の有効な方式の一つである発話対に基づいた対話管理法を,発話と発話対との間の結合関係をも統一的に扱うことが可能な枠組みに拡張するこにより,利用者とシステム間の対話の主導権を柔軟に制御することを可能とした.(2)更に,ATMSをベースとした非単調推論を適用することにより,利用者からの入力の解釈を誤った場合にも,その修復が可能な対話制御の枠組みを示した.これにより,効率的で,対話性の優れた検索システムを実現可能である.