著者
堀内 靖雄 三井 卓 井宮 淳 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.53, pp.21-26, 1996-05-25
被引用文献数
3

本論文では人間二人の演奏を収録、分析することにより、人間がリアルタイムで協調して演奏を行なう動作について考察する。演奏者はお互いに相手の音しか聞こえない条件でアンサンブル演奏を行ない、その演奏が収録された。リハーサル前後の演奏(初合わせの演奏と十分なリハーサル後の演奏)における時間的なタイミングのずれやテンポの変化について分析を行なった。結果として、リハーサルの前に比べて、リハーサル後の演奏の方がずれが減少した。また、収録したテープを演奏者に聞かせ、ずれを指摘させることにより、100[ms]程度以内のずれならば、ずれとして指摘されず、またフレーズの頭のずれに対しては敏感であるということが観察された。Performances by two players were recorded under the condition where they can't see their partner each other, Analysing the performances, the total of time lag between two players performance was reduced after some rehearsal. Then players were asked to point out the part of the score where they had time lag. The results are (1) the time lag within 100[ms] were not perceived as time lag and (2) they were sensitive to the head of a phrase so that they could point out the time lag within 100[ms].
著者
宮城 愛美 西田 昌史 堀内 靖雄 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.90, no.3, pp.732-741, 2007-03-01
参考文献数
17
被引用文献数
2

本研究では,視覚と聴覚に障害のある盲ろう者が,指点字を使用して参加可能な会議システムについて検討した.盲ろう者が指点字,健常者が文字を使用する会議システムを想定する際,メディアの違いに起因して,盲ろう者の発言と読取りが困難な状況が予想される.指点字による発信・受信を保証するため,発言の伝達情報量と呈示速度を制御する「発言権」という機能を導入した.指点字の入出力を模擬したインタフェースを使用して,32人の被験者によるシミュレーション実験を行い,「発言権」を評価した.提案システムにおいてグループ内の被験者で同程度の発言回数・発言文字数が達成され,機能の有効性が示された.また,盲ろう者が参加したシステム評価実験により,試作した会議システムの実現の可能性が見出せた.
著者
前田 真季子 堀内 靖雄 市川 熹
雑誌
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI)
巻号頁・発行日
vol.2002, no.9(2002-HI-102), pp.39-46, 2003-01-30

人は視線の動きやうなずきなどのジェスチャーを用いて、対話の円滑なやり取りを行なっている。自然対話は話者同士の音声情報、視覚情報を用いた相互作用によって進行していくものであるため、音声におけるあいづち現象などと同様に、ジェスチャー同士にも話者間に相互作用が生じていることが推測される。そこで、本論文では、特にうなずきに着目し、ジェスチャーによる相互作用を分析した。分析に用いたデータは、6組の親しい友人同士による対話であり、収録には正面映像を撮ることが可能な、2つのプロンプターを使用した。そして、その収録データを一般に公開されているアノテーションツール“ANVIL”を用いて、アノテートし、分析を行なった。分析の結果、うなずきは、あいづちと同様に相手話者の発話に対する何らかの応答動作として生じる場合よりも、自己発話内の方が多く生じる傾向が見られた。また、うなずきが二人の話者で同時に発生する現象が多いことも示唆された。
著者
堀内 靖雄 中野 有紀子 小磯 花絵 石崎 雅人 鈴木 浩之 岡田 美智男 仲 真紀子 土屋 俊 市川 熹
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.14, no.2, pp.261-272, 1999-03-01
被引用文献数
16

The Japanese Map Task Corpus was created between 1994 and 1998 and contains a collection of 23 hour digital recordings, digitized maps and orthographic transcriptions of 128 dialogues by 64 native Japanese speakers. Map task dialogues are dialogues participated in by two speakers, the instruction giver who has a map with a route and the instruction follower who has a map without a route. The giver verbally instructs the follower to draw a route on his map. The two maps are slightly different so that there may emerge a natural interaction in spite of the fact that the flow of information internal to the task is basically one way. The principle and design of the recordings are described with special reference to the augmentations and improvements to the original HCRC Map Task corpus. Annotations to the orthographic transcriptions are viewed as "tags" that provide the start and end times of utterances, the duration of pauses, non-verbal events and synchronization of overlapping utterances, in a format which provides a view to giving a basis for further tagging in terms of linguistic and discourse phenomena in a interchangeable and sharable manner. Discourse and linguistic phenomena peculiar to spontaneous spoken dialogues, such as overlapping, are analyzed and the method of recording such phenomena in the transcription is discussed and proposed, with an implication for the requirement that one dialogue be represented in one digitized sound file for the preservation and reference of the information on timing. The tags emp1oyed in the corpus also provide an easy way of characterizing it in terms of the number and the duration of utteraI1ces and pauses. The statistical figures thus ob-tained are relatively independent of design factors like kinds of maps, but familiarity does significantly correlate with the duration and number of utterances.
著者
渡邉 実 堀内 靖雄 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.338, pp.17-22, 1997-10-23
参考文献数
6
被引用文献数
3

数式の構造は欧米語に近く、日本語とは非常に異なるため、その日本語の音声表現は決まったものがない。視覚障碍者がインターネット等を通して電子化された情報を得る場合を想定し、HTMLやLATEXで記述されている表形式や数式を音声で表現するための基礎検討を進めている。
著者
大須賀智子 堀内靖雄 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.58, pp.1-6, 2003-05-27
被引用文献数
3

本研究では、音声の韻律情報のみを用いた文の構造の推定手法について検討した。推定に用いる韻律パラメータとして、今回は新たに、先行するアクセント句末1モーラにおける局所的な韻律的特徴を用いて文の木構造の生成を試みた。ATR503文を対象として実験を行った結果、部分木のレベルで約76?%の推定精度を得ることができた。これは従来の、後続音声区間にまたがる、より大局的なパラメータを用いた場合に対し、約4?%の低下にとどまり、ほぼ遜色のない結果が得られた。すなわち、先行する音声区間の局所的な韻律情報のみから、後続の音声区間への係り受け関係がある程度推定可能であることが確かめられた。この結果から、局所的特徴も文構造の理解へ貢献しており、韻律情報が我々人間の実時間および実環境での発話理解を支えるために、頑健な構造となっている可能性が示唆されたといえる。In this study, we introduce a method of estimating the syntactic tree structure of Japanese speech from the F0 contour and time duration. We formed the hypothesis that we can infer a syntactic relation with the following part by listening only to the leading part of speech, and we proposed an estimating method which uses only the local prosodic features of the final part of the leading phrase. We applied the method to the ATR 503 speech database. The experimental results indicated an estimation accuracy of 76\% for the branching judgment for each sequence of three leaves. We consider this result to be fairly good for the difficult task of estimating a syntactic structure that includes a future part by using only local prosodic features in the past, and also consider prosodic information to be very effective in real-time communication with speech.
著者
市川 熹 大橋 浩輝 仲 真紀子 菊池 英明 堀内 靖雄 黒岩 眞吾
出版者
科学・技術研究会
雑誌
科学・技術研究 (ISSN:21864942)
巻号頁・発行日
vol.5, no.1, pp.113-122, 2016 (Released:2016-07-07)

母語話者の話者交替時の重複タイミング現象である話者移行適格場(TRP)に注目し、日本語と英語について、それぞれの母語話者とその言語を十分に習得している非母語話者の実時間対話を分析した。両言語ともに、対話者が母語話者の組み合わせ以外ではTRPの制約が成立していなかった。このことは、非母語話者が発信している言語情報は話者交替の予告情報にはならず、言語情報の裏に必然的に存在するプロソディにあることを示唆している。また日本語母語話者の5歳児と6歳児と成人の対話を分析し、さらに先行研究結果を参考にしたところ、日本語母語のTRPの制約は5歳児ころまでに獲得されることが推察された。母語話者の話者交替タイミング制御のモデルを提案した。
著者
大高 崇 西田 昌史 堀内 靖雄 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. WIT, 福祉情報工学 (ISSN:09135685)
巻号頁・発行日
vol.103, no.747, pp.7-12, 2004-03-19

現状の手話CGアニメーションでは,手動作が不自然に見えてしまうという問題が指摘されている.その要因の一つに,手話を表現する時間長が文の構造や強調表現などによって変化するという点を考慮していないことが挙げられる.この問題の解決には手話の時間構造に関する詳細な検討が必要不可欠であるが,これを厳密に分析した研究はあまり行われていない.そこで本研究では,手話の時間構造に関する初期検討として,時間構造の基準となる単位(時間構造単位)について分析を行った.分析の結果,手話の時間構造は動作転換点を中心に構成され,時間構造の単位は単語以下の単位であるという点が示唆された.
著者
山崎 志織 堀内 靖雄 西田 昌史 黒岩 眞吾 市川 熹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.435, pp.31-36, 2008-01-18

人間の手話動作と同程度の速度でも十分に読み取り可能な手話文CG合成システムを実現するために,モーションキャプチャにより収録した単語データを用い,わたりを自動補間する手話文CG合成システムの構築を行った.わたりに対しては時間長を移動距離から算出する手法を用い,速度を力学的モデルである躍度最小モデルによって算出した.構築したシステムによるアニメーションに関して,市販されている手話文CG合成ソフトとの比較評価を行った結果を報告する.
著者
白井 洋輔 柳村 舞衣 篠崎 隆宏 堀内 靖雄 黒岩 眞吾 遠藤 俊樹 宇都宮 栄二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.112, no.475, pp.245-250, 2013-03-11

リアルタイム映像配信における字幕提示において,字幕情報の遅延や欠落は大きな問題である.この問題に対し,音声と字幕の同期と字幕の要約が有効であると考えられるが,一般的な映像での検証はほとんどなされていない.そこで本研究では(1)字幕提示のタイミングを変化させた場合の了解度実験(2)音声に忠実な字幕文(全文字幕)と音声を要約した字幕文(要約字幕)での了解度実験と主観評価実験を行った.結果として字幕提示のタイミングは音声と同期させた場合の了解度が最も高くなった.全文字幕と要約字幕では了解度において有意差は見られなかったが,ろう者に対しては要約字幕の方が了解度が高い傾向が示された.また,主観評価では要約字幕の評価が高くなり,字幕を要約することの有効性が示された.
著者
長嶋 祐二 原 大介 堀内 靖雄 酒向 慎司
出版者
工学院大学
雑誌
基盤研究(S)
巻号頁・発行日
2017-05-31

本研究では、手話の単語レベル、対話レベルから、言語学的な解析や手話工学分野で利用可能な、多用途型日本手話データベースを構築するための方法論の検討、並びに、データベースの構築を目的とする。令和元年度は、前年度までのテスト撮影の結果を踏まえ以下の項目に対して検討を行い本格的な3次元動作と映像のデータの収録を行った。(1)前年度までに撮影した言語資料 1,000単語の検証作業を行い、今年度撮影の方針を検討した。その結果、3次元動作データは、カメラ系と3次元系の同期解析、並びに、CG生成を考慮して、昨年度決めたフレームレートをとした。単語の収録では、表情などの非手指動作の詳細分析を考慮して、正面映像だけだった4Kカメラを左右の両側面を追加した。(2)今年度収録する言語資料は、7月までに手話母語者の研究協力者と共同で候補単語3,800単語のプロンプタ用の映像の撮影を終了した。これと並行して、対話撮影のためのテーマ検討も行った。本格的な収録は、8月から9月にかけて東映東京スタジオで収録した。対話撮影は、8テーマのデータベース収録候補の同期撮影を実施した。単語撮影は、3,873ラベルで総動作単語数では4,965単語の収録を行った。3年間で、合計4,873ラベルで総動作数では6,359単語の収録が完了した。当初の目標の5,000単語を上回る成果が得られた。(3)アノテーション支援システムでは、昨年度までに完成したビュワーの組み込みが完了して、支援部の3次元動作分析部分に着手した。(4)対話データ処理では、追加予算を含めて3対話の3次元動作データの生成が完了し、先行した部分は終了して、追加予算の部分は現在進行している。次年度のデータ公開へ向け単語収録データの分割並びにラベルの張替え作業も進行している。
著者
丸山 翔太郎 黒岩 眞吾 堀内 靖雄
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J102-A, no.2, pp.120-123, 2019-02-01

トランペットの音色が演奏者によってどのように異なるのかについて,音響的特徴の分析を行った.また,演奏者の個人性を表す特徴量として口唇振動MFCCを提案しHMMを用いた演奏者識別実験によりその有効性を確認した.
著者
寺内 美奈 時田 佳子 菊池 浩平 堀内 靖雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.104, no.386, pp.37-40, 2004-10-28
参考文献数
4
被引用文献数
3

手指動作と表情,口形などの非手指動作によって意思や感情を伝える手話は,聴覚障害者の1つのコミュニケーション手段である.手話は対話言語であることから,話者同士がどのように話を進めていぐかを解析することは,手話の言語構造を明確にするとともに,手話学習への指針ともなりうる.そこで,著者らは手話のターンテイキング(発話交替)に着目し,日本手話における会話構造と話者交替のモデル化を試みている.そこで,ネイティブスピーカによる日本手話対話例文データを収録し,工学院大学で開発した対話映像解析支援システムMATを用いて,話者交替時での手指信号ならびに非手指信号の詳細な解析を進めている.本報告では,対話データの収集方法,対話映像の分析方法,解析の途中経過として得られた対話の特徴などについて述べる.
著者
石毛 大悟 堀内 靖雄 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.16, pp.7-12, 2003-02-21

本論文では、独奏に休符がある場合の人間の合奏制御のふるまいについて述べる。まず、休符がある分析用の楽譜を作成し、計算機の独奏と人間の伴奏者が合奏を行うデータを収録した。独奏に休符がある場合の伴奏者の合奏制御についていくつかの仮説を立て、重回帰分析によりモデル式を作成し、人間の演奏データとの誤差により評価を行い合奏制御の推定を行った。結果、ある時点において、その直前の独奏者との「ずれ」など差の情報を用いることができる部分では、その差の情報を利用しているが、相手が休符で差の情報を使うことができない部分では、1小節程度過去の演奏情報に従い演奏を行っていることが示唆された。This paper describes behavior human performance when there is some rests in his/her partner's score. 96 ensembles by acoputer and a human performance were recorded. Some hypotheses were formed sbout a model of human performance for synchronicity when a rest exisits in his/her pertner's part and multiple regression analysis is applied the recorded data. It is suggested that when the difference between two performance can be used, a human performer plays using the information for good synchronicity, but when the difference between two performers cannot be used of a rest, a human performer plays based on the information at about one bar line past.
著者
土屋 俊 堀内 靖雄 石崎 雅人 前川 喜久雄
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.14, no.2, pp.231-242, 1999-03-01
被引用文献数
5
著者
堀内 靖雄 三井 卓 財津 茜 市川 熹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.74, pp.103-108, 1998-08-07
被引用文献数
4

本論文では人間二人の演奏およびテンポ一定で演奏を行なう計算機と人間による演奏を収録し、人間の演奏制御がどのように行なわれているのかということを調査する。相手に合わせるように教示された演奏者(伴奏者)は、ずれに敏感に反応し、テンポを修正して合わせようとすることが示された。また、テンポを早くしたいという欲求があるとき、その分をバイアスしてテンポ変化を行なうということが示唆された。相手をリードするように教示された独奏者は、伴奏者ほど敏感にテンポ変化をせず、テンポをキープしようとする意図がみられた。さらにずれが小さい場合には、ずれとはあまり相関のないテンポ変化を行なうことが観察された。We recorded several performances where two performers play together or one performer plays with a computer which can play with a fixed tempo. We analyzed the timing information of these performances. The result shows a performer who is instructed to be an accompanist changes her tempo according to the time lag between her and another performer (soloist). A performer who is instructed to be a soloist does not change her tempo according to the lag so much in order to keep their tempo. When the lag is very short, they change their tempo regardless of their time lag.
著者
高梨 克也 坊農 真弓 原田 なをみ 高梨 克也 堀内 靖雄 片桐 恭弘 神田 和幸 細馬 宏通 原田 なをみ 堀内 靖雄 神田 和幸 細馬 宏通 坊農 真弓 城 綾実
出版者
京都大学
雑誌
基盤研究(C)
巻号頁・発行日
2006

対面コミュニケーションの基本的単位である「発話」の構造について, 実際に収録されたデータを用いて分析した. 「発話」は言語だけでなく, ジェスチャーや視線などの非言語表現も含んだマルチモーダルな複合体である. そのため, 本研究では, 聴覚モダリティを用いる音声言語と視覚モダリティによる手話を比較し, 各モダリティの特徴を解明した. また, 言語の文法構造がコミュニケーションのやり取りを形成する際にどのように利用されるかを解明した.