著者
森山 剛 小沢 慎治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.12, pp.33-38, 2008-02-08
被引用文献数
1

自分の声で好みの歌唱様式を有した歌声を作るには,歌唱を訓練し,歌唱様式を学び,さらに歌声を発する恥ずかしさを克服しなければならず,非常に困難である.そこで,歌詞を朗読するだけで,その音声と楽譜を入力とし,ユーザの声の話者性を損なわずに,自由な歌唱様式を有した歌唱を合成する手法を提案する.本手法により,楽譜さえあれば,どんな曲でも,いつでもどこでも何度でも,自分の声で歌わせることができ,さらにリズムや旋律を工夫してジャズや演歌といったジャンルを演出したり,他人の歌い方を真似したり,音痴を修正したりできる.楽譜を編集する過程で,歌唱様式をどう実現すれば良いか学習でき,また自分が歌う前に,自分が歌った場合のイメージを掴むこともできる.聴取実験により,朗読音声の話者性や歌詞の音韻性を損なわず,歌唱様式の基本となる演奏記号を合成できることが示された.We propose a method of transforming reading speech of lyrics to singing voice. It is capable of realizing favorite style in the transformation, i.e., a specific genre and an expression. Generating singing voice by one's own voice requires the person to train singing, to learn how to realize singing styles, and to overcome hesitation in singing out. The proposed method only requires the user to read the lyrics. It then allows the user to generate singing voice of any music, anytime, anywhere, and any number of times. The user can edit the music for generating a specific singing style, mimicing other's style of singing, and correcting the problematic portion of his or her singing. The user can also learn how to realize a specific style in singing and hear how it sounds when he or she sings on his or her own. Experimental results demonstrated that the proposed method was able to synthesize a comprehensive set of basic indications such as crescendo in the synthesized singing holding the voice quality of the speaker.
著者
森山 剛 斎藤 英雄 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.95, no.319, pp.9-16, 1995-10-20
被引用文献数
6

本研究では、人が声を聞いた時に知覚する感情の概念と、平静時から変化した音響パラメータとを定量的に対応付ける分析合成系を提案する。まずいくつかの言葉で感情音声を発し、それを聞いた際に受ける印象を主観評価した結果を因子分析して因子を得る。この時同時に感情音声の音響パラメータを主成分分析してその主成分を得る。こうして得られた因子と主成分の重回帰分析を行うことにより得られる重回帰係数行列を対応情報とする。分析系では、対応情報に基づいて得られた音響パラメータから感情情報を獲得する。合成系では、対応情報に基づいて、感情情報から音響パラメータの平静時からの変化分を得る。本稿では、構築するシステムの概要を述べると共に抽出された因子の妥当性を検証する。
著者
チャムノンタイ コーシン 石川 繁樹 小沢 慎治
雑誌
全国大会講演論文集
巻号頁・発行日
vol.37, pp.1623-1624, 1988-09-12

筆者らはこれまでに白線テープ敷設による無人搬送車の視覚誘導方式を提案してきた。本方式では搬送車の前方に敷設されている白線をTVカメラで撮像し、白線誘導路に従って走行する。本稿では、システム用に白線テープを敷設することにより行なった従来のシステムと違い、予め工場内に描かれているラインを利用することを検討した。ここでは図1で示すように通路の両端がラインで区分されている工場を想定し、視覚誘導による搬送車を走行させる方式を検討している。本稿では本方式の課題とわれわれのアプローチを示す。
著者
大塚 紳一郎 原 寛徳 小沢 慎治
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌D(産業応用部門誌) (ISSN:09136339)
巻号頁・発行日
vol.124, no.4, pp.388-395, 2004 (Released:2004-07-01)
参考文献数
9
被引用文献数
2 4

Problem may arise when the drivers are unable to notice or late in noticing emergency vehicles due to the sealing nature of the vehicles, masking by the car audio system or car navigation operation, which poses a threat for common vehicles and emergency vehicles to collide at many crossing. Every minute, problem may arise at every crossing and it is dangerous to wait for the completion of the information infrastructure system, which requires suitable cost and time. Therefore, we propose a system for common vehicles, which detects emergency vehicles using microphone on-vehicle and produce warning information to the driver. In this research, our focus is for “Ambulance", “Fire Truck" and “Police Car". The siren for these vehicles is detected by means of a microphone on-vehicle. This project utilizes two microphones to in order to detect the direction in which incoming emergency vehicles are present. The system, which we propose, must be helpful to response quickly to emergency and rescue activities.
著者
森山 剛 斎藤 英雄 小沢 慎治
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J82-D2, no.4, pp.703-711, 1999-04-25

本論文では,感情を含むことによって音声に生ずる物理的変動と,そこから 知覚される感情とを線形に対応づけるモデルを提案する. 本モデルでは,日常の感情語と物理パラメータを直接対応づける代わりに, それぞれから抽出した物理的基底及び心理的基底を対応付けに用いている ため,感情語や物理パラメータの選び方に依存しないという特長を有する. また,話し手の抱いた感情ではなく聞き手側に存在する感情のステレオタイプ を基準とすることで,感情を可観測で一般性を有するものとしている. 本研究では統計的な手法を用い,まず種々の感情が含まれた音声の韻律 パラメータと心理実験によって得た主観評価値を用いて,それぞれ物理的 基底(主成分)及び心理的基底(因子)を求めた. 更にこれらの基底空間に写像した物理量及び心理量に重回帰分析を施す ことにより,音声の物理量と感情を双方向に変換することの可能な対応情報 を獲得した.
著者
安増 拓見 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.103, no.295, pp.103-108, 2003-09-01
被引用文献数
2 2

本稿では,画像処理を用いて自車両の後方および死角となる後側方領域において危険車両を検出し,ドライバーヘ警告を促すシステムを提案する.本システムは車線変更時に起こり得る事故や後続車両への配慮のない急ブレーキによって引き起こされる衝突事故を回避するのに,また,暴走車両の早期検知に役立つと考えられる.本システムはレーン検出,車両検出,車両監視の3つの部分に分かれている.レーン検出の部分ではレーン形状の記録と予測により消失点近くまで安定したレーン検出を実現する.車両検出の部分では後続車両の車両前面部分だけを検出する手法を提案する.
著者
神藤 善洋 手島 知昭 荒井 伸太郎 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. ITS (ISSN:09135685)
巻号頁・発行日
vol.110, no.150, pp.7-12, 2010-07-21
参考文献数
1

本稿では,料金所の屋根に設置された定点カメラの画像を用いて交通流解析を行うために必要となる背景画像の動的更新の手法を提案している.従来手法の問題点として,背景画像を直接とるのは現実的ではなく,背景画像の更新が必要である.また,複数のフレームの平均を取るだけでは不十分であることが,従来研究で示されていた.そこで,本手法ではアシスト画像と呼ばれる動物体が頻繁に通過する領域が明るくなっている画像を導入している.これを導入することで車両がほとんど走行していない領域においてのみ平均値と標準偏差を計算することができ,信頼度の高い背景モデルを生成できることを示している.この信頼度の高い背景モデルを用いて,複数のフレームから背景画像らしい画素を求めることによって背景画像を更新する手法を提案している.実験により,走行している車両が背景画像に映り込まないことを確認した.また,従来の手法で問題となった画素値が一様なトラックによる背景画像の劣化が低減できたことを示している.
著者
農宗 千典 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.3, pp.514-523, 1993-03-25
参考文献数
17
被引用文献数
36

単眼視による連続道路画像を処理し,道路中央からの偏位,道路に対するヨー角,ピッチ角,ロール角,路面からの高さという,5自由度カメラ姿勢と,道路のカープ曲率とこう配曲率を含む3次元構造とを,同時に計測する手法を提案する.時変の道路形状パラメータで表現された3次元道路モデルを作成し,前時刻における姿勢パラメータを用いて画像座標系に変換する.そして,モデルと入力画像との対応関係から各姿勢パラメータと道路形状パラメータの変動量を同時推定する.推定は線形方程式で行え,よって高速処理に向く手法である.合成道路画像を用いた定量評価と実画像による実験において,精度の良い推定結果が得られた.従来固定値とされる場合の多かったピッチ角やカメラ高などの推定が,自動操縦の場合重要とされる道路形状や偏位やヨー角の計測精度向上に寄与することも確認された.更に,高速画像処理装置により実時間(30画面/秒)で処理でき,本手法の有効性を確認した.
著者
鈴木 雄仁 斎藤 英雄 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2186-2193, 1997-08-25
被引用文献数
13

現在顔に関する研究がさまざまな分野において非常に重要になっている. これには画像中の顔領域のみを切り出す必要がある. しかし, 従来までの研究では, 任意背景の顔画像に対しては背景のエッジ等に顔の輪郭を誤推定してしまい, 安定に顔領域を抽出できなかった. 本論文では任意背景の顔画像から顔輪郭を推定するために, まず頭部はだ円曲線形状をしており, 頭髪によりその内部は均一な濃度分布になっていると仮定し, 頭部輪郭線に当てはまるだ円を遺伝的アルゴリズムを用いて求める. 次に頭部輪郭線の情報をもとにして顔の顎部分の輪郭線を推定することにより顔領域輪郭の粗推定を行う. そしてこの輪郭線から, SNAKESを用いてより細かな顔輪郭を抽出する手法を提案する. 更に, 本手法を任意背景顔画像に適用してその有用性を示す.
著者
北 健志 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IE, 画像工学
巻号頁・発行日
vol.95, no.582, pp.47-52, 1996-03-15
参考文献数
4
被引用文献数
4

スポーツ中継における自動編集の支援, また自動審判への応用の為の基礎研究として, 本報告では画像処理によるバレーボール中継の解析システムを報告する. コマーシャルを含んだテレビ中継画像を試合の行なわれているシーンとそうでないシーンに分割し, 前者を抽出してそれぞれのサーブの方向から, 全体の得点経過を推定する. また, そのシーン毎に単眼視カメラで撮像されたラリーから, ボールの奥行き, 高さ, コートの白線などの試合進行に関係のある要素を抽出する. そして, ボールとコートの相対関係を3次元的に再構成してボールのコートに対する移動軌跡を求める. 実験の結果, シーン抽出, ボールの移動軌跡共に良好な結果が得られ, 本システムの有効性を確認した.
著者
森山 剛 小沢 慎治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.12, pp.33-38, 2008-02-08
被引用文献数
1

自分の声で好みの歌唱様式を有した歌声を作るには,歌唱を訓練し,歌唱様式を学び,さらに歌声を発する恥ずかしさを克服しなければならず,非常に困難である.そこで,歌詞を朗読するだけで,その音声と楽譜を入力とし,ユーザの声の話者性を損なわずに,自由な歌唱様式を有した歌唱を合成する手法を提案する.本手法により,楽譜さえあれば,どんな曲でも,いつでもどこでも何度でも,自分の声で歌わせることができ,さらにリズムや旋律を工夫してジャズや演歌といったジャンルを演出したり,他人の歌い方を真似したり,音痴を修正したりできる.楽譜を編集する過程で,歌唱様式をどう実現すれば良いか学習でき,また自分が歌う前に,自分が歌った場合のイメージを掴むこともできる.聴取実験により,朗読音声の話者性や歌詞の音韻性を損なわず,歌唱様式の基本となる演奏記号を合成できることが示された.We propose a method of transforming reading speech of lyrics to singing voice. It is capable of realizing favorite style in the transformation, i.e., a specific genre and an expression. Generating singing voice by one's own voice requires the person to train singing, to learn how to realize singing styles, and to overcome hesitation in singing out. The proposed method only requires the user to read the lyrics. It then allows the user to generate singing voice of any music, anytime, anywhere, and any number of times. The user can edit the music for generating a specific singing style, mimicing other's style of singing, and correcting the problematic portion of his or her singing. The user can also learn how to realize a specific style in singing and hear how it sounds when he or she sings on his or her own. Experimental results demonstrated that the proposed method was able to synthesize a comprehensive set of basic indications such as crescendo in the synthesized singing holding the voice quality of the speaker.
著者
小沢 慎治 斎藤 英雄
出版者
慶應義塾大学
雑誌
基盤研究(B)
巻号頁・発行日
2002

本研究はインタラクティブな放送を実現するために、サッカー中継を例に取り上げ、視聴者の意図に適合した視点からの映像を自動的に生成するシステムを開発する事をめざしている。サッカーなど広域にて行われるスポーツにおいてはひとつのカメラですべての動きを撮影することはむずかしく、役割の異なる複数のカメラで撮影して、シーンに適切な映像に切り替えて放送されており、画像処理に基づく自動化が望まれている。視聴者の好みに基づいて視点を選択したいという要求に応える、インタラクティブな映像生成システムを実現することを目的としたもので以下に成果を述べる。多視点撮影環境の構築 複数の解析用の固定カメラはサッカーフィールド全体を取り囲むように設置し、放送用カメラは経験により適切な位置に固定して設置し、試合を撮影するシステムを構築した。サッカーの多視点画像列からの選手およびボールの検出と追跡 フレーム毎のボールの検出にはテンプレートマッチング、フィールド上の選手の検出には背景差分に基づいた抽出手法を用い、フレーム間の追跡を行って軌跡を求めるアルゴリズムを確立した。1台のカメラの画像からボールおよび選手の軌跡の抽出手法は充分な成果をあげている。オクルージョンによる誤りの回避アルゴリズムの開発 1台のカメラの画像処理でオクルージョンが発生した場合には複数のカメラからの画像情報および3次元情報を統合して協調的にボールおよび選手の位置を推測しロバストな追跡を行う手法を開発した。最適視点の決定 ボールおよび選手の追跡情報を評価対象としてそのシーンに最適な視点の放送用カメラを選択する手法を開発した。プレーの判別アルゴリズムの開発 ボールの近傍の選手を検出して、ボールの位置速度情報および選手の動きからパス、シュート、タックルなどのプレーを判別するシステムを構築した。