著者
壹岐 将也 金城 寛 大城 尚紀
出版者
信号処理学会
雑誌
Journal of Signal Processing (ISSN:13426230)
巻号頁・発行日
vol.17, no.3, pp.81-86, 2013-05-25 (Released:2013-05-25)
参考文献数
10
被引用文献数
1

This paper presents a method of maturity detection of the tropical fruits using a smell sensor. We investigate many sensing data of different fruits and find out that the data of the fruits are characterized as a first-order lag element. The first-order lag element has two parameters: gain and time constant. Knowing the gain and time constant of the smell data is useful for detecting the maturity of the fruits. In this paper, we apply a genetic algorithm to identify the gain and time constant parameters for the sensing data. Experiments of the maturity detection for monkey bananas and guavas show good results.
著者
鵜木 祐史
出版者
信号処理学会
雑誌
信号処理 (ISSN:13426230)
巻号頁・発行日
vol.12, no.5, pp.339-348, 2008-09
被引用文献数
4

私達は,日常,何不自由なく音声を介してコミュニケーションをとっている。しかし,読者はこんな経験をしたことはないだろうか。例えば,お風呂場や教会など音が非常に響く環境(残響環境)や,人で賑わっている雑多な場所,交通量の多い場所といった非常に騒がしい環境(騒音環境)では,静寂な環境に比べて非常に音を聴き取り難く,いつもと同じように簡単に会話をできないと感じたことである。これは,身の回りの音場環境の影響により,音声が歪んだため,音声知覚に重要な情報が欠落したことによるものである。このような音声コミュニケーションの難しさを評価する尺度として,音声明瞭度,単語・文章了解度が利用されている。前者は無意味音節を発声したとき受聴者がその何%を正しく聞き取れたかを,後者は沢山の有意味単語を発声したとき受聴者が正しく聞き取れた単語数の割合を示すものである。これらの尺度は,音声情報伝達を議論するときに,よく利用されるものであるが,同時に室内音饗学と関係して議論されるとき,音声レベル,騒音レベル,残響時間等の物理量との関連を見出そうとする検討も古くから行われている。代表的なものとして,Houtgast とSteeneken によって提唱された変調伝達関数(Modulation Transfer Function:MTF)に基づく音声明瞭度予測理論がある。これは,音場内において,音声波形の時間的な包絡線情報(以後,エンベロープと呼ぶ)が残響や雑音によって変形することに着目し,100%振幅変調した正弦波を利用してMTFの減衰量から音声伝達指標(SpeechTransmission Index: STI)を予測するものである。この方法は,その後,簡易測定法であるRASTIとして提案され,現在でも標準的な方法として利用されている。STI/RASTI の方法は,理論的に明解であり,実用上多くの利点をもつため,講演会場など室内音響設計にも役立っている。しかしながら,この方法は決して万能であるわけではなく,(1) 音場の時間構造・空間構造を反映していないことや(2) 音源(音声)の物理特性を反映していないことから,音声明瞭度予測に対して適用限界があることが示唆されている。Houtgast とSteeneken が提唱した音声明瞭度予測理論は,室内音響を拡散音場と仮定しているため,上記のように,その適用限界があることは間違いない。しかしながら,室内音響伝達系を入出力の強度情報の関係と残響・雑音に対するMTF を明解に関係づけた点は,大きな業績であり,評価されることであろう。また,この考えは,他の音声信号処理で残されている諸問題を解決するために利用することもできる。例えば,室内の残響の影響を受けた音声を伝達系を測定せずに回復する方法 や,残響環境下での音声の基本周波数推定方法がある。最近では,室内の残響時間をブラインド推定する方法や異なる二つの音場空間を考慮した音場再生法も提案されている。本論文は,合計3回のシリーズで構成される。これらでは,著者が関係した研究分野(残響環境下の音声信号処理)を中心に,MTF を利用した音声信号処理を解説する。本稿では,まず,Houtgast とSteeneken が示したMTF の概念を解説するとともに,その概念に基づいたパワーエンベロープ逆フィルタ法を紹介する。
著者
Zhi Zhu Katsuhiko Yamamoto Masashi Unoki Naofumi Aoki
出版者
信号処理学会
雑誌
Journal of Signal Processing (ISSN:13426230)
巻号頁・発行日
vol.18, no.6, pp.303-307, 2014-11-25 (Released:2014-11-25)
参考文献数
7

Speech scrambling aims to eliminate intelligibility of original speech in order to preventing eavesdropping and copyright infringement. There is, however, a problem in that completely recovering scrambled speech into the original speech cannot be achieved with conventional methods. In this paper, we propose a speech scrambling method that uses the random-bit-shift of quantization bits with common keys. We evaluated the confidentiality and efficiency of the proposed method by using two objective measures, SER and PESQ. As a result we confirmed that speech signals can be scrambled into completely unintelligible sounds with the proposed method. Moreover, it is possible to restore a scrambled speech signal into the original one completely. In addition, we also confirmed that the scrambled speech signal could not be descrambled correctly with the wrong key.
著者
Katsuhiko Yamamoto Zhi Zhu Masashi Unoki Naofumi Aoki
出版者
信号処理学会
雑誌
Journal of Signal Processing (ISSN:13426230)
巻号頁・発行日
vol.18, no.4, pp.205-208, 2014-07-30 (Released:2014-07-30)
参考文献数
10

Speech scrambling methods are widely used for copyright protection and encrypting digital speech signals in order to guarantee the confidentiality of the original signals. They are very important methods for preventing eavesdropping and unauthorized copying. However, it seems to be impossible to completely recover a scrambled speech signal into the original signal. Moreover, nobody can comprehend the partial speech content from speech signals scrambled with these methods. In this paper, we propose a semi-scramble method for speech signals based on phonemic restoration. By using a speech scrambling method based on the random-bit shift of quantization bits, speech signals are converted to scrambled signals in partial intervals. We evaluated the confidentiality and efficiency of the proposed method by using two objective measures, signal-to-error ratio (SER) and perceptual evaluation of speech quality (PESQ). As a result, we confirmed that the proposed method can play a role in copyright protection for an original signal and recover a semi-scrambled speech signal into the original one. Finally, we indicated that the acoustic characteristics of signal semi-scrambled with the proposed method enable the listener to understand the speech information.
著者
長谷川 弘 木下 健太郎 岸田 悟
出版者
信号処理学会
雑誌
Journal of Signal Processing (ISSN:13426230)
巻号頁・発行日
vol.18, no.1, pp.29-38, 2014-01-25 (Released:2014-01-25)
参考文献数
26
被引用文献数
1

We construct a speaker authentication system, where 3-layerd neural networks with ensemble learning algorithm are used, and investigate the effect of ensemble learning on the performance of the system. From the results, we found that the authentication rates of the system for a person became to 100% by using ensemble learning. Therefore, the new ensemble leaning used in this study is thought to be useful for the speaker authentication system with layered neural networks. In addition, a new multi-step authentication system for many persons by extending the system for a person was suggested. In the system, the ensemble learning was also useful for the speaker authentication system of neural networks for many persons.