著者
河井 恒 広瀬 啓吉 藤崎 博也
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.6, pp.433-442, 1994-06-01 (Released:2017-06-02)
参考文献数
19

規則による日本語の音声合成において、高品質の韻律的特徴を生成しうる規則を作成した。この規則は、アクセント型、統語構造、文の焦点などの言語情報から韻律的特徴を表現する記号を生成する。韻律記号は、3種類の休止記号、4種類のフレーズ記号、及び6種類のアクセント記号からなり、音声の基本周波数パターンを生成するために用いられる。統語構造は、文境界、節境界、ICRLB境界などの統語境界によって表され、主として休止記号とフレーズ記号の生成に用いられる。一方、文の焦点は、韻律語の強調/抑圧として表され、アクセント記号の生成に用いられる。規則によって生成された韻律的特徴の正当性を評価するため、規則作成に用いたものとは別の文章を対象として、規則によって生成された韻律上の単位と職業アナウサが発声した自然音声の韻律上の単位との対応関係を調べた。その結果、両者は70〜90%の高い割合で一致しており、合成音声の自然性とあいまって本規則の有効性が示された。
著者
成澤 修一 峯松 信明 広瀬 啓吉 藤崎 博也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.7, pp.2155-2168, 2002-07-15
被引用文献数
18 4

藤崎らによる音声の基本周波数パターン($F_0$ パターン)生成過程のモデルは,少数のパラメータから実測の $F_0$ パターンにきわめて近いパターンを生成しうることが知られており,音声合成に広く用いられている.一方,実測の $F_0$ パターンからモデルのパラメータを抽出することは解析的には解けない逆問題であり,初期値を与え逐次近似を行う必要がある.この場合,高精度のパラメータを迅速に抽出するには適切な初期値の設定が不可欠であるが,従来はこれを人手によって行っていたため,大量の音声資料の自動的処理は困難であった.本論文では,実測の $F_0$ パターンからパラメータの初期値を自動的に決定し,さらにそれに基づいて高精度のパラメータ抽出を自動的に行う手法を提案する.この手法は,実測された $F_0$ パターンをいたるところで連続かつ微分可能な曲線によって近似するための処理,得られた曲線からアクセント指令とフレーズ指令のパラメータの初期値を決定するための処理,さらにそれらの初期値をもとに逐次近似によりパラメータの最適値を求める処理,の3段階の処理からなる.共通日本語の男性・女性話者各1名の朗読音声を対象とした実験の結果,男性の朗読音声について,以前に提案された手法では,パラメータ抽出の性能として,指令の再現率78%,精度67%であるのに対し,提案手法によればそれぞれ82%,80%であった.また,女性の朗読音声については,従来手法では再現率60%,精度51%であるのに対し,提案手法ではそれぞれ83%,72%であった.この結果から,本手法の有効性が実証された.The model for the generation process of the fundamental frequency contours (F0 contours) of speech by Fujisaki et al. is known to be capable of generating F0 contours quite close to observed natural contours, and is widely used in speech synthesis. The extraction of model parameters from an observed F0 contour, however, is an inverse problem that cannot be solved analytically, and requires an iterative process starting from a set of initial parameter values. In order to guarantee a rapid convergence to an optimum solution, the process requires appropriate initial values. These initial values have usually been given manually, making it difficult to analyze a large amount of speech material. The present paper proposes a method for automatically extracting the parameter values from a given F0 contour. The method consists of three steps: approximation of an observed F0 contour by a curve that is continuous and differentiable everywhere, extraction of initial values for the parameters from the curve, and optimization of the parameters by successive approximation. Analysis of read speech material of common Japanese by a male speaker showed that the recall and precision rates of model command estimation reached respectively 82% and 80% by the proposed method, while the rates obtained by a previous method were 78% and 67%, respectively. The recall and precision rates obtained for a female speaker were respectively 83% and 72% by the proposed method, but were respectively 60% and 51% by the previous method. These results demonstrate the validity of the current approach.
著者
藤崎 博 岡山 英史 青戸 泉
出版者
佐賀県玄海水産振興センター
巻号頁・発行日
no.3, pp.43-45, 2005 (Released:2012-12-06)

1.アオナマコの稚ナマコ量産飼育において稚ナマコへの照度の影響を考慮し、飼育時の最高照度を体長4mmまでは2,500lux、体長7mmまでは12,000luxに照度調節して飼育した。2. この結果、体長約2mmまでに発生する大量減耗を防止することができ、平均体長8.7mmの稚ナマコを15m3水槽1水槽あたり平均5.7万個体生産できた。
著者
藤崎 博 岡山 英史 青戸 泉
出版者
佐賀県玄海水産振興センター
巻号頁・発行日
no.3, pp.39-42, 2005 (Released:2012-12-06)

アオナマコの稚ナマコの生残と照度との関係を調べるため、照度500luxl~10,000luxの範囲で、体長0.5mm、2mm、4mmのサイズ別に、10日間試験し、生残率を比較した。1. 10日間の稚ナマコ飼育結果で70%以上の高生残率を示した照度は、体長0.5mmサイズで500lux及び1,000lux区、体長2mmサイズで500lux、1,000lux及び3,000lux区、体長4mmサイズで1,000lux、3,000lux、10,OOOlux(無繁殖)区であった。2. アオナマコの稚ナマコ飼育に好適な照度は、付着珪藻の存在下でほぼ止水に近い状態では、2mmサイズまでは1,OOOlux以下、4mmサイズでは3,OOOlux以下と考えられた。
著者
岩尾 一生 小林 道也 及川 孝司 中駄 優作 藤崎 博子 室谷 光治 伊藤 昭英 辻 昌宏 井出 肇 遠藤 泰 関川 彬 齊藤 浩司
出版者
一般社団法人日本医療薬学会
雑誌
医療薬学 (ISSN:1346342X)
巻号頁・発行日
vol.34, no.2, pp.112-117, 2008 (Released:2009-09-04)
参考文献数
14
被引用文献数
4 1

A questionnaire survey was conducted to investigate the use of health foods among outpatients with diabetes mellitus (DM) at the Health Sciences University of Hokkaido Hospital.Responses were obtained from 69.2% of the patients (180 out of 260).The proportions of patients who had used health foods previously or were using them at the time of the survey were 16.7 and 37.2%,respectively,indicating that more than half of the patients had experience of taking health foods and this was irrespective of sex and age.The most frequently consumed health foods were Aojiru (n=25)followed by Kurozu (n=24)and blueberry extract (n=17).Among the health foods taken,those that influence blood sugar considerably were guava leaves polyphenol (n=16),Gymnema sylvestre extract (n=1),Gymnema sylvestre tea (n=1),and Aloe Vera (n=1).One patient was taking a Chinese health food that contained glibenclamide.Many patients took health foods to keep healthy and as a nutritional supplement,and most of them had not consulted their doctors or pharmacists about the use of health foods.More than 70% of the patients targeted by this study had complications such as hypertension.Since there is a possibility of health foods aggravating DM and its complications and of interactions between them and drugs used to treat DM,doctors,pharmacists and other co-medical workers should provide patients with information on the ingredients of health foods as well the adverse effects that they could have.
著者
藤崎 博也 杉藤 美代子
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.34, no.3, pp.167-176, 1978-03-01 (Released:2017-06-02)

For the purpose of elucidating the relationship between the word accent types and the contours of fundamental frequency (F_0-contour), a model has been presented by one of the authors for the process of generating an F_0-contour from "voicing" and "accent" commands, and has been applied to analyze the F_0-contours of word accent types in the Tokyo dialect. The present study was conducted to test the model's validity for the Kinki dialect, which posesses peculiar accent types not found in the Tokyo dialect (Table 1), and also to examine the perceptual significance of parameters of the model. The speech materials were the utterances of two-mora [ame] pronounced in all four accent types of the Osaka dialect (Table 2) by a male informant. Extraction of F_0-contours (Fig. 1) and their parameters were conducted with a digital computer. Using a functional model for generating the F_0-contour(Figs. 2 and 3), parameters were extracted from six utterances each of the accent types, by finding the best match between the observed and generated F_0-contours (Table 3). The close agreement between the observed and generated contours proved the model's validity for the Kinki dialect (Fig. 4). While the magnitude and rate of responses to voicing and accent command are considered to characterize the laryngeal functions of a speaker, the timing parameters of the accent command, i. e. the onset and the end, are found to be specific to each accent type, and can clearly separate the four accent types (Fig. 5). The perceptual relevance of these timing parameters was examined by the identifications tests of accent types using 40 synthetic speech stimuli consisting of both typical stimuli of the four accent types and intermediate stimuli, generated by systematicallyvarying the timing parameters of the accent command. The subjects were 10 speakers of the Osaka dialect and two speakers of the Tokyo dialect. The perceptual boundary between two accent types was determined for each subject (Fig. 6), which was quite clear-cut and almost agreed in all the subjects (Fig. 7), indicating the perceptual importance of these timing parameters in the identification of accent types. Further experiments using stimuli with systematic shifts in the timing of formant frequency patterns indicated that the relative timing of the accent command and the segmental features of a particular phoneme is quite important for the identification of a specific accent type (Figs. 8 and 9), but not necessarily for other types. These results indicate that the perception of word accent requires specification of certain features for temporal units which are smaller than mora, which is commonly accepted as the suprasegmental unit of spoken Japanese.
著者
河井 恒 広瀬 啓吉 藤崎 博也
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.6, pp.433-442, 1994-06-01
参考文献数
19
被引用文献数
8

規則による日本語の音声合成において、高品質の韻律的特徴を生成しうる規則を作成した。この規則は、アクセント型、統語構造、文の焦点などの言語情報から韻律的特徴を表現する記号を生成する。韻律記号は、3種類の休止記号、4種類のフレーズ記号、及び6種類のアクセント記号からなり、音声の基本周波数パターンを生成するために用いられる。統語構造は、文境界、節境界、ICRLB境界などの統語境界によって表され、主として休止記号とフレーズ記号の生成に用いられる。一方、文の焦点は、韻律語の強調/抑圧として表され、アクセント記号の生成に用いられる。規則によって生成された韻律的特徴の正当性を評価するため、規則作成に用いたものとは別の文章を対象として、規則によって生成された韻律上の単位と職業アナウサが発声した自然音声の韻律上の単位との対応関係を調べた。その結果、両者は70〜90%の高い割合で一致しており、合成音声の自然性とあいまって本規則の有効性が示された。
著者
藤崎 博也 須藤 寛
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.445-452, 1971-09-10 (Released:2017-06-02)
被引用文献数
2

Prosodic features in speech can be interpreted as responses of the underlying mechanisms to a set of linguistic commands. This paper presents a quantitative model for the mechanisms of generating fundamental frequency contours of word accent of standard Japanese. All the types of word accent of standard Japanese are characterized by the existence of a transition in the subjective pitch, either upward or downward, at the end of the initial mora, and by the fact that no more than one downward transition is allowed within a word. Table 1 lists are patterns of subjective pitch of all the possible accent types of words that consist of up to 5 morae. These binary patterns, however, never manifest as such in the fundamental frequency contours. Analysis of utterances of a number of speakers (Fig. 1) indicates that the logarithmic fundamental frequency contours of the same word accent, when normalized both in time and in frequency, are essentially similar(Fig. 2 and Fig. 3). These observations lead to the model of Fig. 4 based of the following assumptions:(1) Each type of word accent can be characterized by a unique logarithmic contour. (2) Commands for voicing and accent take the form of binary input to the system. (3) Separate mechanisms exist for voicing and accent, which can be approximated by linear system that convert the binary commands into the respective control signals(Fig. 5). (4) These control signals are combined and applied to the mechanism of glottal oscillation, whose fundamental frequency is an exponential function of the control signal. (5) The glottal mechanism shows hysteresis specified by the onset and cessation of the oscillation(Fig. 6). In order to investigate the validity of the model, fundamental frequency contours of various utterances of isolated words were extracted by a Computer program(Fig. 7) and were analyzed by the method of Analysis-by-Synthesis(Fig. ). A few examples of the comparison of the extracted fundamental frequency contour and its closest approximation obtained by the A-b-S procedure are shown in Fig. 9
著者
成澤 修一 峯松 信明 広瀬 啓吉 藤崎 博也
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.7, pp.2155-2168, 2002-07-15

藤崎らによる音声の基本周波数パターン($F_0$ パターン)生成過程のモデルは,少数のパラメータから実測の $F_0$ パターンにきわめて近いパターンを生成しうることが知られており,音声合成に広く用いられている.一方,実測の $F_0$ パターンからモデルのパラメータを抽出することは解析的には解けない逆問題であり,初期値を与え逐次近似を行う必要がある.この場合,高精度のパラメータを迅速に抽出するには適切な初期値の設定が不可欠であるが,従来はこれを人手によって行っていたため,大量の音声資料の自動的処理は困難であった.本論文では,実測の $F_0$ パターンからパラメータの初期値を自動的に決定し,さらにそれに基づいて高精度のパラメータ抽出を自動的に行う手法を提案する.この手法は,実測された $F_0$ パターンをいたるところで連続かつ微分可能な曲線によって近似するための処理,得られた曲線からアクセント指令とフレーズ指令のパラメータの初期値を決定するための処理,さらにそれらの初期値をもとに逐次近似によりパラメータの最適値を求める処理,の3段階の処理からなる.共通日本語の男性・女性話者各1名の朗読音声を対象とした実験の結果,男性の朗読音声について,以前に提案された手法では,パラメータ抽出の性能として,指令の再現率78%,精度67%であるのに対し,提案手法によればそれぞれ82%,80%であった.また,女性の朗読音声については,従来手法では再現率60%,精度51%であるのに対し,提案手法ではそれぞれ83%,72%であった.この結果から,本手法の有効性が実証された.
著者
横田 和章 阿部 賢司 藤崎 博也
雑誌
全国大会講演論文集
巻号頁・発行日
vol.51, pp.1-2, 1995-09-20

近年、計算機のハードウェアの進歩に伴い、ワープロのかな漢字変換や構文チェック機能など、自然言語の解析処理が実用化されつつある。しかし、これらの機能は構文+浅い意味情報に基づいており、人間による修正無しでは満足な結果が得られない。一方、より良い結果を得るため、文の深い意味を調べる方法も報告されているが、この方法では、解析に使う知識をあらかじめ明示的に組み込んでおかなければならない。このため、処理対象となる話題を限定しないと、組み込むべき知識が膨大になって統一がとれなくなり、実現困難となる欠点を持つ。そこで、コーパスから言語的知識を獲得する方法が最近注目されている。この方法では知識をあらかじめ書き込んでおかなくても、獲得により性能を向上できる特徴を持つ。また、新しい話題に対しても、獲得により対応できる。本稿では、この様な見地から、コーパスに基づいて日本語文法を自動獲得する方法について報告する。
著者
国信 真吾 藤崎 博志 富永 浩之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. ET, 教育工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.437, pp.55-60, 2006-12-08
被引用文献数
2

本研究室では,授業中の多様な試験に対応する記入式Web試験DrilLs-Fを開発している.DrilLs-Fでは,小問形式の大量の問題から,分野と難易度を指定して,ランダムに出題する.これまで,情報数学やC言語演習など,情報系学科での基礎科目で数年に亘って運用してきた.実施履歴を分析すると,大量の同時アクセスによる試験実施の遅延,マルチメディア出題におけるデータ転送の負荷,ページ遷移の不備による不適切な受験などの問題点が認められた.現在,これらの検討課題に対応するため,サーバ側の機能のモジュール化による試験実施の垂直分業に取り組んでいる.本論では,垂直分業のモデルを提示し,セッション管理とモジュール間通信の手法について述べる.また,クライアント側への処理の移行として,スタンドアロン対応の自宅試験を実装した.
著者
藤崎 博也 須藤 寛
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.445-452, 1971-09-10
被引用文献数
42

Prosodic features in speech can be interpreted as responses of the underlying mechanisms to a set of linguistic commands. This paper presents a quantitative model for the mechanisms of generating fundamental frequency contours of word accent of standard Japanese. All the types of word accent of standard Japanese are characterized by the existence of a transition in the subjective pitch, either upward or downward, at the end of the initial mora, and by the fact that no more than one downward transition is allowed within a word. Table 1 lists are patterns of subjective pitch of all the possible accent types of words that consist of up to 5 morae. These binary patterns, however, never manifest as such in the fundamental frequency contours. Analysis of utterances of a number of speakers (Fig. 1) indicates that the logarithmic fundamental frequency contours of the same word accent, when normalized both in time and in frequency, are essentially similar(Fig. 2 and Fig. 3). These observations lead to the model of Fig. 4 based of the following assumptions:(1) Each type of word accent can be characterized by a unique logarithmic contour. (2) Commands for voicing and accent take the form of binary input to the system. (3) Separate mechanisms exist for voicing and accent, which can be approximated by linear system that convert the binary commands into the respective control signals(Fig. 5). (4) These control signals are combined and applied to the mechanism of glottal oscillation, whose fundamental frequency is an exponential function of the control signal. (5) The glottal mechanism shows hysteresis specified by the onset and cessation of the oscillation(Fig. 6). In order to investigate the validity of the model, fundamental frequency contours of various utterances of isolated words were extracted by a Computer program(Fig. 7) and were analyzed by the method of Analysis-by-Synthesis(Fig. ). A few examples of the comparison of the extracted fundamental frequency contour and its closest approximation obtained by the A-b-S procedure are shown in Fig. 9