著者
中川 聖一 神谷 伸 坂井 利之
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J64-D, no.2, pp.116-123, 1981-02-25

本論文は,不特定話者の音声自動認識のための個人差,特に年齢・性別が同一層である話者間の個人差の正規化法について述べる.まず,パターンマッチング法で,個人差によるパターン変動に対処するためには,個人差に関する何んらかのモデル・構造を導入する必要のあることを述べる.これに基づいて,音声スペクトルの周波数軸上とスペクトル強度軸上での非線形なマッチングによる正規化法を提案し,この手法を10数字音声の認識に適用する.更に,この手法は,キーワードを用いた話者適応化にも有効であることを示す.最後に,標準パターンの選択法について述べ,これにより不特定話者に対して安定な認識率を得ることができることを示す.本手法により,不特定男性話者30名の10数字音声に対して,約97.6%の認識率を得ることができた.
著者
作田 泰隆 川本 祐大 渡辺 将史 後藤 富朗 平野 智 桜井 優
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.3, pp.686-694, 2013-03-01

本論文では,Total Variation(TV)正則化を用いた高画質・高速な超解像拡大手法を提案する.TV正則化を応用した超解像手法はリンギングを発生させず,エッジの鮮鋭化を効果的に実現する手法であり,事例学習法を組み合わせることで細かい模様(テクスチャ)の再構成も実現する有望な手法である.しかし,TV正則化を応用した拡大手法は反復非線形演算により計算時間が増大し,画質を維持した大幅な高速化が困難とされており,動画像などへの応用が難しいという問題がある.そこで本論文では,TV正則化を応用した拡大手法に効果的なエッジ鮮鋭化フィルタであるShock Filterを用いた新方式を提案し,従来の各手法と比較して大幅な計算時間の削減,または画質の改善に成功した結果を報告する.
著者
熊本 忠彦 灘本 明代
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.500-509, 2017-04-01

Twitterでは他のユーザをフォローすると,そのユーザ(フォロイー)のツイートが自分のタイムライン(TL)に表示されるようになる.そのため,自分と同じ興味や趣味についてツイートしているユーザをフォローすることで,自分のTLを充実させることも可能である.しかしながら,Twitterには数多くのユーザが存在しているため,その中からフォローしたくなるようなユーザ(フォロイー候補)を探し出すのは面倒な作業といえる.この問題を解決するために,従来から様々なフォロイー推薦手法が提案されている.これまでの研究では,ツイートの話題が似ているユーザをフォロイー候補として推薦する場合が多いが,ツイートの話題が似ているからといって,その話題に対する感情的態度(若しくは感情的傾向)も似ているとは限らない.そこで本論文では,共通の話題があり,かつその共通の話題に対して似たような感情的態度を示しているユーザをフォロイー候補として推薦する手法を提案する.なお,本論文では,ユーザの感情的態度を表すための感情軸として,「喜・好」,「安」,「昂」,「哀」,「怖」,「怒・厭」,「驚」,「恥」の8軸を採用する.
著者
Shigeki MATSUDA Teruaki HAYASHI Yutaka ASHIKARI Yoshinori SHIGA Hidenori KASHIOKA Keiji YASUDA Hideo OKUMA Masao UCHIYAMA Eiichiro SUMITA Hisashi KAWAI Satoshi NAKAMURA
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE TRANSACTIONS on Information and Systems (ISSN:09168532)
巻号頁・発行日
vol.E100-D, no.4, pp.621-632, 2017-04-01

This study introduces large-scale field experiments of VoiceTra, which is the world's first speech-to-speech multilingual translation application for smart phones. In the study, approximately 10 million input utterances were collected since the experiments commenced. The usage of collected data was analyzed and discussed. The study has several important contributions. First, it explains system configuration, communication protocol between clients and servers, and details of multilingual automatic speech recognition, multilingual machine translation, and multilingual speech synthesis subsystems. Second, it demonstrates the effects of mid-term system updates using collected data to improve an acoustic model, a language model, and a dictionary. Third, it analyzes system usage.
著者
吉澤 貴拓 善甫 啓一 中林 紀彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.510-519, 2017-04-01

アパレル業界における販売予測は,機会損失や在庫コストを減らすために重要な役割を担っており,今までも多く研究がなされてきたが,実際のアパレル業界の現場においては人の「経験と勘」に従ってオペレーションが行われている.高精度な予測手法であっても現場の人々にとって予測結果をオペレーションへ活用させづらいことがある.そこで本研究では,現場における意思決定をサポートするための予測アルゴリズムの開発を目指しており,その中で本論文では,現場でも着目をされている売上の周期性に着目し,フーリエ変換を用いた販売予測アルゴリズム提案と精度検証を行った.結果として,提案したアルゴリズムがSARIMAモデルと比較して良い予測が可能であることを確認し,周波数成分を特徴量として用いた予測アルゴリズムの有用性を示した.
著者
松原 靖子 櫻井 保志 Christos FALOUTSOS
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.457-471, 2017-04-01

本論文では,大規模オンライン活動データのための非線形解析手法であるECOWEB (Ecosystem on the Web)について述べる.本研究では,“Xbox”, “PlayStation”, “Wii”等のオンライン検索キーワードの出現件数に関する時系列データが与えられたとき,それらのキーワード間の潜在的な関連性や競合性,そして季節性等の重要なパターンを自動抽出することを目的とする.より具体的には,オンラインユーザ活動の推移パターンを,自然界の生態系における種内・種間競争として捉えることで,潜在的なユーザ資源(ユーザの興味,時間等)を各アクティビティ(Xbox等のキーワード)がどのように共有,あるいは競合しているかを非線形動的システムとして表現する.実データを用いた実験では,ECOWEB が様々なオンライン活動における長期的な非線形パターンや季節性等の重要なトレンドを発見し,更に,長期的な将来予測を高精度に行うことを確認した.
著者
能勢 隆
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.556-569, 2017-04-01

HMM音声合成に代表される統計モデルに基づくテキスト音声合成は,モデルがコンパクトであるにもかかわらず,従来の波形接続方式に比べて少ない音声データで音声に含まれる話者性や感情表現・発話様式(スタイル)を合成音声に反映することができる手法として急速に利用が広まっている.本論文では,HMM音声合成を中心とし,話者やスタイル,声質を多様化する手法についてそのアイデアや実験結果なども含めて解説を行う.HMM音声合成ではスペクトルや韻律特徴量がモデル内の各状態の分布パラメータとして表現されるため,モデルパラメータの操作,モデルの拡張が容易であり,様々な多様化手法が提案されている.代表的な話者の多様化手法として話者適応,話者補間,話者強調について,またスタイルの多様化手法としてスタイルモデリング,スタイル適応,スタイル補間,スタイル制御,スタイル変換について基本的な枠組を説明する.更に声質の制御法や話し言葉音声についても概説し,今後の課題や展望について述べる.
著者
上田 博唯 宮武 孝文 吉澤 聡
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J75-D2, no.2, pp.216-225, 1992-02-25

映像を中心とするマルチメディアの自由な編集・作成という,ユーザの創造的活動を支援する環境を実現するための新しいアプローチを提案し,プロトタイプの試作結果について報告する.このアプローチの特徴は音声や画像の処理・認識技術を応用して,映像情報の時間・空間構造を一貫性のある形で視覚化して,それをダイレクトマニピュレーションできるようにすることにある.これによりユーザは対話的に映像素材を編集できる.プロトタイプでは,まず自動カット分割機能とカットの内容解析機能の一部を開発した.そしてこれらの機能によりアイコン化されたカットを用いた映像の構造の視覚化を実現し,その上でカット・アイコンのダイレクトマニピュレーションによる時間軸編集を実現した.また,画像中の対象物の抽出についても実験的な機能を組み込み,そのユーザにとってのメリットについて検討した.これらの結果により,本アプローチの有用性と妥当性が示された.
著者
アモーンタマウット プラウィーン 早川 栄一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.3, pp.341-352, 2017-03-01

Internet of Things (IoT)はセンサ・アクチュエータを備えた組込みシステムとサーバ群とをネットワークを介して接続するシステムである.IoTの開発においては,多様な組込みシステムを扱い,ネットワークによるデータ通信を行うことから,デバイスプログラミングやテスト,ネットワークのモニタリングを容易に行える開発環境が必要になる.本研究は,Webブラウザ上で容易にコーディング及び,通信データのモニタリングが可能な開発環境を構築した.本環境の特徴は次のとおりである:(1)コマンドベース及びスクリプト言語によるデバイスのコーディングが可能,(2)タイムスタンプを含めた通信データのトレース及び閲覧が可能,(3)複数の組込み機器のアクセス状況の閲覧が可能.
著者
照屋 大地 宮崎 大智 中條 拓伯
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.3, pp.287-297, 2017-03-01

複数の高速なデータ入力とインターネットへのデータ出力が必要となる組み込みシステムのプロトタイピングのためのフレームワークPyJerを提案した.PyJerを用いた開発では汎用の高位合成ツールとメモリアクセスチューニングのための高位合成ツールを組合せそれぞれの利点を活かすことが可能となる.これによってSoCを用いた組み込みシステムの高速なプロトタイピングが実現できる.複数ツールの使用に起因する複雑なビルド手順の自動化を行い,開発サイクルの短縮を可能とした.またPyJerによってセンサ入力の並列化を行ったアプリケーションのプロトタイピングを行い,ハードウェア使用率の低いこと,CPUを用いた実装と比較してパフォーマンスの向上が期待できることを確認した.
著者
山元 翔 赤尾 優希 室津 光貴 前田 一誠 林 雄介 平嶋 宗
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.1, pp.60-69, 2017-01-01

筆者らは単文統合型の作問学習支援システムを加減算と乗算の領域で設計・開発し,システムが問題の構造理解に有用であることを確認してきた.本研究では学習の次の段階として,システムを乗除算の領域に拡張することが目的である.ただし,システムは単に加減を乗除に置き換えて実現できるものではなく,対象とする乗除算文章題の構造モデルを作成し,モデルに基づいたシステムの設計が必要となる.このモデルを提案し,作成したシステムを授業に組み込むことで,単文統合型の作問学習による乗除算算数文章題の教授が実現した.この効果を,対象領域を学習した小学生に対して11時限に及ぶ実践利用から検証した結果,対象授業が問題なく受け入れられ,特に構造理解の不十分な学習者に対して成績の向上が見られたので報告する.
著者
北森 詩織 酒井 浩之 坂地 泰紀
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.2, pp.150-161, 2017-02-01

本論文では,企業の決算短信PDFから,今後の業績に関する記述がある文を抽出する手法を提案する.近年,証券市場における個人投資家の比重が増大しており,個人投資家に対して投資判断の支援をおこなう技術の必要性が高まっている.そのため,人工知能分野の手法や技術を,金融市場における様々な場面に応用することが期待されており,例えば,膨大な金融情報を分析して投資判断の支援を行う技術が注目されている.ここで,投資の際,投資家にとって重要なのは,企業の今後の業績予測を知ることである.なぜなら,現在の業績が赤字であったとしても,今後の業績が回復することが企業側から示されれば,株価は上昇する場合がある.そこで,本研究では,企業の決算短信PDFから,業績予測文(企業の今後の業績予測を示す文)を抽出する手法を提案する.本手法では,業績予測文の文頭と文末に特徴的に出現する表現を用いることで,業績予測文を抽出する.加えて,これらの特徴的な表現を,半自動的に収集することが可能な手法となっており,業績予測文を幅広く網羅できる.
著者
岡本 学 三好 正人 渡辺 好章
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J86-A, no.8, pp.817-823, 2003-08-01

可聴音で振幅変調した超音波振動を耳珠等の耳周辺軟骨へ加えると,その可聴音が聴取される.この現象を用いるヘッドホンシステムについて,その音質(音圧・周波数特性)と可聴音伝達経路の検討を行った.ラウドネスバランスより推定された可聴音特性は被験者の外耳道内に発生する可聴音の特性によく一致しており,3~4 kHz以下の帯域においてはほぼ6~8 dB/oct.の傾きをもつ.耳珠から外耳道内へ至る超音波振動の伝達過程で,音響的非線形により復調される可聴音波を主に知覚していると思われる.
著者
廣瀬 明 丁 天本
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 C (ISSN:13452827)
巻号頁・発行日
vol.J98-C, no.10, pp.184-192, 2015-10-01

本論文は,複素ニューラルネットワークのエレクトロニクスでの利点を,概念的な側面と具体的な例示によって議論する.本質的に複素ニューラルネットワークは波動を扱う際に有効な汎化特性をもつ.複素数の実2 × 2行列表現を見ながらこれを論じる.また具体例として,通信チャネルを一つの複素実体として捉えて移動体通信のチャネル予測に複素ニューラルネットワークを適用する場合を挙げ,その優位性と背景にある考え方を述べる.
著者
渡邊 実 佐野 健太郎 高前田 伸也 三好 健文 中條 拓伯
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 B (ISSN:13444697)
巻号頁・発行日
vol.J100-B, no.1, pp.1-10, 2017-01-01

近年,FPGAは家電製品,自動車,そして宇宙システムと幅広い用途に使用されている.しかし,2000年代前半まで,FPGAはASICと比較して性能が低く,試作,テスト,研究用途に用いられただけで,量産品に対してはコストあたりの性能に秀でたASICが多用されてきた.これが変わるのが2000年代後半であり,FPGAは最先端のプロセスが利用できる数少ない集積回路の一つとなり,高性能な製品を生み出す主役の座に躍り出た.その代表的なものの一つにFPGAを利用したハードウェア・アクセラレータがあり,その有効性については,MicrosoftがBing検索に用いるデータセンターに対してFPGAを用いたサーバーを開発したり,Intel社がXeonプロセッサにFPGAを実装する等,もはや疑う余地がなくなったと言える.そして今日,FPGAベンダーは開発に多大な工数を要したハードウェア記述言語(HDL)の代わりに,C++からFPGAへの回路実装が可能な汎用的な高位合成ツールの提供を開始している.このような皆高位合成ツール時代のFPGA開発において,各企業が他社との優位性を確保するためには,これら万人向けに作られた汎用高位合成ツールやベンダーから提供されるHDL開発環境等を活用するだけでなく,汎用ツールの弱点を補完でき,より高性能な製品をより少ない工数で開発できる特定用途向けのツール群が必要になる.本論文では既に広く有効性が認知された汎用的な高位合成ツールではなく,まだ認知度が低いが日本で独自に開発が進められる「日の丸」ツール群を紹介する.
著者
Nobuaki MINEMATSU Ryuji KITA Keikichi HIROSE
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE TRANSACTIONS on Information and Systems (ISSN:09168532)
巻号頁・発行日
vol.E86-D, no.3, pp.550-557, 2003-03-01

Accurate estimation of accentual attribute values of words, which is required to apply rules of Japanese word accent sandhi to prosody generation, is an important factor to realize high-quality text-to-speech (TTS) conversion. The rules were already formulated by Sagisaka et al. and are widely used in Japanese TTS conversion systems. Application of these rules, however, requires values of a few accentual attributes of each constituent word of input text. The attribute values cannot be found in any public database or any accent dictionaries of Japanese. Further, these values are difficult even for native speakers of Japanese to estimate only with their introspective consideration of properties of their mother tongue. In this paper, an algorithm was proposed, where these values were automatically estimated from a large amount of data of accent types of accentual phrases, which were collected through a long series of listening experiments. In the proposed algorithm, inter-speaker differences of knowledge of accent sandhi were well considered. To improve the coverage of the estimated values over the obtained data, the rules were tentatively modified. Evaluation experiments using two-mora accentual phrases showed the high validity of the estimated values and the modified rules and also some defects caused by varieties of linguistic expressions of Japanese.
著者
坂田 一志
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J57-D, no.5, pp.284-291, 1974-05-25

あるソフトウエア(コンピュータシステムにおけるハードウエアに対し,製品としてのプログラム群の総称)に含まれるバグの個数は,マクロに考えた場合,プログラム中に潜在するバグの数を統計的に処理し,又推定することができる.ソフトウエアを製品として出荷する際に,従来から検査を実施しているが,更に一歩すすめて,製造過程に検査と類似の作業を実施し,その時点での品質推定を行うことを動的な予測:先取り評価手法(Quality Probe)〔QP〕と呼称して実施した.本論文では,QPを実施するにあたり,サンプリングの方法,製造過程における実施時期,実施回数,品質の評価方法,について述べた.次にこの手法を用いての実施例をあげ,これにより実際のバグ数の推定を行い,生産工程のフォローアップ,製造完了日の推定,を行うなどにより,ソフトウエア製作上,極めて有効な手段であることを確認した.
著者
勝谷 紀子 東 るみ子
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.12, pp.1154-1157, 2016-12-01

大学生を対象に質問紙調査と小論文課題を行い,ソーシャルネットワーキングサービス(SNS)の利用実態,SNSの利用行動と共感性の関係,SNSの不適切な利用に対する考えの特徴を明らかにした.結果を踏まえて今後求められる情報モラル教育実践を考察した.
著者
森田 正典
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J70-D, no.11, pp.2047-2057, 1987-11-25

まず,入力の対象となる日本文の特徴,入力方式に関係する人間工学的要素,および入力方式として望ましい条件の3者を明確にした.上記3要件を踏まえて,最適の日本文入力方式は何であるかを追求した結果,日本文入力用に最適化したローマ字方式である通称M方式が最も優れているとの結論を導いた.M方式の特徴は,子音キーと母音キーを,右手と左手に分類してそれぞれを50音順に配置し,漢字入力の際の打鍵数節減のための特別な複合キーを配置して,漢字入力の高速化を図ったことである.一方鍵盤方式としては,現在一般に使用されているキーボードの欠点を明確にし,筆者らが,それらの欠点を改善のために努力して改善を重ねてきた各種の製品を紹介し,最新型の鍵盤方式としては,仮想キー方式の採用によって機能キーの数を減少させ,常時頻繁に使用する機能キーのみを左右の手の形に合わせたデータキーの周辺に配置した,左右分離型の鍵盤を紹介している.