著者
剣持秀紀
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013, no.26, pp.1-1, 2013-08-24

歌声合成技術は楽曲制作に幅広く用いられるようになってきている.また特に若い層を中心に,そのような楽曲 (いわゆる 「ボカロ曲」 ) を愛聴する人々も多い.なぜ人間の歌声でなく,合成された歌声が使われ,聴かれるのかについて考えてみたい.併せて歌声合成技術 VOCALOID の現在の仕組み (システム) について解説し,その将来の展開について述べる.
著者
安部 城一 坂村 健 坂前 和市 相磯 秀夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.20, no.4, pp.306-313, 1979-07-15

この論文はソフトウェア作成プロジェクトの管理破綻を防止することを目的とし プログラムテスト項目数 検出バグ数 作業日の間の関係を示すPB曲線図により総合デバグ時の進捗度を把握する方法を示している.さらにPB曲線に現れるプロジェクトの性質について論じ 管理破綻の検出方法を提案している.ソフトウェア作成をプランニング期 プログラミング期総合デバグ期と大きく三段階に時分割した場合 プロジェクトの管理が破綻すると判明するのは総合デバグ期であるという実態に注目し 総合デバグ期におけるテスト項目数 検出バグ数 および時間の間の関係は一般的にモデルにより取扱うことができることを示している.このモデルの上の特性値が示す傾向からプロジェクトの破綻を判定する方法を提案し さらに総合デバグ期を初期 中期 終期の三段階に分け 期間 テスト項目数およびバグ数の間の性質10件を示すことによりプロジェクトの最終段階における工程計画ならびに進捗度管理の信頼度を向上する材料を提供している.またこの結果はソフトウェアの分野や規模によらずある程度の普遍性があることを述べている.判定方法の提案と共に過去の破綻例の原因について分類行い 原因の偏りと性質を分析し 一部の原因について対策が可能であるとしている.
著者
小出 明弘 斉藤 和巳 風間 一洋 鳥海 不二夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.6, no.2, pp.164-173, 2013-08-21

本稿では,Twitterのフォローネットワークを分析することにより,ユーザのフォローがどのような目的で行われているのか議論する.まず,フォローネットワークの特徴を把握するため,ネットワーク内の高次数ノードに着目し,ブログの読者関係とレビューサイトのお気に入り関係を表したそれぞれのネットワーク構造の特徴と比較する.その結果,ブログやレビューサイトでは,比較的小規模な高コリンクグループが得られたのに対し,フォローネットワークでは,強い双方向関係により構築された大規模な高コリンクグループと,双方向関係がほとんど見られない複数の小規模な低コリンクグループが存在することが分かった.さらに,高次数ノードのツイート集合を分析し,これらのグループは同じようなツイートをしているにもかかわらず,フォロワとの関係に大きな違いが見られることが分かった.In this paper, we explored Twitter's follow mechanism through a network analysis. In order to characterize the salient structure of Twitter's follow network, we first empirically compared it with those of reader and favorite networks form blog and review sites by focusing on their high degree nodes. From this experiment, we observed a relatively large high co-link group whose nodes are mutually connected to each other and some small low co-link groups whose nodes are not mutually connected to each other in Twitter's network. On the other hand, most groups are relatively small high co-link groups such as discussion groups in blog and review sites. Moreover, by analyzing messages tweeted by these group's users, we found that these groups much differ in relation with followers although these groups resemble in content of tweets.
著者
江渡 浩一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.41, pp.11-18, 2007-05-11

WikiWikiWeb (Wiki)は、1995年にウォード・カニンガムによって開発された Web 上の情報共有システムである。Wiki は建築家クリストファー・アレグザンダーによるパターンランゲージの概念から考え出されたシステムであり、利用者が設計に参加できるようにするという目的が存在していた。また、同じ出発点を持つ方法論として XP (エクストリーム・プログラミング)があり、両者は目的設定において非常に近い関係にある。本論では、ウォード・カニンガムが Wiki を作り上げた経緯を出発点とし、どのように Wiki が発展していったのかを概観することによって、Wiki が本来持っていた目的とは何かを明かにすることを試みる。WikiWikiWeb (Wiki) is an information sharing system on the Web developed by Ward Cunningham in 1995. Wiki is derived from pattern languages proposed by Christopher Alexander, a building architect. The original goal of Wiki is helping users participate in design processes. The XP (Extreme Programming), a methodology for software development, also has similar backgrounds and goals. In this paper, I describe the history of Wiki and try to confirm the original goal of Wiki.
著者
池田 宏子 小島 一成 中村 美奈子
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CH,[人文科学とコンピュータ] (ISSN:09196072)
巻号頁・発行日
vol.71, pp.47-54, 2006-07-28
参考文献数
5
被引用文献数
2

「ザイ」は鬼剣舞の中で演じられる特徴的な動作のひとつであるが、垂直上下運動を基本とする剣舞の中にあって、水平方向の動きであるザイは、基本に相反する動きであると思われる。なぜなら、ザイをすれば、基本である垂直上下運動の軸がぶれ、基本を逸脱してしまうおそれがあるからである。ゆえに、「初心者は基本に徹しザイはするな」と指導される。また、保存会の踊り手以外は、たとえ経験年数が長い踊り手であったとしても、ザイができていない踊り手は多い。要約すれば、ザイは熟練者にのみ許された舞踊動作ということができる。それでは、なぜ、基本動作に相反すると考えられるこのザイの動作を剣舞の中で行うのか、また、なぜ、ザイを習得することが困難であるのか。本稿では、この2点について、モーションキャプチャによる定量化と舞踊の指導言語を通して分析し、ザイの動作特性について明らかにする。
著者
堀田 創 野澤 貴 萩原 将文
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.3, pp.1491-1501, 2007-03-15
被引用文献数
2

本論文では感性ルールベースを用いた日本語フォント自動作成システムを提案する.提案手法は様々なデザインのフォントを自動生成することを目的としている.フォントは,各文字の骨格情報に,太さなどのパラメータによる肉付けが行われることで生成される仕組みとなっている.また,ユーザの入力には感性語を用いる.感性語とフォントデザインの対応は,各フォントに対する印象がファジィルールとして保存されている.これらはアンケートによって得られた感性情報を解析することで構築される.感性の反映には,遺伝的アルゴリズムを用いている.これにより,フォントは世代が進むにつれてユーザの入力した感性語に合った形状となり,ユーザは要求したイメージに近いフォントを手軽に作成することが可能となっている.本システムは従来のシステムを大幅に改良したものである.まず使用可能な漢字の文字数が72 文字から6 355 文字へ拡張されている.また感性の反映に感性ルールベースが適用され,ユーザの入力に対してより適切なフォントが出力されるようになった.ユーザインタフェースは従来のようなスタンドアローンアプリケーションからWEB アプリケーションへと移行され,通常のブラウザから使用可能となっている.被験者による評価実験により,提案システムと従来システムとの,出力されたフォントに対する感性反映度および多様性の比較を行った.その結果,提案システムの有効性が確認されている.In this paper, we propose a Japanese font designing system using fuzzy-logic-based Kansei rule base. With this system, a user can easily create favorite fonts by inputting some words. A main idea of the proposed font design method is the addition of various effects to basic font skeleton data. In order to determine the design effects, the proposed system employs fuzzylogic- based Kansei database and it derives the desired design effects from the input impression words. The following three points is the improvement from the conventional system. First, the number of Kanji characters is increased from 72 to 6,355. Second, a Kansei database is prepared using the automatic rule creating method for Kansei data. Third, a user interface is improved. According to the experimental results, we confirmed that the new system excels the conventional one in respect of reflection of desired impression and the variety of the created fonts.
著者
河合 剛
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.74, pp.41-48, 1996-07-26
被引用文献数
1

米国の音声言語研究を支えてきたDARPA(国防省先端研究プロジェクト庁)。研究分野の黎明期から一貫して潤沢な資金を提供し続け、研究開発の動向を陰に陽に左右してきた。米国の音声言語処理技術の基盤はDARPA予算によって築かれたといって過言でない。日欧の研究者の多くも研究動向の指針を米国に求めたため、DARPAの影響力は直接的・間接的に世界に及んだ。ところが、技術が成長したいま、音声言語処理は基礎研究の域を脱したとDARPAが判断し、したがって研究予算も削減すると言ってきた。米国の研究所は、今後、民間活力を用いて生き残れるのか。新たな研究課題とは何か。DARPAの功罪と今後の展望を、DARPA研究サイトの元メンバーが痛烈に斬る。DARPA has supported spoken language research in the US since the field's inception. Research sites benefitted from years of ample funding while DARPA charted the course for R&D. DARPA's sphere of influence spread worldwide as non-US researchers carefully noted US trends. However, improvements in spoken language system performance convinced DARPA that research had passed the basic stage. Research sites were asked to obtain non-DARPA funding, particularly from the private sector. Can US research sites survive without DARPA? What are prime R&D targets in the post-DARPA era? A former member of a DARPA site illustrates how DARPA helped and hurt the research community, and describes coming trends.
著者
鈴木 聡 山田 誠二
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.46, no.4, pp.1093-1100, 2005-04-15
参考文献数
20
被引用文献数
5

新たな情報技術がその受け手に与える影響について近年様々な議論がなされている.特に擬人化エージェントは,社会的インタラクションを通してユーザの自発的な態度変容を促す.つまり,擬人化エージェントはユーザを「説得する」メディアとしてユーザに対して強い影響力を持つと考えられる.なかでも,被説得エージェントを説得する説得エージェントをユーザに提示する擬人化エージェントによるオーバハードコミュニケーション(OC)はユーザの態度に影響を与えるとみられる.本研究では,オンラインショッピングサイトにおいて説得エージェントと被説得エージェントによるOCと説得エージェントがユーザに直接情報を提示するレギュラーコミュニケーション(RC)について情報提示後のユーザの態度としての購買意欲を心理実験により比較した.実験の結果,擬人化エージェントによるOCの方が,RCと比べユーザの態度変容に大きな影響を与える現象がみられた.さらに,擬人化エージェントのアピアランスに由来すると考えられるユーザの説得する擬人化エージェントに対する魅力がユーザの購買意欲と正相関することも観察された.この結果から,擬人化エージェントがユーザに与える社会的影響,特にOCの要因となっているプレゼンス,視線,アピアランスといった擬人化エージェントの身体表現がユーザに与える影響という視点からの新たな研究の可能性が示唆されている.It is important to investigate influence of novel information and communication technologies, such as life-like agents, toward receivers of the information since some studies reveal that such novel technology can "persuade" people, in other words, they have strong power to change people's attitude and behavior. In this study, the influence of overheard communication (OC) by life-like agents toward online shopping Web site users was examined, since the OC by people often changes attitude of receivers. An experiment to compare the effect of OC by two life-like agents (a persuader agent and a persuadee agent) with regular communication (RC) by one persuader agent were conducted. The result of this experiment implied that even the OC by life-like agents could promote Web site users' online shopping purchase likelihood more than the RC by them. Moreover, attractiveness toward a persuader agent evaluated by participants was positively correlated with their purchase likelihood. This result suggests a new direction of studies of social influence from life-like agents, especially from a viewpoint of body expression of life-like agents, such as presence, gaze, appearance, and so on.
著者
後河内 大介 宇崎 和雄 長谷川 誠 吉光 裕司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告高度交通システム(ITS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.83, pp.27-31, 2008-09-03

2006 年 6 月の改正道交法により,駐車違反の取締りが強化されている.しかし,二輪車に関しては駐車場が少ないため,二輪車の駐車スペースを整備することが求められている.この対策として,現在ある四輪車駐車場に二輪車駐車スペースを併設する方法があげられる.しかし,四輪車と二輪車で料金体系を変える必要があり,駐車場の自動発券システムでは,二輪車と四輪車を自動的に判別させなければならない.この解決方法として,著者らは,駐車場の入り口ゲートに固定カメラを設置し,画像処理により二輪車と四輪車を判別するシステムを開発した.本稿では,実フィールドでの実証検証を行い,運用可能なレベルの性能を確保できたので報告する.A parking violation has got strict by revised the Road Traffic Law since June, 2006. Because parking area of motorcycle is few, it is necessary to increase parking lot of the motorcycle. In order to solve this problem, there is a method of establishing the Motorcycle parking space as an annex in the Automobile parking lot. However, it is necessary to change the fee system with the Motorcycle and Automobile. Thus, the system of the automatic issuing tickets of the parking lot should automatically distinguish the Motorcycle and Automobile. In order to overcome this problem, we have been developed the image processing apparatus which recognizes the Motorcycle and Automobile with a steady camera for Parking lot Management. In this paper, we report the result of field test, because the image processing apparatus achieved the performance at the level that was able to be operated.
著者
田代 光輝 折田 明子
出版者
一般社団法人情報処理学会
雑誌
研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2012, no.6, pp.1-6, 2012-09-06

インターネット上のコミュニケーショントラブルのうちネットを経由したいじめ・嫌がらせといったいわゆるネット炎上に関して、先行研究から発生過程から収束過程を整理し、具体的な事例を対象に原因と対応方法について不具合に対する決着をつける行動であるという観点から考察する。The settling process is arranged from the generation process, and a so-called net blazing up of bullying and annoying via the net of the communications troubles in the Internet is considered from the previous work about the cause and the correspondence method for a concrete case.
著者
佐藤 円 佐藤理史 篠田 陽一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.36, no.10, pp.2371-2379, 1995-10-15
参考文献数
6
被引用文献数
40

現在、電子ニュースを通じて多くの情報が流通し、多くの人々がその情報を利用している。この電子ニュースは、新しいマスメデイアであり、従来のテキスト情報マスメデイアにはない、優れた特徴を持っている。しかしながら、現在のニュースリーダは、その特徴や利用者の要求に合致した、適切な機能を提供しておらず、読者にとっては、必ずしも利用しやすい情報メディアとはなっていない。我々は、電子ニュースを利用しやすい情報メデイアにするためには、そのダイジェストを提供することが不可欠であると考える。ダイジェストとは、元になる情報をコンパクトにまとめ編集したものであり、情報全体の俯瞰やエッセンスの把握、情報の取捨選択の際に、優秀なナビゲータとして機能する。本研究では、電子ニュースに対して、このようなダイジェストを自動生成することを提案し、その一つのプロトタイプとして、会告記事用ニュースグループfj.meetingsダイジェストを自動生成する方法を示す。ダイジェストの自動生成を実現する中心的な技術は、サマリーの自動摘出技術であり、会告記事にみられるスタイル上の特徴、言語表現バターンを利用することにより、実用に十分な精度でサマリーを抽出できることを示す。本方武で自動生成されたダイジェストは、WWWのクライアントプログラムで読むことができる。
著者
平田 圭二
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.48, pp.51-54, 2003-05-16
被引用文献数
2

早いもので,情報処理学会に音楽情報科学研究会 (SIGMUS) が発足して10 年が経過しました.そこで,これから 10 年の SIGMUS を支える方々に向けて,「誰も聴いちゃいねえ」といういかにも敵を作りそうな題でより良い SIGMUSを作る話題の一端を提供してみたいと思います.It has been 10 years since the Special Interest Group on Music (SIGMUS) was established. Time flies like an arrow. Then, for those who will develop SIGMUS for this coming 10 years, I would like to just provide a starting point for managing SIGMUS better with the title ``No one listens to it'', which likely arouses someone's antipathy.
著者
尾花 充 三浦 雅展 柳田 益造
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.111, pp.47-52, 2004-11-06

メロディーに対する印象評価の際には,ゲシュタルト的輪郭を聞き手が認識することが重要であると考えられている.現存するメロディーの多くは動機が繰り返される形で構成されており,こういった形のメロディーは,繰り返された動機を何度も認識することにより記憶されやすくなるであろうと考えられる.この予測のもとに,メロディーの輪郭として類型を5種類設定し,各類型の特徴に関する評価実験を行なった.その結果,それぞれの類型が覚えやすいと感じるかどうかなどといった印象をある程度確認することができた.
著者
西本 卓也 嵯峨山 茂樹 藤原 扶美 下永 知子 渡辺 隆行
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.11, pp.55-60, 2007-02-10
被引用文献数
4

我々は、視覚障害者と対面朗読者の音声対話を分析し、弁当屋のメニューから食べたいものを選ぶ対話が「分類や検索による大まかな選択」「お気に入りリストへの追加」「お気に入りリストからの最終決定」によって構成されていることなどを確認した。そこでこの知見を活かして、音声合成とキーボードで操作可能なウェブシステムを試作した。実装には XHTML を動的に生成するために PHP および PostgreSQL を使用し、ウェブアクセシビリティの配慮も行った。また、各ページをシンプルにして、一度に一つの操作だけを行わせるようにした。視覚障害者による評価実験の結果、既存のウェブサイトと比較して本システムが使いやすく有効であるという評価が得られた。A prototype lunch delivery Web system for the visually impaired was developed based on the analysis of human (the visually impaired who wants to order a lunch) to human (the sighted who helps the visually impaired to decide lunch by reading aloud lunch menu) dialog. Based on these analysis, a prototype system was developed, which consists of three steps: 1) rough selection (candidate items are roughly selected based on categories), 2) selection of favorites (favorite items are selected from candidate items and stored in the system), and 3) final selection (one item is selected with detailed information for each item). To generate XHTML document dynamically, PHP and PostgreSQL were used. The evaluation of the prototype system is performed by the visually impaired only with synthesized speech and key-board. The results showed that our system is effective and easy to use.
著者
山田 奨治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.1995, no.14, pp.21-30, 1995-01-27
被引用文献数
6

古文書かな文字(変体かな)を自動認識する際に特有な諸課題(文字のくずし、散らし書き、連綿体など)を整理した。そしてこれらの課題に有効な特徴抽出方式である、高次局所自己相関特徴について述べ、それを利用した文字認識実験を行なった。高次局所自己相関特徴は、文字の位相的な特徴を反映し、位置に関して独立で、画像内での加法性を持っており、これらの特性を利用することで、変体かなを厳密に文字を切り出すことなく認識することができる。本方式は文書を限定した上で、システムが文字を学習しながら専門家の読解を支援してゆくシステムへの応用が期待できる。We arranged the problems of machine recognition of Japanese old Kana characters. The higher order local autocorrelation features, which is efficient to solve these problems, was described. We conducted some recognition experiments using this feature. The higher order local autocorrelation features reflects the topological features of characters. It is independent for position, and satisfies the low of addition. Using these features, old Kana could be recognized without strict character segmentation. Our method can be applied for specialists support system with auto character feature learning for single document.
著者
金子 春光 猪狩 知也 井上 寛生 速水 治夫
出版者
一般社団法人情報処理学会
雑誌
研究報告グループウェアとネットワークサービス(GN) (ISSN:09196072)
巻号頁・発行日
vol.2015, no.19, pp.1-6, 2015-03-05

人の眠りには深い眠り,浅い眠りがある.深い眠りの状態にあると,アラームが鳴動していても起きられないことがある.生活のリズムを正し,規則正しい時間に起きることが理想であるが,急な予定や不測の事態があり,いつも同じ時間にというのは難しい.近年では,アプリケーションによる様々な起床方法が存在する.単純な動作,大きな動作でアラームを解除することが多く,ユーザへの負担や,継続率を考えると難しい.そこで本研究では,ユーザを会話させることにより,小さな動作と自然な思考を与え,覚醒状態へと導くアプリケーションを提案する.評価実験の結果,試作アプリケーションを使用することで生活リズムが定まっていないユーザでも目覚めるまでにかかる時間を短縮させることを確認した.The sleep of the person includes a deep sleep and a light sleep. It may not be got up when in the state of the deep sleep even if an alarm sounds. It is ideal to be getting up regularly and that you correct the rhythm of life. But, it is difficult to wake up always the same time because there are sudden appointments and contingencies. Therefore, various wake-up methods and applications are present in recent years. Therefore, various wake-up methods exist in addition to the wake-up application software in recent years. In this study we proposed the application software that lead to wakefulness give a small operation and natural thinking by making conversation the user. Results of evaluation experiments, it was confirmed that to reduce the time it takes wake up in the user life rhythm is not determined by the use Prototype application software.
著者
川中 翔 佐藤周行
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.61, pp.25-32, 2008-06-25

我々は新しいものや概念が新たに創られた場合それを創造と呼ぶが,実際にはそれ以前に既に成立していた概念が下地にあって創られる.これらは解析すべき重要な依存関係であるが,既存の関係性解析の研究は時系列的に静的なものが多くを占めている.本研究では,ソーシャルブックマークにおける概念を記述するタグを解析することで,時系列的な概念の依存関係を抽出する手法を提案する.この手法は,共起率が高いタグ同士は依存関係を持ち,出現順が早い方が依存関係の親となるタグである,との仮定に基づいている.さらに本研究では実験によって手法の評価を行ない,直観的に有用な結果を抽出することに成功した.Creation can be defined as making something exist that has not existed before. However, in many cases, something new is derived from something old. These are essential to analyze, but previous work mainly concentrate on chronologically static relations. In this paper, we propose a method of extracting these chronological concept dependency by analyzing tags that describe concepts in Social Bookmark. This method, is based on the hypo high cooccurent tags have dependency and the first emergence time of tags determines order of dependency.
著者
鮫島 充 ランディゴメス 李晃伸 猿渡 洋 鹿野 清宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.7, pp.2295-2304, 2006-07-15
被引用文献数
2

子供の音声は,声道長や基本周波数が成人音声と異なるだけでなく,発声スタイルが自発的で年齢や個人による声の変動も大きいため,通常の成人用音韻モデルでは認識精度が著しく劣化する.また,子供が正確に文章を読み上げることは多大な労力が必要であり,大規模な整った音声データベースの作成が難しい.本研究では,子供の自発的な発話の高精度な認識を目指して,音声情報案内システムによる子供の実音声の大規模収集,年齢層別子供用音韻モデルの構築と評価,および教師なし話者適応の検討を行った.大語彙連続音声認識実験より,実環境で収集した子供音声を用いることで,単語認識精度が71.1%と既存の読み上げ音声モデルに比べて絶対値で23.9%の改善が得られた.また,年齢層別の傾向では,特に幼児の音声において年齢層依存モデルによる大幅な精度改善が見られた.次に,自動収集した話者ラベルなしの大量データに対する,自動話者クラスタリングを用いた十分統計量に基づく教師なし話者適応を提案した.提案法により59 966個の発話データをクラスタリングし,近傍話者クラスタを用いて音韻モデルを適応することで,クラスタ数200の条件において,年齢層依存モデルに対してさらに幼児で2.2%,低学年子供で1.7%,高学年子供で0.5%の認識性能の改善が得られた.Child's utterance has totally different property from adult's speech, not only by their acoustic property, but by their incorrect pronunciation and totally ill-formed speaking style. The rapid physiological changes during the growth also prevent accurate speech recognition using a single model. However, collection of child's read speech is difficult in natural, since forcing them to read a sentence precisely will make the utterances far from spontaneous one. In this research, we evaluated acoustic models and an unsupervised adaptation method based on a large number of real spontaneous child speech automatically collected through an actual spoken dialogue system. Acoustic model trained by an actual spontaneous speech achieves the word accuracy of 71.1%, which outperforms one trained by read speech by 23.9%. Detailed investigation is carried out for child's ages (infant pupils, lower-grade elementary schoolers and higher-grade elementary schoolers), and accuracy of the infant pupils was greatly improved by using the age-dependent model. Then a speaker clustering method is proposed to perform unsupervised speaker adaptation based on HMM Sufficient Statistics on automatically collected database where no user tag is available. Clustering the 59,966 utterances to 200 speaker clusters, and selecting the neighbor one for each input to construct the adapted model has resulted in a further improvement of recognition accuracy by 1.5% as compared with age-class dependent models.