板崎 輝 塩津真一 稲野 聡 井谷茂寛 山田 勇
情報処理学会研究報告モバイルコンピューティングとユビキタス通信(MBL) (ISSN:09196072)
vol.2006, no.14, pp.329-332, 2006-02-17

PCなどのコンピューティング環境を持ち歩く現在のような使い方だけではなく 行く先々のコンピュータ上に各自の環境を移動させ 利用するシーンが今後広まっていくと筆者らは考えている.このような利用シーンにおいては 位置情報を基に各自の利用環境を行く先々のコンピュータ上で安全かつ迅速に復元する機能が必要となる. これを実現するためには位置検出技術が必要となり 筆者らが開発したセミパッシブ型セキュアタグシステムを適用することにした.これは通常のRFIDタグに比べ 必要な時以外は電波を発しないセキュリティやプライバシーに配慮したタグシステムである.本論文では 我々の目指すサービスの実現例と それを実現するために使用したセキュアなタグシステムを中心に報告する.We are carrying about mobile PC now. It will be expected that each one's PC environment is moved to the PC placed at destination without mobile PC. In such a use scene, we will need the functions that restore user's PC environment safely and promptly on various PCs. To achieve such functions, we started this research. Because the system required the positional detection technology, we decided to apply the secure semi-passive RFID system that authors had developed to it. This tag system doesn't emit electric waves to keep security and privacy compared with usual RFID tag system. In this thesis, it reports the example of achieving the service at which we aim and the RFID system that uses it to achieve it.
椎尾 一郎
情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 (ISSN:09196072)
vol.88, pp.45-50, 2000-05-12

吉田 香 加藤俊一
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2001, no.44, pp.65-72, 2001-05-21

本稿では,フルカラー絵画データベースART MUSEUMにおける感性モデルについて考察を行った.WEB上に公開しているART MUSEUMは,1998年4月から2001年3月までの3年間に5000件以上のアクセスがある.これらのアクセスログより,利用者のアクセス傾向を調査した.その結果,利用者のうち約半数がシステムへのフィードバックを行っていたこと,フィードバックを行った利用者は感性検索も積極的に行っていたこと,フィードバック回数は大半の利用者が1?3回だったこと,などがわかった.また,各利用者の感性モデルが,平均モデルからどれだけ変化しているのか比較を試みた.利用者プロファイルを用いて解析を行うにはデータが十分ではなかったため,今後の課題として,特にインタフェース部分の改良が挙げられる.This paper describes a study of Kansei modeling on the image retrieval system ART MUSEUM, which can treat Kansei information. We have had over 5,000 access logs on ART MUSEUM since April 1998 till March 2001, and checked these logs. As a results, it's found that half users have operated feedback to the system, they have repeated Kansei retrieval many times, but most of them have operated feedback only a few times. And we tried to compare each user's Kansei model with an average Kansei model. It's not enough data for data mining still now. It's need to develop user interface to feedback more easily.
脇田 玲 常盤 拓司 橋本 裕子 竹内 恵 楠見 春美 佐倉 統
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) (ISSN:09196072)
vol.2006, no.105, pp.23-28, 2006-09-29

近年、オープンなカフェ空間で科学の話題についてコミュニケーションを行う科学カフェが注目を集めている。我々はインタラクションデザインの要素を科学カフェに用いることで、議論の円滑進行支援と、議論の定量的かつ定性的ロギング、及びコミュニティの活性化を実現するためのシステム mumbleを開発した。秋葉原と表参道の2つの地域において、mumbleを用いたサイエンスカフェを運用し、その有効性を検証した。Recently, science cafe where communications of the science topics are done at cafe spaces calls large attentions. We have developed a system, called "mumble", supporting smooth and natural communication in the cafe. We have used mumble in real science cafes and verified the effectiveness of the system.
小川 博久
情報処理学会研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:09196072)
vol.2004, no.4, pp.49-54, 2004-01-20

電子権利の安全な流通において,回数制限の実装は,重要な問題である.現在利用されている電子チケットでは,まとめ買いに対する利便性と安全性の問題が指摘されており,双方の要求を満たす技術が求められている.本稿では,(k n)しきい値分散法及び,(k L n)しきい値分散法を用いた権利回数制限の構成例を示し,実装及び評価について報告する.For a secure circulation of digital rights, it is an important issue to limit the number of use. It is often pointed out that digital tickets used nowadays have issues in convenience in regards to bulk buying and security. This article makes an illustration of limited rights of use applying (k, n) threshold scheme and (k, L, n) threshold scheme, reports implementation and evaluation.
望月朝香 鈴木 泰博
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
vol.2007, no.128, pp.179-182, 2007-12-21

文章を読んだ後に「著者らしい雰囲気のする文章だった」と感じる経験はよくある。この目に見えない「雰囲気」、即ち作者特有の文体印象について、小説のテキストデータを数量化し分析することで考える。文体印象を醸し出す要素は様々考えられるが、本研究では①句読点の分布、②読みでの文字数、③文章表現方法・多頻出言語、の 3 項目に着目する。句読点の使い方に著者特有の文構造が、読みでの文字数では頭の中のリズム、文章表現方法・多頻出言語から著者の愛用語や単語使用方法の癖が現れ、文体印象の要素となるためである。本論文では作者の特徴の抽出に相当する①と②について行う。かかる特徴付けを行い文体や作家の雰囲気を数量化することで、雰囲気を用いた文献検索を可能にし、また作者不詳の歴史文献の作者特定へ応用することが可能である。The experience to feel when it "was the sentence to do of the atmosphere like the author" happens quite often after having read a novel. I consider "an atmosphere peculiar to an author" that this sight does not show, and analyzing the text data of the novel by amount becomes it. I think that it enable the document retrieval that we used an atmosphere for and do that I do quantification of the atmosphere of a writing style and the writer. In addition, I think that we can apply it to the author identification of author unknown history documents.
清水 光 小林 正明 藤井 温子 川久保 和雄
情報処理学会研究報告高度交通システム(ITS) (ISSN:09196072)
vol.2008, no.25, pp.29-36, 2008-03-07

本稿では、単独信号交差点や幹線道路、都市道路網の交通流ダイナミクスを離散形時変非線形ダイナミックシステムで記述し、信号制御パラメータを統一的に最適化する手法について開発する。信号制御システムは信号交差点の車線単位、サイクル長単位で成立する交通量収支に基づき、フィードバック制御を用いて記述される。信号制御法は渋滞長のバランス制御アルゴリズムを用い、信号制御パラメータの最適化問題として探索法が開発される。最後に、道路条件と交通条件が与えられたものとして、確定的信号制御システムを開発する手順について述べる。提案した開発手順は広島県福山市内道路網におけるシミュレーション結果より、有効性を確認した。This paper studies the development of deterministic signal control system in urban road networks from the viewpoint of a digital control. The signal control system of the congestion length is described by a nonlinear time-varying discrete dynamic system and synthesized by using the feedback control based on the volume balance at each signalized intersection. The balance control algorithm and network control algorithm in which the three signal control parameters consisting of the cycle length, green split and offset are searched systematically so as to minimize the sum of congestion lengths at signalized intersections are presented. The configuration and the development procedure of the deterministic signal control system are presented based on our studies. From the comparison of congestion lengths and signal control parameters between measurement values and simulation values, it is confirmed that the signal control system and control algorithms work effectively to minimize the congestion lengths at signalized intersections.
村木 雄二 狩野 均
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
vol.2007, no.128, pp.223-226, 2007-12-21

著者らは,現実の感知器交通量データに基づいて信号制御を行うエージェントモデルの研究を行っている.従来は,エージェントの知覚情報として現実に測定できないデータを仮定したり,仮想的な道路ネットワーク・交通流でのシミュレーションにより手法の評価を行っている研究が多い.本研究では,道路地図,計測データの得られるリンク,計測されるデータについて現実と同じものを用いている.本稿では,信号制御方式の評価に使用するシミュレータを交通量予測に適用し,実測交通量データの再現性について評価を行った.実験結果から,最近隣法に比べ,本シミュレータによる渋滞発生時の予測精度が高くなることを確認した.We study an agent model for traffic signal control based on traffic measured by vehicle detectors. In conventional studies, signal control methods are usually evaluated by applying simulations based on hypothetical road networks and traffic volume, and agents perceive data that cannot be actually measured. In this study, we use a simulator based on actual road maps and measured traffic data. This simulator was found to be superior to the nearest neighborhood method for traffic prediction at times of congestion outbreak.
稲場 典康 榎本 雅幸 小川原光一 出口 光一郎 富田 文明 角 保志 加藤晃市
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
vol.2002, no.102, pp.45-46, 2002-11-07

オーガナイズドセッション「新しいロボットビジョンの動向(1) ─ 作業のための視覚」では、ハンドアイロボットに代表される作業のための画像計測、認識に関する研究に焦点を絞り、ビジョンへの期待、批判、提案等を討論していただく場をご用意いたしました。パネラーとして、産学に関わらず広い分野から一線で活躍されている研究者の方々をお招きし「CVはロボットのセンサとして成果をあげているのか」、「作業のためのセンシングとはどうあるべきか」「CVの研究はどのような方向性を目指せばよいか」等々、活発に議論して頂き「作業のためのロボットビジョン」の今後について展望致します。We have organized a panel session titled "Can "Computer Vision" become a faculty of sight for a robot". In this special session, we focus on the vision research for task implementation and we will discuss about a variety of topics, e.g., "Does the CV research show landmark achievement in the robotics field? ", "What is the role of CV for task execution?", or "What will the aim of the CV in the future?" Through these discussions, we seek the future prospects of the computer vision research field.
葛生 和人 平野 靖 間瀬 健二 渡邉 豊英
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
vol.2008, no.21, pp.7-12, 2008-03-06

ドメイン構成を用いずに,いずれの共有端末からも個別のユーザ環境を再構築できるシステムを開発した.本システムでは,ドメインサーバを介さずに LDAP 上で管理される既存のユーザディレクトリ情報にアクセスし,PKI アプリを搭載した IC カードと連携して共有端末へのログオン認証が行われる.なお,ユーザ環境の再構築に必要なユーザプロファイル情報は,ssh サーバを通して共有のデータストレージ上に格納される.また,共有端末からネットワークドライブとして接続した Samba ファイルサーバ上に,ユーザプロファイル関連フォルダを置くことで,通常はドメイン構成上ではじめて成り立つ移動ユーザプロファイル機能を,ドメインサーバの導入の必要なく実現することができた.本システムは,管理運用面と経済性の両面において有利なソリューションであるといえよう.We developed newly the logon authentication system which can rebuild the individual environment on a shared terminal without depending on domain accounts. In this system, the logon authentication to the terminal is carried out using both a PKI application on smart card and the user directory information of LDAP, and the system does not need a domain control server. The user profile data, which is required for rebuilding of user environments, is stored on shared data storage through a ssh server. On the other hand, the concept of roaming user profile not belonging to a domain is realized through putting user profile folders on Samba file server connected to a shared terminal as a network drive. This system can be regarded as advantageous solution from the points of both user management and economical efficiency.
師 茂樹
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
vol.2007, no.95, pp.65-70, 2007-09-27

コンピュータにおける文字の扱いにおいては、「文字とは何か」という議論を避けることはできない。従来、制御文字やフォントとして符号化されてきた、書記において顕在化するものの、結果的には文字にならない部分は、「文字とは何か」を考える上で重要であると思われる。本発表では、マンガ論におけるキャラクター論も参照しつつ、文字の見えない部分について検討することで、今後の文字論に必要な材料を提示したい。In the context of character information processing, we cannot avoid the discussion of "what the character is." It would be important for it to examine invisible side of the character encoded as control characters, fonts or so, which comes up to the surface during writing but will be invisible at last. This paper aims to investigate the invisible parts of the character, also referring to a character theory of Manga (comic) studies.
小笠原 直人 佐藤 究 布川 博士 白鳥 則郎
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
vol.2000, no.88, pp.1-6, 2000-09-22

近年,電話,FAX等の現実世界でのコミュニケーションメディアに加え,インターネットの普及により,電子メール,メッセージングサービス,VoIP等の様々なコミュニケーションサービスが新たに誕生し,多数のメディアを利用することが出来るようになって来ている.しかし,ユーザはこれらを効率的に使い分けるためにはユーザはそれぞれのメディアに関する情報や相手ユーザの情報を意識しなければならない.この傾向は将来新しいメディアが誕生し,コミュニケーション環境がより大きなものとなっていくにつれ,さらに顕著になっていくことが予想される.本研究では,これらの問題を解決するためにコミュニケーションに係わる様々な情報をユーザに代わり管理,交換するエージェントMIA(Media Integration Agent)を提案する.このMIAによるコミュニケーション環境により,ユーザはメディアに依存する固有アドレスや相手ユーザの情報を意識せずに,コミュニケーションメディアを効果的に利用することができる.By spread of Internet, we become to use several of communication such as email, ICQ, VoIP etc. But as become convenient to user must be aware of variety of information regarding the media and partner use, user. The forecast is that this problem grows larger and larger as new media are brought in the expanding communications network. In this research, we suggest an agent MIA (Media Integration Agent) that manages the information instead of user. The MIA is an agent that obtains situation of user, and dynamically exchanges addresses and tendency of using medias. By use of this, user can choose better communication media. Accordingly seamless communication environment that user doesn't have to be aware of various information is formed.
茶木修一 清末 悌之 中濱 清志 秦泉寺浩史 阿部 匡伸
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
vol.2008, no.70, pp.55-60, 2008-07-17

日本市場におけるキーテレホンシステム、所謂ビジネスホンは 1969 年に製品化され、以後、 1980 年代前半の電子化、1980 年代後半のディジタル化などを経て現在に至っている。本稿では、ピジネスホンのマルチライン機能を CSCW (Computer Supported Cooperative Work) の観点からとらえ、音声を中心としたオフィスワーカ間のコラボレーションサービスを今後求められてくると想定される IP プロトコルのネットワーク上に構築する場合に、どのような管理対象に対してどのような管理方法を用いるべきかについて考察する。多様なサーピズを柔軟に構築することができるフレームワークをめざす。A key telephone system and a so-called business phone in a Japanese market are commercialized in 1969, and have arrived through the computerization in the first half of the 1980's and the digitalization in the latter half of the 1980's. In this paper, it is considered what kind of method of management to base when constructing it on the network of the IP protocol assumed to use the multi-line functions of the key telephone system from the viewpoint of CSCW (Computer Supported Cooperative Work), and for the collaboration service between office workers that centers on the voice to be going to be requested in the future. We aim at the framework that can flexibly construct various services.
鈴木 俊哉 佐藤 大
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
vol.2007, no.77, pp.37-42, 2007-07-27

情報交換を目的とする文字集合の規格として,現在はISO10646文字集合,文字符号化方式としてはUmcodeを用いることが国際的な標準である.しかし,インド系文字は音素分解にもとづき文字符号を定義しているため,表示・印刷には複雑なレンダリング処理が必要となる.広く普及しているローマ字専用の処理系ではこれが不可能であるため,ローマ字用の処理系でもインド系文字が扱えるよう,様々な図形分解に基く符号化方式が応急処置的に作成されてきた.これらにより符号化されたデータが広く配布されているが,符号化方式は標準化されていないため,文書のアーカイブやデータ抽出に問題がある.本稿は,北方ブラフミ文字の例としてチベット文字のレガシ方式をとり,符号化方式の分析と自動識別方法を検討する.チベット文字レガシ符号の中には漢字集合に匹敵する大きさを持つものがあり,クメール文字とは異なりPDFなどではフォントがサブセット化されている可能性がある.このような場合の識別方式についても検討する.For Brahmic scripts used in India, Central and South East Asia, ISO/IEC 10646 defines the character sets by phonetic decomposition of Brahmic scripts with refering Indie national standard IS 13194. These character sets expect the complicated text layout system to render the coded text for display or printing purpose. To reduce the implementation cost by reusing Roman text layout system, there are various non-standardized legacy encoding schemes for Brahmic scripts. In this report, we investigate the legacy encoding schemes for Tibetan script as an example of northern Brahmic script which uses many ligatures. We found legacy encoding system for precomposed Tibetan glyphs. The glyphset of these encodings are so large that the subsetted font in the documents are expected to be quite smaller than whole glyph set. We discuss the encoding detection algorithm by subsetted font.
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
vol.1999, no.10, pp.1-8, 1999-01-29

VFlibはC言語で記述されたフォントライブラリで、フォントより字形を取り出すための関数群より構成される。VFlibは各種フォントの内部データ形式を隠し、統一的なAPIでフォントより字形を取り出せるようにしている。そのため、新たなフォント形式がVFlibで利用できるようになったとき、VFlibを使っているプログラムは変更なしで新たなフォント形式のフォントが利用できるようになる。また、プログラムの開発者は、フォントファイルの内部データ形式を知らなくても、様々なフォントを利用できるようになる。本稿では、VFlibの機能と内部構造を説明する。そしてVFlibを使用した応用プログラム例として、T_EX組版システムで生成されるDVIファイルの表示、印刷を行うプログラムについて述べる。VFlib is a font library written in C providing several functions to obtain bitmaps of characters. VFlib hides the internal structure of font files and provides a unified API for all supported font formats. Application software using VFlib can support various font file formats and when a new font format is supported by VFlib, application software need not be modified to use such new fonts. Therefore, application software can use fonts without aware about font file formats. In this paper, we explain the structure and API of VFlib. Then, we introduce T_X DVI document viewers and printers as examples of application software using VFlib.
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
vol.2006, no.90, pp.129-133, 2006-08-08

楽曲の演奏情報から楽譜化を行う手法確立のために,試作と検証をすすめている.演奏情報として,Midiファイルを利用する.Midiファイルは,ある発音に対して,ノート番号と発音時刻と消音時刻についての情報を持つイベントデータの並びである.一方楽譜は,ある発音に対して,音符として表されるが,通常の音符や連符,また装飾音など発音時刻の解釈が異なるルールをもつものが混在する.さらに楽譜には,複数の音の動きを表すための声部概念があるが,Midiファイルにはその声部情報はない.このような演奏情報と楽譜のルールの違いを考慮し,本件では,まず声部情報と,連符情報を抽出する手段について試した結果を報告する.We push forward development and inspection of prototype to establish technique of scoring from performance information of a song. We use MIDI file as musical performance. Midi file is the row of the event data which has the information about a note number, note on time, and note off. On the other hand, a score is expressed as a note to a certain pronunciation. In a score, a thing with the rule from which the interpretation about note on time, such as a note, a triplet mark, an ornament mark, etc., differs is intermingled. Furthermore, there is a thing called the voice part for expressing two or more melody in a score. There is no information equivalent to the voice part in Midi. In consideration of the difference in the rule of such a performance information and a score, we report the result that we tested about means to extract voice part information and triplet information.
佐藤 宏之 堀川 桂太郎 及川 利直 水野 浩二
情報処理学会研究報告グループウェアとネットワークサービス(GN) (ISSN:09196072)
vol.1997, no.23, pp.49-54, 1997-03-06

現在,我々は協調学習ナビゲーションの研究を進めている.これは,WWWを利用して学習した際の履歴を学習グループで協調利用することを可能にする.本稿では,協調学習ナビゲーションについて,学習者に提供するインタフェースの観点から述べる.WWWを用いた学習実験を行ない,学習パターンを分析して,先に学習した者の活動履歴を教材として利用するために必要な学習履歴マップの作成方法を提案する.さらに,協調学習ナビゲーションのコンセプトを実装したWWW上で動作するシステム,CoNAVIを説明する.CoNAVIはJava言語で記述され,標準的なWWWブラウザ上で動作するナビゲーションインタフェースを学習者に提供する.これにより,インターネット上のグループが教材を共有・拡張する作業を通して,インタラクティブに学習することができるようになる.We are studying collaborative learning navigation. It enables members of learning group to share and use history of learning on WWW cooperatively. In this paper, We describe collaborative learning navigation method from the viewpoint of user interface. We experiment on learning using WWW, and analyze pattern of it. Then, we propose how to make a learning map used as tutorial materials from the history of leaning. Furthermore, we realize collaborative learning navigation concept as CoNAVI system. CoNAVI is implemented by Java language. It allows members of learning group to use navigation interface which works upon standard WWW browser. As a result, each member on the Internet is able to study interactively, sharing and enlarging tutorial materials.
加藤 一民 松尾 啓志
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
vol.2005, no.22, pp.87-93, 2005-03-11

Webコミュニティとは、共通のトピックを扱うWebページの集合を意味する。KleinbergのHITSアルゴリズムは、Webページ間のリンク関係を解析することにより、特定のトピックに関連するWebコミュニティを発見する。しかし、一般に広い意味を持っているトピックにおいては、トピックに関連するコミュニティは1つだけでなく、複数存在するため、単一のコミュニティを抽出するHITSアルゴリズムでは、ユーザが意図するWebコミュニティを抽出することができない場合がある。そこで本研究では、Markov Cluster Algorithmを用いて、ユーザから与えられたキーワード(トピック)から、それに関連する複数のWebコミュニティを発見する手法を提案する。A web community is a set of web pages created by individuals or associations with a common interest on a topic. Kleinberg's HITS algorithm find a web community on a query topic by link analysis. For multiple meanings of query terms, there might be multiple web communities related to the query topic. However, HITS algorithm can't always extract web community which users would expect or prefer, because it can only extract single community on a query topic.In this paper, we propose a method for discovering web communities on a query topic, using Markov Cluster Algorithm.
田代 裕和 土橋 健太郎 富永 英義
情報処理学会研究報告高度交通システム(ITS) (ISSN:09196072)
vol.2006, no.120, pp.229-236, 2006-11-17

無線通信の広帯域化やセンサ技術の高度化に伴い,更なる発展が求められるITS,その中でも車車間通信において様々なアプリケーション・サービスの出現が予想される.一方で限られた周波数・帯域を有効活用するため,各アプリケーション・サービスの要求条件・優先度に応じたMedia Access Control,特に緊急度の高い情報を配信する必要性が生じた際に,該当地域内のAd-hoc ネットワークを端末間でいかに制御し,本情報を要求されるエリアに,要求される時間内に確実に配信するかを考慮する必要がある.そこで本稿では,緊急性の高い情報を配信する必要に迫られた車両は情報に緊急度や優先を希望する時間を埋め込み,周辺車両と連携し,必要に応じて動的にQoS 制御を行う手法を提案する.そして,実際の道路と緊急情報が突然発生するシーンを想定したコンピュータシミュレーションにより,実現可能性について言及する.Recently, Intelligent Transportation System (ITS) is obtaining a grip on reality thanks to the huge development of radio communication technologies and sensor technologies. Inter-vehicle communication is required to to be adaptive to the each requirement of various application. In this paper, we propose a dynamic QoS control scheme for inter-vehicle communications that reduces the delay and forms reliable vehicle networks. Finally, simulation evaluates the proposed scheme from the viewpoint of average access delay and clarifies the effectiveness of the proposed scheme.
水田 貴章 柴田 雅博 冨浦洋一
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
vol.2008, no.113, pp.91-98, 2008-11-19

コーパスベースで言語知識を獲得する場合には,その言語の大規模なコーパスが必要となる.Web 上には多種の言語で書かれた膨大な数の文書が存在するため,そこから文書を収集することによって様々な言語の大規模コーパスの構築が可能である.このとき,言語ごとのコーパスを構築するためには,まず,収集文書がどの言語で書かれているかを識別する必要がある.本論文では,仮説検定を導入した言語識別手法を提案する.この手法により,長い byte 列を用いた場合でも統計的な揺らぎの影響が小さい言語識別が可能となる.実験の結果,従来手法では識別が難しかった小さなサイズの文書に対しても高い精度で言語識別を行えることが確認できた.To get language knowledge based on a corpus, we need a large number of documents written in the language. In the web, there are a huge number of documents written in various languages, and we can construct corpora of various languages easily by gathering each language's documents from the web.The first step to construct corpora in this way is to identify the language of each gathered document.In this paper, we propose a language identification method using statistical hypothesis testing. The method is robust against the statistical fluctuation even when we use long and low-frequency symbol sequences as language features. Through experiments, the proposed method identified languages of short documents accurately, which the previous methods could not.