著者
中島 伸介 張 建偉 稲垣 陽一 中本 レン
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.1, pp.1-15, 2013-01-23

本研究では,小さいコミュニティから徐々に広がり,最終的に多くの人々に知れわたるような流行語を拡張型流行語と定義し,ブログ記事を時系列解析することで拡張型流行語の早期発見する手法に関する検討を行った.具体的には,すでにメジャーな流行語となったトピックに対し,ブログ上でどのように拡散していったのかを分析することで,早期発見に必要な分析手法について検討した. kizasi.jp で扱っている 3,776,154 ブログサイトで過去 2 年間に投稿された 81,922,977 件のブログ記事データの分析の結果,流行語候補がメジャーな流行語に発達する過程において,総発言数に占める,対象トピックと関連の深いコミュニティからの発言割合が減少しつつ,関連の薄いコミュニティからの発言割合が増加する状況を確認した.また,対象トピックと関連の深いコミュニティの特定手法を検討するとともに,総発言数に占めるこのコミュニティからの発言数の割合の減少状況について分析を行った.さらに,ライバル関係にある複数の流行語候補のランキングに基づく,提案手法の妥当性の検証を行った結果,良好な結果を得た.In this paper, we focus on "gradual buzzwords" that begin from a restricted community, spread little by little to other communities, and finally become widely known to most people, and discuss a method for their early detection by analyzing time-series data of blog entries. We observe the process in which certain topics grow to become major buzzwords and determine the key indicators that are necessary for their early detection. From the analysis results based on 81,922,977 blog entries from 3,776,154 blog websites posted in the past two years, we find that as topics grow to become major buzzwords, the percentages of blog entries from the blogger communities closely related to the target buzzword decrease gradually, and the percentages of blog entries from the weakly related blogger communities increase gradually. We also discuss how to identify the blogger communities which are closely related to these buzzwords, and conduct a slope analysis of percentage variation of blog entries from these closely related blogger communities. Moreover, we verify the effectiveness of the proposed method through experimentation that compares the rankings of several buzzword candidates with popularity competition.
著者
橋口 博樹 西村 拓一 張 建新 滝田 順子 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.12, pp.2479-2488, 2001-12-01
被引用文献数
23 or 0

本論文は, 鼻歌から抽出される音高の差(音程)の時系列を検索入力として, それに類似する区間を楽曲の音響分析パターン時系列中から見出す検索手法の提案を行う.提案手法(Model driven path Continuous Dynamic Programming)は, スポッティング検索可能な連続DPを拡張した手法であり, 参照モデルの時系列自体が, 連続DPで用いられる傾斜制限の型を直接定めていることに特徴がある.本論文では, ポピュラー音楽20曲について鼻歌検索実験を行い, 本提案手法の有効性を示す.
著者
桑原 雄 稲垣 陽一 草野 奉章 中島 伸介 張 建偉
出版者
情報処理学会
雑誌
研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.18, pp.1-3, 2009-11-13
被引用文献数
0 or 11

近年,ブログや SNS 等,ユーザの生活体験が直接反映されたコンテンツが数多く配信されるようになってきている.我々は,これらのコンテンツを解析することで,ユーザの生活体験に基づいたシソーラスを半自動的に作成するシステムの研究開発を行っている.本稿では,このシステムを用いて作成したシソーラスを用いて,マイクロブログ上でユーザが発信した情報を分析し,特徴的なトピックやそれに対する感情を抽出することで,興味,志向が類似したユーザを発見する方法,及び類似ユーザを推薦する手法を提案する.Recently, the internet has experienced an explosion of personal media from social media sites such as blogs, Facebook, Twitter and so on. Much of this persona media describes a person's life experiences and events, ranging from the mundane to the intriguing. As it is such, we are developing a life experience thesaurus system which can automatically recognize the life experiences based upon textual analysis. In this paper, we describe the use of this thesaurus in our micro-blogging user recommendation system. This system analyzes user postings, extracting the topics and sentiments, and lastly recommends similar users.
著者
柴田 雅雄 坂部 創一 山崎 秀夫 守田 孝恵 張 建国
出版者
一般社団法人環境情報科学センター
巻号頁・発行日
pp.339-344, 2010 (Released:2011-08-12)

本研究では,CMC (Computer-Mediated Communication) 利用の促進が文章表現力をどの程度向上させ,それが口語表現力と現実の人間関係,そしてQOL (Quality of Life) にどのように影響しているのかという問いを設定した。そして,情報系大学生を対象に調査を実施して,共分散構造分析で良書の読書効果も含めて要素間の因果関係を検証した。その結果,良書の読書のみ文章と口語の表現力を向上させ,メールとSNS (Social Networking Service) は文章と口語の表現力を向上させないことが示された。そのため,今後の情報化社会において「良書の読書」を推進することの重要性が示唆された。
著者
張 建偉 河合 由起子 熊本 忠彦 白石 優旗 田中 克己
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.25, no.1, pp.568-582, 2013

ニュースサイトは日常生活における重要な情報源であり,閲覧者は発生事象の情報を受信する(受ける)のと同時に,書き方によって「楽しい」,「悲しい」,「怒り」等の多様な印象も受けている.特に,賛否両論となるニューストピックに関しては,複数のニュースサイトで報道傾向が異なるため,異なった印象を受ける.また,同じ話題であっても,時間が経つと報道傾向が変化する場合には異なる印象を受ける.そこで本研究では,記事の書き方を「印象」という評価指標で分析することで,ニュースサイトの報道傾向を視覚的に比較可能な分析手法を提案する.提案手法は,まずニュース記事の多様な印象を表現するのに適した複数の印象軸を設計し,ニュース記事に対する印象辞書を構築する.次に,この印象辞書を用いて各記事と各ニュースサイトの印象値を算出し,最後にサイトごとの報道傾向の違いおよび時間的推移を閲覧者へ比較提示する.本論文では,多様な印象に基づくニュースサイト報道傾向分析手法を提案し,国内 15 社,国外 10 社の計 25 社のニュースサイトに適用したシステムを用いて,その有効性を検証する.
著者
張 建保 深澤 大輔
出版者
一般社団法人日本建築学会
雑誌
日本建築学会北陸支部研究報告集 (ISSN:03859622)
巻号頁・発行日
no.47, pp.268-271, 2004-07-17

栃尾大名行列は、諏訪神社の春の大祭として毎年4月29日に行われ、総勢500人、行列の長さは300mに達する。厄年の25歳と42歳の男性が白丁と呼ばれる白装束姿で参加し、神輿や太鼓・鏡などの担ぎ手となる。この行われる意味は、度重なる洪水で多数の死者が出た葬列を先頭に、雁木通りの市街地に水害をもたらす悪霊を神輿に載せ、諏訪神社に運んで境内を左回り3回を繰り返し、封じ込めて、街の家内安全と商売繁盛、五穀豊穣などを祈願するものである。その開始時期は、牧野侯から恩賞を賜った寛政年間(1789-1801)頃と考えられる。
著者
若宮 翔子 河合 由起子 熊本 忠彦 張 建偉 白石 優旗
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.57, no.1, pp.366-378, 2016-01-15

特定の話題に対する感情は情報発信者によって異なるため,その話題の検索結果には様々な感情で書かれたWebページが混在する.また,話題に対する情報発信者の感情は1つとは限らないため,複数の感情を持って書かれたWebページが存在する.Webページに含まれている情報発信者の感情は読み手が受ける印象に影響を与えるため,特定の感情で書かれたWebページばかりが提示されると話題に対する多様な感情を把握できず,読み手はその話題について偏った印象を持ってしまう.本論文では,検索ワードに対する情報発信者の感情の多様性を考慮したWebページ検索・提示システムを提案する.本システムでは,まず,検索ワードで検索されたWebページにおける情報発信者の感情を取得するために,既存の感情辞書を用いて3軸(軸1:「楽しい ⇔ 悲しい」,軸2:「うれしい ⇔ 怒り」,軸3:「のどか ⇔ 緊迫」)に基づく感情値を算出する.次に,話題に対する情報発信者の感情を網羅するようなWebページを検索するために,特定の感情を有するWebページから抽出した補間語を用いて再検索する.最後に,検索結果として3次元の感情マップとして感情の分布を可視化する.提案手法の有用性を検証するために,既存手法と提案手法による検索結果の感情分布の相対的な広がりを比較評価する.また,抽出した検索ワードの話題性および感情値の適合性,ならびに再検索結果から取捨選択し統合した検索結果の適合性を評価する.
著者
岡 隆一 西村 拓一 張 建新 伊原 正典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.6, pp.764-775, 2003-06-01
被引用文献数
21 or 0

語彙に依存しない音声の検索方式を二つ取り上げ,それらの性能を比較する.検索方式の二つとは,検索対象の音声データベースと音声クエリー波形の双方について,各フレームの表現が分析フレーム特徴そのものとしてそれを用いるものと,フレーム特徴から音素々に変換したものを用いるもの,である.フレーム系列表現された検索対象の音声データベースと音声クエリーとの間では連続DPによるスポッティング処理が適用される.連続DP値のローカルピークを検出し,それの抽出する音声データベース中の重なりのない音声区間を検索出力とする.日常会話の発話音声を検索対象者音声データとし,音声クエリーによる検索実験を行った.より高い検索性能を与える方式は各フレーム特徴を音素記号に変換した方式であることが明らかになった.
著者
中島 伸介 張 建偉
出版者
京都産業大学
雑誌
基盤研究(C)
巻号頁・発行日
2011 (Released:2011-08-05)

本研究では,精度および詳細度の高いブロガー分析手法の開発を行った.さらに,情報発信者および情報受信者としてのブロガー分析に基づく,信頼性の高い情報の判定技術,トレンド情報の抽出技術,情報発信者のプロファイリング技術とこれに基づく情報推薦技術の開発に取り組んだ.成果としては,研究協力を頂いている企業において,本研究の成果の一部を実サービスにて活用していただくなど,技術の実用化という意味でも成果を上げている.特に,流行トレンドの早期発見方式に関する研究では,難関国際会議での論文採択や推薦論文としての学会論文誌への採択を受けると共に,国内研究会発表にて3度受賞するなど,学会においても高く評価された.
著者
張 建偉 河合 由起子 熊本 忠彦 白石 優旗 田中 克己
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.25, no.1, pp.568-582, 2013-02-15 (Released:2013-03-04)
参考文献数
18

ニュースサイトは日常生活における重要な情報源であり,閲覧者は発生事象の情報を受信する(受ける)のと同時に,書き方によって「楽しい」,「悲しい」,「怒り」等の多様な印象も受けている.特に,賛否両論となるニューストピックに関しては,複数のニュースサイトで報道傾向が異なるため,異なった印象を受ける.また,同じ話題であっても,時間が経つと報道傾向が変化する場合には異なる印象を受ける.そこで本研究では,記事の書き方を「印象」という評価指標で分析することで,ニュースサイトの報道傾向を視覚的に比較可能な分析手法を提案する.提案手法は,まずニュース記事の多様な印象を表現するのに適した複数の印象軸を設計し,ニュース記事に対する印象辞書を構築する.次に,この印象辞書を用いて各記事と各ニュースサイトの印象値を算出し,最後にサイトごとの報道傾向の違いおよび時間的推移を閲覧者へ比較提示する.本論文では,多様な印象に基づくニュースサイト報道傾向分析手法を提案し,国内 15 社,国外 10 社の計 25 社のニュースサイトに適用したシステムを用いて,その有効性を検証する.
著者
稲垣 陽一 中島 伸介 張 建偉 中本 レン 桑原 雄
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.123-134, 2010-09-28

本研究ではブロガの体験熟知度に基づいたブログランキングシステムの開発を行った.ユーザが入力した検索キーワードに対して,関連するトピックを複数抽出し,各トピックに関するブロガの体験熟知度を算出する.これに基づいてブログエントリのランキングを行う.熟知度スコアが高いブロガ (熟知ブロガ) が書いたエントリは,熟知度スコアが低いブロガが書いたエントリよりもランキングが上位となる.ブロガの熟知度スコアは,ブロガが過去に投稿したエントリ内で,各トピックに関して共起に基づいて抽出した特徴語をどれほど使ったかを分析することで算出される.なお,開発したシステムは,視点の異なる複数のランキングを提示するとともに,エントリ投稿者 (ブロガ) の特性に関する補助情報を提示している.これにより,ユーザは閲覧するブログエントリの信頼性を自分なりに判断することが可能となる.我々は開発した実証実験システムをWeb上で公開するとともに,これを用いた評価実験を行った.提案システムにより提示される熟知ブロガおよびブログエントリの妥当性が十分に高いことを確認できた.
著者
岡 隆一 西村 拓一 伊原 正典 張 建新 赤坂 貴志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.155, pp.29-35, 2001-06-21
被引用文献数
1 or 0

音声やテキストの検索方式を音素記号の系列表現に基づいて構成することを提案する。検索対象のデータである音声波形の各分析フレーム特徴は音素記号に変換される。検索対象のテキストはその読みをひらかなで記述され、さらに音素系列へと展開される。このとき、この各音素表記については平均継続時間長を前もって定めておき、各音素記号について平均時間長のフレーム区間に同一音素記号を配置し音素記号系列とする。クエリーを音声とする場合、このクエリー音声をフレーム単位に音素認識を実行する。音素系列表現の検索対象の音声やテキストと、クエリー音声の音素記号列との間では連続DPによるスポッテイングを行い、データベース中の一致する部分を検索結果とする。