著者
青山 俊弘 山地 一禎 池田 大輔 行木 孝夫
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2011, no.6, pp.1-8, 2011-11-15

近年,文献を主とした研究成果のオープンアクセスが機関リポジトリで進められている.出版社での公開とは異なり,リポジトリではコンテンツの公開時期を柔軟に選ぶことができる.一方,機関リポジトリは機関のコンテンツを横断的に網羅する必要があり,コンテンツのタイトルや著者名など機関で定められた属性名に対応する属性値 (メタデータ) を追加する必要がある.したがって,コンテンツに対する属性名を自由に拡張することは難しい.そのため,学部や研究者個人のページ,研究者情報データベースなどの業績データベースなどにリポジトリのメタデータを流用することも難しい.そこで本研究では,リポジトリシステム WEKO に対して,リポジトリ上のコンテンツメタデータに付与する形でユーザが任意のメタデータを追加,表示,公開するためのソフトウエア SarabiWEKO を開発した.Institutional repositories (IR) have been collected many research articles, thesises and university journals. Metadata of these contents are restricted by institutional archiving policy. Thus it is difficult to reuse the metadata for other purpose, e.g. department web pages, researcher databases or field repositories. This study develops new functionality for IR, extending its showcase ability to different sectors in the university. This system, called SarabiWEKO, enables to append specific metadata by the sectors to the contents in the IR.
著者
奥野 拓 高橋 正輝 山田 亜美 川嶋 稔夫
出版者
一般社団法人情報処理学会
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2014, no.3, pp.1-7, 2014-03-22

本研究は様々な形式でデジタル化され散在する地域の歴史資料を LOD 化し,関連付けることにより統合利用を可能とすることを目的とする.本報告では,函館地域の例として,絵葉書の画像アーカイブ,地域史年表,歴史上の人物紹介をそれぞれ RDF データセット化した事例を取り上げる.また,それらを関連付けた統合利用例として,「エピソードでつながる函館歴史写真」 と 「函館ゆかりの人物スポット」 を示す.Regional of historical records are digitized and on public via the Internet. This study aims at enabling integrated application of them by making LOD of them and link with each other. This report focuses on an activity in Hakodate, making RDF datasets of the archives of picture postcards, the chronology of city history, and the biography of famous historical persons. As examples of integrated applications, "The Historical Photographs of Hakodate Linked by Episodes" and "The Spots Associated with Persons of Hakodate" are shown.
著者
江村 優花 関 洋平
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012, no.1, pp.1-7, 2012-03-19

現在,電子メールや Twitter で,顔文字が使用されている.顔文字はユーザの感情を表すのに便利であるが,反面,その種類は膨大であり,適切な一つを選ぶことは難しい.そこで,本研究では,ユーザの顔文字選択支援を目的とし,ユーザが入力したテキストに現れる感情,コミュニケーション,動作のタイプ推定を行い,顔文字を推薦する方法を提案する.感情,コミュニケーション,動作のタイプの推定は k-NN に基づき実装し,推定精度は,マクロ平均で 53.1% となった。また,システムが推薦する顔文字がユーザの意図にどの程度適合しているか実験した結果,66.7% の顔文字が適切に推定されており,感情カテゴリのみを用いて推薦された結果と比べて,提案手法の顔文字推薦の精度が有意に向上していることがわかった.Many users used facemarks in recent computer mediated communication environments such as e-mail, Twitter or facebook. Facemarks are useful to express the emotion or communication functions beyond texts. However, many users feel difficult to choose the right one from lots of candidates. We propose a method to recommend facemarks based on the estimation of emotions, communication, or motion types in texts written by users. We implemented emotion, communication, or motion type estimation system with k-NN, and the accuracy of estimation is 53.1% on macro average. We also estimated the relevance of recommended facemarks for user intention, and found that 66.7% of facemarks were recommended properly, which improved significantly over the recommendation results only from emotions categories.
著者
栗山和子
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013-IFAT-112, no.3, pp.1-8, 2013-09-19

本研究では,国立大学の附属図書館が Twitter をどのように利用しているのか,簡単な実態調査を行い,大学図書館の PR ツールおよびサービスツールとしての Twitter の有効性について考察した.まず,全ての国立大学の附属図書館について,Twitter のアカウントを収集し,ツイートの発言者の属性をプロフィールや図書館の公式サイトを用いて公式アカウントを同定した.次に,TwitterAPI を用いて,各アカウントのユーザ情報およびツイート 100 件を抽出し,その内容をいくつかのカテゴリに分類した.結果として,大学図書館のツイートの内容は,従来の館報や掲示による広報の範囲内に収まっており,双方向的なやりとりやリツイートによる情報拡散などの Twitter の特性を十分活用しているものではなく,主に簡易的な広報ツールとして使用されていること,また,公式アカウントがフレンドとしてフォローしているユーザの 4 割はフォロワと重複しており,必ずしも,Twitter 上での有用な情報源をフレンドとして登録しているわけではないことなど,まだ,大学図書館の Twitter 利用には課題が多いことがわかった.
著者
新井誠也 平川豊 大関和夫
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013-IFAT-112, no.1, pp.1-8, 2013-09-19

マイクロブログサービスの Twitter が注目を集めている.Twitter が持つ特徴の 1 つにリアルタイム性に優れていることが挙げられるが,近年ではその特徴を生かし,実世界で起きているイベントを Twitter から観測しようとする研究が活発に行われている.本研究では,列車の遅延というイベントに焦点を当て,鉄道利用者から発信されるツイートをもとに各路線の列車の運行状況を判断するシステムを提案する.加えて,リアルタイム性の観点からシステムの有効性を確認する.遅延検出の閾値を,実際の遅延発生時における単位時間当たりのツイート数と各路線・各時間帯の鉄道利用者数を考慮して定める.その結果,鉄道会社の公式運行情報よりも早く列車遅延の第一報を配信可能としたことを示す.
著者
宇陀 則彦
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012, no.3, pp.1-4, 2012-09-18

ディスカバリサービスの意義を利用者が理解することは難しい。なぜなら利用者のメンタルモデルとデイスカバリサービスの機能が一致しないからである。しかしながら、ディスカバリサービスの重要な性質である 「広がりと着地」 が適切に実装されれば、理解が進むと思われる。It is difficult for users to understand significance of discovery service because mental model of users and functions are mismatched. However, understanding will deepen, if "reach and touch" those are important features of discovery service will be implemented appropriately.
著者
高久雅生 江草由佳 岡本真 大向一輝
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012-IFAT-108, no.4, pp.1-6, 2012-09-18

東日本大震災を契機として,博物館,図書館,文書館,公民館の被災・救援情報を集約するウィキサイトを構築した saveMLAK ウィキにおける編集がどのように行われたかを定量的に分析する.サイト設立から 1 年以上にわたる有志のボランティアによるウィキ編集行為の内容を明らかにすることを試みる.
著者
木村 優介 駒水 孝裕 波多野 賢治
雑誌
研究報告情報基礎とアクセス技術(IFAT) (ISSN:21888884)
巻号頁・発行日
vol.2022-IFAT-148, no.24, pp.1-6, 2022-09-02

深層学習を用いた文書分類は従来の手法と比べて高精度を達成してきた.文書分類は固有表現抽出とのマルチタスク学習によりその精度を向上させることが可能であると報告されている.単語に基づいた特徴量を基本とする手法において,意味のまとまりとしてのフレーズは文書分類の精度に寄与することが知られている.一方で,深層学習においてサブワードは一般的に使われているが,単語とは異なり,意味のまとまりを表すとは限らない.そのため,サブワードで構成されるフレーズを文書分類に応用する研究はされてこなかった.そこで,本研究では文書分類の精度向上を目的に,サブワードフレーズ抽出と文書分類のマルチタスク学習を行う文書分類フレームワークを提案する.従来の単語に基づくフレーズ抽出手法が出現頻度を用いてきた点に倣い,本稿では高頻度なサブワードのフレーズをサブワードフレーズとして定義し抽出する.
著者
一瀬 航 嶋田 和孝
雑誌
研究報告情報基礎とアクセス技術(IFAT) (ISSN:21888884)
巻号頁・発行日
vol.2017-IFAT-124, no.4, pp.1-6, 2017-02-03

近年,機械学習を用いたテキストマイニング手法によって,テキスト情報と市場変動の関係性を発見し,市場分析に応用する研究が増えている.また,Web ニュースは企業の株価に少なからず影響を与えており,世に存在する個人投資家がこのニュース記事を参考にしていると考えると,Web ニュースから未来の株価が予測できる可能性がある.そこで本論文では,Web ニュースを対象とし,より多くの投資家が市場の分析に用いていると考えられる指標である日経平均株価の予測を目的とする.テキストを用いた金融予測では膨大なテキスト情報を用いて機械学習を行うことが一般的である.しかし,投資家は市場に影響を与える多様な情報を自ら取捨選択し,独自の着眼点にしたがって市場の分析を行っている.本研究では,この着眼点,つまり,分析にどのような情報が必要なのかという知識を専門家の分析記事から抽出し,これにより機械学習の精度が向上するかの検証と新素性の提案を行う.
著者
神田 峻介 泓田 正雄 森田 和宏 青江 順一
雑誌
研究報告情報基礎とアクセス技術(IFAT) (ISSN:21888884)
巻号頁・発行日
vol.2015-IFAT-119, no.10, pp.1-6, 2015-07-29

トライと呼ばれる順序木を効率的に表現するデータ構造として,高速な検索を提供するダブル配列がある.また,データの大規模化に伴いコンパクト性が重視される背景に応じて,様々なダブル配列の圧縮表現が提案されてきた.しかし,これらの圧縮表現は,トライにおける順方向の遷移 (親から子) のみを提供し,逆方向の遷移 (子から親) を提供していないため,結果としてダブル配列における逆引きや動的更新を犠牲にしている.本論文では,逆方向遷移を可能としたコンパクトな配列構造を提案する.記憶量について,ダブル配列の約 36%でトライを表現可能なことが実験により確認されている.
著者
土屋 圭 豊田 正史 喜連川 優
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013, no.31, pp.1-6, 2013-07-15

鉄道の運行トラブルが発生した際,マイクロブログには鉄道の運行状況に関する情報が投稿されている.マイクロブログの投稿には運行トラブルについて,公式情報よりも詳細な情報が含まれることがある.鉄道の運行状況について詳しく知ることは意思決定を行う上で非常に重要である.本論文では Twitter の投稿を解析することによって,首都圏の鉄道運行トラブル状況に関する詳細な情報を抽出する手法について提案し,その評価を行う.提案手法は,東京メトロ 9 路線における運行トラブルの発生状況,復旧状況,混雑状況を対象に情報の抽出を行う.運行トラブルの発生状況については,運行トラブルを全線運転見合わせ,一部区間運転見合わせ,その他の異常の 3 段階に分けて抽出を行った.実験結果から,全線運転見合わせ,一部区間運転見合わせを抽出する場合において提案手法が有効であることが確認できた.また,復旧状況および混雑状況の抽出によって,公式情報だけではできないような意思決定を支援できうることが確認できた.When train troubles occur, users of microblogs often post information about these troubles. Microblogs often include more fine-graind information of train troubles than official information. Such information could make out decision better. In this paper, we propose a method for extracting details of train troubles by analyzing Twitter. We classify train troubles into suspensions, partial suspensions and other troubles, then detect whether these troubles occur or not. Experimental results show that proposed method work well in case of suspencions and partial suspencions. We also find that by analyzing twitter, we can know information which is not reported officially such as congestion and recovery of train troubles.
著者
大場 みち子 伊藤 恵 下郡 啓夫
出版者
一般社団法人情報処理学会
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2015, no.2, pp.1-4, 2015-03-23

我々は数学思考力を研くことでプログラミング力が向上できるとの着想から,プログラミングの思考過程の構造と数学の問題解決過程に相関があるとの仮説を立て,プログラミング力向上のための数学学習材の開発を目指している.また,数学学習教材の開発によりプログラミング力向上を目指すだけでなく,論理的文章作成力も同時に養成できると考えた.このためには,プログラミング思考過程での 「論理的思考力」 と 「論理的文章力作成」 に必要な 「論理的思考力」 の類似性を調べる必要がある.つぎに,類似性がある場合,この類似性と数学学習を行うことで転移される 「論理的思考力」 との相関を調べる必要がある.そこで,本稿ではプログラミング力と論理的文章作成力との類似性を分析する.両者の類似性を評価するために,初年次プログラミング教育科目の成績とレポート課題による論理的文章作成力との相関を分析し,プログラミング力と論理的思考力の関係を明らかにする.We had a idea of a programming force can be improved by brushing the math thinking. I hypothesized that there is a correlation structure and mathematical problem solving process of programming of thought process. It is aimed at the development of mathematics learning material for programming force improvement. In addition, we not only aim to programming force enhanced by the development of mathematics learning materials, logical Writing force also I thought to be able to request at the same time. In this paper, we consider the commonality of the programming power and logical Writing force. To confirm the relationship between the two, to analyze the correlation between logical Writing force by results and reporting issues programming exercise courses. We evaluate them in the experiment.
著者
簗瀬 拓弥 増田 英孝 山田 剛一 荒牧 英治 中川 裕志
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013-IFAT-110, no.1, pp.1-6, 2013-02-21

本研究では電車の運行状況をリアルタイムに一般の Twitter のユーザのツイートから取得することを目的とする.対象として常磐線をキーワードとして含むパブリックタイムライン上のツイートを半年分収集した.このデータを用いて単位時間あたりのバースト数を元に定常時と異常時を判別し,通知を行うシステムを試作した.また,遅延や運転見合わせ時のユーザのツイートの特徴の分析を行った.
著者
堀江和磨 鈴木伸崇
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012-IFAT-107, no.12, pp.1-8, 2012-07-25

XML は Web 上の標準的なデータ記述フォーマットとして広く普及している.XML データをデータベース等で継続的に蓄積・管理する場合,格納すべきデータの構造をスキーマで定義しておき,それに沿った構造のデータを作成・格納することが一般的である.利用状況の変化により格納すべきデータの構造や種類が変化するため,それに応じてスキーマ定義も更新されることが多い.その場合,スキーマの更新履歴の管理やスキーマの更新に応じた XML データの修正等が必要となるため,スキーマ間の差分抽出アルゴリズムが有用である.そこで本稿では,正規木文法のための差分抽出問題について考察し,同問題が計算困難であること,および,同問題が効率良く解けるための十分条件を示す.また,その十分条件の下で動作する多項式アルゴリズムを求め,このアルゴリズムに関する評価実験を行う.
著者
川端 健士 金子 邦彦
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012, no.9, pp.1-5, 2012-01-13

記事データベースからキーワード抽出をし、代表キーワードの選定を行ってキーワード辞書を独自に作成することによって大規模な記事集合の中から必要な情報へとたどり着くことを実現したい.今回は投稿型のWEB上の魚類図鑑であるWEB魚図鑑の4668件の記事からキーワード辞書の作成を行った。MeCabを用いて名詞を抽出し、重複を除去して9545語の名詞が得られた。その中には表記ゆれを含むキーワードが154語確認できた.これらの表記ゆれから一語の代表キーワードを決定するために独自のフローチャートを組んで、代表キーワードが決定できるようにフィルタを考案した。また、各キーワードの特徴量を論理値と数値で表現した表を作成し、表記ゆれを含むキーワードからの代表キーワードを決定するフローチャートが"True"、"False"の2値表現を7項目と数値3項目を用いることで動作することを確認した.こうして名詞全体からWEB魚図鑑におけるキーワードとして4946語を選ぶことができた.We would like to accomplish to get a requiring article from large article database by using keyword dictionary which extracted from the article database. In this paper, we made a keyword dictionary of WEB Fish Encyclopedia which is composed by many contributors and has4668 files. We operated MeCab to get only nouns, and removed duplicate nouns. We obtained 9545 nouns from WEB Fish Encyclopedia. In these files, we found 154 words of orthographical variants. We designed some filters to establish our own flowchart to extract one representation. We also checked that we can run the flowchart by expressing orthographical variants with "True" or "False" for 7 items and numbers for 3items. We selected 4946 keywords from WEB fish Encyclopedia which contains 4668 text files.
著者
竹中 姫子 古宮 嘉那子 小谷 善行
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2011-IFAT-102, no.1, pp.1-6, 2011-03-21

Twitter ではハッシュタグという,自分の投稿 (ツイート) に則した内容のインデックスをつける機能が提供されている.本研究ではハッシュタグのついていないツイートにたいしてハッシュタグを推定することを目的とする.そこでハッシュタグのついたツイートを学習し,そしてあるツイートがどのハッシュタグに属するかの推定を行った.分類器としてベイジアンフィルターを使用し,それぞれのタグについて 2 値分類を行い,複数のハッシュタグの推定を行った.実験では 50 種類のハッシュタグのつきの約 4 万件のツイートを学習データとして使用した.ツイート文にベイジアンフィルターを適用する場合は既知語に限定して処理を行うことで良い結果が得られるとわかった.
著者
上里和也 田中正浩 浅井洋樹 山名早人
出版者
一般社団法人情報処理学会
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2014, no.22, pp.1-6, 2014-07-25

Twitter のような大規模なソーシャルサービスにおいて,ユーザの興味や所属などのプロフィールを知ることは,効果的なマーケティングを行う上で重要である.このような背景から,Twitter におけるプロフィール推定に関する研究が行われてきた.従来のプロフィール推定手法では,フォロー情報によって構築されるソーシャルグラフからコミュニティを抽出し,対象のユーザが属するコミュニティの属性を推定することでプロフィール推定を行なっている.しかし,各々のフォローの目的や,活発な交流があるかという点を考慮することができないため,実際に親密な関係を持つユーザ群をコミュニティとして抽出することが困難であるという問題が存在する.それに対して奥谷らは,フォローに代えてメンション情報を用いてソーシャルグラフを構築することで,これらの問題を解決する手法を提案している.しかし同手法には,プロフィール推定の対象となるユーザの周辺ユーザのプロフィールに幅広く共通して出現する単語が,プロフィールとして出力されにくいという問題がある.そこで本論文では,奥谷らのプロフィール推定手法における単語の重要度の算出方法を変更し,Twitter ユーザ全体からランダムにサンプリングした 100,000 ユーザのデータを利用して一般語をフィルタリングすることで,この問題を解決する手法を提案する.6 人の被験者による実験の結果,奥谷らの手法と比較して,Precision@10 が 0.37 から 0.78,MRR が 1.44 から 2.61 に向上した.
著者
高井 正成 阪口 哲男
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012, no.1, pp.1-8, 2012-09-18

近年, Web アプリケーションの提供者はその機能を他のアプリケーションから利用してもらうため, Web API を提供する事例が増加している. Web API では HTTP などの通信プロトコルによるリクエスト・レスポンスにより通信を行うという大きな枠組みは共通しているものの,細かな仕様は各 Web API 提供者によって定められる.そのため各 Web API に互換性がなく, Web アプリケーション開発者は Web API を利用する場合,仕様を確認しそれぞれの Web API の仕様に沿ったプログラムライブラリを作成する必要がある.そこで本研究では開発者がプログラムライブラリを自分で作成する手間を省くため, Web API の仕様文書から情報を抽出し,プログラムライブラリを自動生成する手法を提案する.The case is increasing that Web Application providers publish Web APIs which are used by other applications with Web protocol. They are designed based on common simple protocol but detail specification of each of them is decided by its provider. So Web APIs don't have compatibility with each other. Web application developers have to read documents of Web APIs and make program libraries for them if they use Web APIs. This paper proposes a method to make program libraries automatically by means of information extraction from Web API documents in order to developers avoids the trouble of making program libraries.
著者
古田 富彦 小浪 博英 中挾 知延子
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013, no.9, pp.1-6, 2013-02-21

本発表は東洋大学地域活性化研究所プロジェクトの一つである地域婚活の実態調査に基づくものである.2011 年より 3 年計画で 「ぐんま赤い糸プロジェクト (あいぷろ)」 を対象にして地域婚活活動を調査し,地域の活性化への方策について探ってきた.「あいぷろ」 は,群馬県少子化対策・青少年課が県内の企業,団体,自治体等を 「会員団体」,「個人登録」 を受け付ける社会福祉協議会,イベントを企画・運営する 「協賛団体」 により未婚者相互の出会いを促進しようとするものである.少子高齢化が進む日本では,数々の自治体に地域婚活課などが作られている.また,街をあげての婚活イベント 「街コン」 が行われている.イベントにおいて地域住民の積極的な参加を呼びかけるウェブサイトでの文言は,住民が情報にアクセスする際のしくみと同様に重要な役割を果たしている.本発表では,過去 2 年間の調査活動を通じて得たいくつかの地域情報の発信についての考察や提案を行いたい.This report is based on a research on regional marriage hunting as a project of the Institute of Regional Vitalization Studies, Toyo University. This project is planned for three years, and since 2011, we have been seeking for a better solution for vitalization in Gunma prefecture, focusing on the Gunma "Akai-Ito" Project, AIPRO. AIPRO is a project on marriage hunting, which is called KONKATSU, directed by some public sectors in Gunma, and aims at establishing contact among the unmarried. Recently in Japan, as the population ages and fewer babies are born, many local governments have organized the regional marriage hunting sector, which lead KONKATSU events. On the other hand MACHI-KON events organized by town restaurants are very popular recently. In KONKATSU events, information diffusion strategy over the targeted local people should play a very important role as well as an efficient information access for them. We would like to show our project activity for the past two years, and then propose some consideration for why KONKATSU became such a very popular event in a region from a viewpoint of information diffusion.