著者
福田 智子 駒木 敏 田坂 憲二 黒木 香 矢野 環 川崎 廣吉 竹田 正幸 波多野 賢治 岩坪 健 古瀬 雅義 藏中 さやか 三宅 真紀 西原 一江 日比野 浩信 南里 一郎 長谷川 薫
出版者
同志社大学
雑誌
基盤研究(C)
巻号頁・発行日
2007

平安中期成立かといわれる類題和歌集『古今和歌六帖』約4500首を対象に、独自に開発した文字列解析システムを用いて、すべての和歌の出典考証を行った。また、複雑な書き入れに対応したテキストデータ作成のため、タグ付け規則を案出した。そして、六つの伝本のテキストファイルを作成した。それらを対象に、諸本の同一歌を横並びで比較対照でき、しかも、底本を自由に選択できる校本システムを開発した。さらに、伝本の原態、特殊な漢字表記、朱筆書き入れに関する基礎資料を作成した.
著者
木村 文則 前田 亮 波多野 賢治 宮崎 純 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.49, no.7, pp.59-71, 2008-03-15
参考文献数
18
被引用文献数
1

本論文では,Web 文書の言語横断情報検索において,Web ディレクトリの階層構造を利用して問合せの検索対象分野の推定に基づいた検索手法を提案する.提案手法では,Yahoo! カテゴリのような複数の言語版を持つWeb ディレクトリを問合せ翻訳における訳語の曖昧性解消のための言語資源として利用し,Web ディレクトリの下層のカテゴリを上位のカテゴリに統合したうえで,利用者が入力した問合せ語群から検索対象分野の範囲を推定することで,問合せ語群の最適な訳語に翻訳することにより,言語横断情報検索を行う.評価実験では,Web 文書の言語横断情報検索に適切なカテゴリ統合度がどの程度であるのか検証し,提案した検索対象分野の推定の有効性を検証した.In this paper, we propose a cross-language information retrieval (CLIR) method based on an estimate of query domain related with search results using hierarchic structures of Web directories. To get the most appropriate translation of the queries, we utilize the Web directories written in many different languages as multilingual corpus for disambiguating translation of the query and estimate a domain of search results using hierarchical structures of Web directories. Experimental evaluations showed that we could have an advantage in retrieval accuracy using our proposal for disambiguating translation in CLIR system.
著者
白井 涼子 波多野 賢治
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2012, no.2, pp.1-6, 2012-03-19

現在,和歌研究では計算機による和歌データの分析がなされており,和歌研究者の一部では新しい知識発見に寄与するシステム開発を望む声もある.和歌の原本は一冊しか存在せず,多くの人によって書き写されて普及していくことが一般的であるが,その書写過程において,誤字や表現の違いが発生し,同一和歌であっても異なる表記になっていることがある.和歌研究を進めていく上ではそれらの和歌を同一の和歌として扱う必要があるため,同一の和歌の一元的な管理を可能にすることが望まれる.そこで,本稿では RDF による和歌データ管理手法を提案する.RDF による和歌データ管理を行うことで,和歌に関連するあらゆるデータを紐づけることが可能となり,同一の和歌を同一として扱うだけではなく,和歌単体を眺めるだけでは気づかない新たな知識発見に役立たせることが可能となる.Recently, researchers tend to analyze character strings of Japanese poems using computers, and a part of them require someone to develop a system that contributes to find their new knowledge. There is just one original copy of their anthology in the world, so that it becomes widespread thanks to transcription by a lot of people. In their transcription process, however, a literal error and a difference in their spellings may be occurred. As a result, transcriptional Japanese poem is different from its original one. If the researchers want to proceed with their research, original and transcriptional ones should be consolidated. In this paper, we propose an approach for managing Japanese poems using RDF. It can help to bind all data related to a Japanese poem. As a result, we can turn new knowledge into a solution in the research field of Japanese poem.
著者
花川 賢治 天笠 俊之 波多野 賢治 宮崎 純 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2005, no.35, pp.81-88, 2005-03-25

本発表では、事実の集合を格納するデータベースからユーザの要求に応じた構造化文書を生成する処理について論じる。代表的な事実についての表現形式として、データベースと構造化文書が存在する。両者は対照的な性質を持ち、前者が意味的に独立した要素の集合であり、唯一の存在であるのに対し、後者は要素間の関係が木構造化され、その構造は利用者の参照の条件に応じて多数の種類が存在し得る。多数の種類の構造化文書を効率的に処理するためには、宣言的に構造化文書の仕様を記述するための言語と、データベースから構造化文書への変換を行う汎用の処理系が重要になる。本発表では、構造化文書の仕様記述言語に一階述語論理式を用い、Prologを拡張した処理系を実装する。We discuss a process of producing structured documents from a databases which contains facts.The usual methods of representing facts are a database and a structured document.They are very different.A database consists of independent elements and uniquely exists.In contrast, structured documents have tree structures where connections between elements have meanings and types of them are very diverse. In order to treat the diverse structured documents effectively, we propose a deductive language for specifying a tree structure and a general language processor for translating from a database to a structured document. In this language, the tree structure is specified in a first order predicate logic formula, and the language processor is implemented by extending a Prolog interpreter.
著者
杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.11, pp.975-990, 2004-11-01
被引用文献数
10

Web検索エンジンは,WWW(World Wide Web)上の情報を検索するための有用な手段である.しかし,同じ検索語が異なるユーザによって入力されたとしても,だれが検索語を入力したかにかかわらず,同じ結果を提示するという問題点を抱えている.一般に,各ユーザは自分の検索語に対して,異なる検索要求をもつと考えられる.したがって,その異なる検索要求をもつユーザに検索結果を適応させるべきであると考えられる.そこで本論文では,ユーザに負担をかけることなく各ユーザの検索要求に応じて検索結果を適応させる手法を提案し,その有効性について確かめる.実験の結果,修正した協調フィルタリングに基づいてユーザプロファイルを構築することによって,ユーザの嗜好に適応するきめの細かい検索システムを実現することができた.
著者
木村 優介 駒水 孝裕 波多野 賢治
雑誌
研究報告情報基礎とアクセス技術(IFAT) (ISSN:21888884)
巻号頁・発行日
vol.2022-IFAT-148, no.24, pp.1-6, 2022-09-02

深層学習を用いた文書分類は従来の手法と比べて高精度を達成してきた.文書分類は固有表現抽出とのマルチタスク学習によりその精度を向上させることが可能であると報告されている.単語に基づいた特徴量を基本とする手法において,意味のまとまりとしてのフレーズは文書分類の精度に寄与することが知られている.一方で,深層学習においてサブワードは一般的に使われているが,単語とは異なり,意味のまとまりを表すとは限らない.そのため,サブワードで構成されるフレーズを文書分類に応用する研究はされてこなかった.そこで,本研究では文書分類の精度向上を目的に,サブワードフレーズ抽出と文書分類のマルチタスク学習を行う文書分類フレームワークを提案する.従来の単語に基づくフレーズ抽出手法が出現頻度を用いてきた点に倣い,本稿では高頻度なサブワードのフレーズをサブワードフレーズとして定義し抽出する.
著者
榎真吾 波多野賢治
雑誌
第74回全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.395-396, 2012-03-06

カラオケは,現在では世界中で親しまれている娯楽装置である.その機能の一つである歌唱力採点は利用者の関心を引き,カラオケの普及に貢献してきた.しかし,歌唱力採点が算出した得点と聴取者の評価との間には乖離がみられる.その原因の一つには,歌唱技術であるビブラートの検出を行う際に,音声ピッチの時間変動を用いている為に発生する誤検出が挙げられる.本稿では,ビブラートの誤検出を解消する為に,歌声の響き成分であるフォルマントの時間変動を用いたビブラートの検出手法を提案する.提案手法により,現状の歌唱力採点の問題点であるビブラートの誤検出を解消し,ビブラートの検出精度を向上させることができた.
著者
長村玲奈 波多野賢治
雑誌
第73回全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.623-624, 2011-03-02

食事は日々の健康を支えるためには欠かせないものであり,毎日の献立を考える際の参考となるようにWebでは多くの料理レシピが公開されている.しかし,公開されている料理レシピのほとんどがすべてのユーザに対し一様な結果を返すのみであるため,膨大な料理レシピの中から各ユーザに最適な献立の組合せを探し出すことは困難である.本稿では,ユーザの食生活や健康状態を事前調査し,それに基づいた献立推薦システムの開発を行うことで,料理レシピ推薦のパーソナライズ化を行う.また,本システムを用いることで個々人の栄養素バランスを考慮して料理レシピ推薦が行えているかどうかをユーザビリティの観点で評価を行い,本システムの有用性を検証する.
著者
久米 出 波多野 賢治 中村 匡秀 柴山 悦哉
出版者
一般社団法人情報処理学会
雑誌
研究報告ソフトウェア工学(SE)
巻号頁・発行日
vol.2015, no.37, pp.1-8, 2015-03-05

逆回し (back-in-time) デバッガはプログラムのトレース (実行履歴) を記録して過去の状態の参照を可能する機能を有しており,デバッグに於ける診断のあり方を根本から変える可能性を秘めている.しかしながらその機能を有効に活用するためには,作業者が膨大なトレースの中から適切な実行時点を指定し,その状態の正不正を判定しなければならない.こうした指定や判定は作業者自身のプログラム理解に大きく依存している.オブジェクト指向プログラミングはプログラムの再利用性や拡張性が向上させる反面,コードの理解を困難にする傾向が指摘されている.我々はこうしたオブジェクト指向プログラムに固有な問題を解決するために,外挿診断法 (diagnosis by extrapolation) という手法を提案し,それを実現する逆回しデバッガを開発中である.本手法は指定された時点の実行文脈を,作業者の既知の情報を用いて抽象化する事によって,問題解決を実現する点に最大の特徴を有している.本論文では実用的なプログラムのデバッグ事例を通じて逆回しデバッガが実装すべき機能と手法の有効性の評価方法を考察する.
著者
植村 俊亮 波多野 賢治 天笠 俊之 吉川 正俊 渡邉 正裕 前田 亮 石川 正敏
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(B)
巻号頁・発行日
1999

インターネット時代を迎えて,地球規模の情報資源が現出しつつあると言われる.WWW(World Wide Web)は,その典型的な例である.しかし,WWWは,ばらばらに構築された,言語も文化も異なるホームページが互いに接続されて,利用可能になっているだけであって,そこから真に必要な知識を発掘する方式はまだ確立されていない.本研究では,WWWに代表される知識資源の大海から,必要な知識を発掘する方式を,とくにその多言語処理面から追求する.具体的には,次の多言語機能をもつ知識発掘システムの実現を目指す.1.ある言語で表現された情報資源に対して,それとは別の言語を使って問い合わせることができる.例えば,英語のホームページの集まりに対して,日本語で質問を出すことを可能にする.2.複数の異なる言語で表現された情報資源の集まりに対して,自分の一番使いやすい言語を使って,問合せを出し,必要な情報を発掘することができる、例えば,さまざまの言語を使ったホームページの集まりに対して,だれでも母国語を使って問い合わせ,知識を発掘することを可能にする.多言語知識発掘システムのため本研究では以下の項目について研究を実践した.1)対訳辞書を用いた検索語の翻訳手法,および並列コーパスによる統計的手法などを用いた効果的な多義性の除去手法,2)フォント埋め込み型HTML/XML文書による多言語文書のブラウジングシステムの実現,3)大量の多言語HTML/XML文書格納のためのHTML/XML文書データベースの開発.
著者
波多野 賢治
出版者
同志社大学
雑誌
若手研究(B)
巻号頁・発行日
2010

本研究では,多くのWeb検索エンジンが検索結果の表示形式にとらわれず,Webデータに対する情報検索における新しい検索結果の形式をWeb文書間のリンク構造,Web文書内の文書構造,そして利用者が入力する情報要求から算出される索引語の重みにより決定する方法の提案を行った. 本研究の成果は二つあり,一つは索引語の重みを正確かつ高速に再計算可能なアルゴリズムの提案,もう一つは誰もが容易に使用可能な情報アクセス機構の開発を行ったことである.その結果,索引語の重み再計算コストを約64%に減らすことができ,またどの文書のどの部分に利用者の情報要求を満たす部分が存在するのかを判断できる有用なツールとなり得ることが判明した.さらに,ドメイン内検索においてはこのような提示形式が非常に有効に機能することが判明し,本研究を行う意義は十分にあったということができる.
著者
福田 智子 矢野 環 田坂 憲二 岩坪 健 黒木 香 竹田 正幸 深川 大路 波多野 賢治 南里 一郎 宮崎 裕子 坂田 桂一 藤井 翔太
出版者
同志社大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

古今和歌六帖』と『源氏物語』を研究対象として校本システムを開発し、平安朝文学の伝本と表現に関する考察をおこなった。和歌用デジタル校本システムについては、伝本の墨付きの現状を、より論理的に表記するタグ付け規則を案出した。また、散文用校本作成支援ツールは、『源氏物語』の伝本4本のデータ処理をほぼ完了し、計算機を用いた異文箇所の数値化、およびSplits Treeによる本文系統の視覚化といった、本文異同を把握する一連の手法を確立した。
著者
鈴木 優 波多野 賢治 吉川 正俊 植村 俊亮 川越 恭二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.104, no.177, pp.195-200, 2004-07-07

現在,多くの検索システムを組み合わせることによって,検索システムの精度を向上させる方法が注目されている.このような検索システムでは,統合関数と呼ばれる,複数のスコアを統合するための関数を変更することによって,精度が向上することが知られている.ところが,最適な統合関数は利用者の問合せによって異なると考えられるため,あらかじめ一意に統合関数を定めることができない.ここで我々は,統合後のスコアの分布から,最適な統合関数を推定することができるのではないかと考えた.そこで本稿では,最適な統合関数を問合せごとに推定する方法として,シャノンの情報量の概念を援用した尺度を用いて,スコアの分布から統合関数の適合度を測定する方法の提案を行う.本提案では,利用者にとって必要な検索対象の数が検索対象全体の数と比較してきわめて少なく,検索結果に含まれる高いスコアの数が少ないとき,その検索結果は十分に正解集合を絞り込んでいると考えることができるため,利用者の検索目的に適した統合関数であると仮定した.評価実験を行うことによって,実際に適した統合関数を選択することができることを示した.
著者
佐保田 圭介 杉山 一成 波多野 賢治 吉川 正俊 植村 俊亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.71, pp.25-32, 2003-07-16

Web 検索エンジンによって得られる大量の検索結果の中から,個々の利用者が所望の情報を取得することは極めて困難であるため,有用な情報だけを取得する手法の提案が望まれている.そこで,本稿では協調フィルタリングとブックマークの構造を用いたフィルタリングを共に用いて,Web情報検索を支援するシステムを提案する.本研究では,ブックマークはそれを作成した人の Webページに対する有用な知識の集合であると考えているため,ブックマークされている Web ページだけではなくその構造も有用な知識であると考えている.したがって,閲覧している Web ページの持つキーワードを利用して,他の利用者がブックマークしている Web ページを推薦する協調フィルタリング機能を実現し,さらに協調フィルタリング機能によって推薦された Web ページを,ブックマークの構造を利用するフィルタリング機能を用いて厳選し,最終推薦Web ページとして提示するシステムの実現を目指す.It is expected to propose a technique to obtain only useful information for each user. Because,it is quite difficult for users to obtain their desired information among a large amount of search results returned by a Web search engine. Therefore, it is expected to propose a technique for obtaining only useful information for each user. In this paper, we propose an assistant system for user to help users to search Web pages using both collaborative filtering and filtering exploiting the structure of web bookmark. In our study, we regard each user's bookmark as a collection of useful knowledge, so that, we consider not only bookmarked Web pages but also its structure as useful knowledge. Based on these ideas, first we develop a collaborative filtering system that recommends Web pages bookmarked by other users using keywords included in a user's browsing Web page. And then our system carefully select the recommended Web page using filtering system based on the strucuture of bookmark and propose the selected Web pages as final recommended Web pages.