著者
王玉馨 清水 伸幸 吉田 稔 中川 裕志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2008, no.46, pp.7-14, 2008-05-15
被引用文献数
3

コーパスから同義語の対を抽出するための一般的な方法では、通常二つ単語間の類似度 (例えば、cosine 類似度) が必要である。類似度を使用することで、特定のクエリ単語に対しての類似語ランキングが可能になり、同義語候補リストから正しい同義語が認定できる。この論文では、それに加えて、単語類似度ネットワークを分析する新しい方法を提案する。単語類似度ネットワークでは閾値以上の類似度をアークとして、単語をノードとして定義する。提案する自動同義語候補選択ためのランク閾値(Rank Threshold for synonym candidate Selection RTS) によって類似度の順位が閾値以内のアークが構成される単語類似度ネットワークはスケールフリーグラフである。 この性質に基づいて、我々は新しい同義語候補のリランキング手法を提案する。これを相互リランキング法 (Mutual Re-ranking Method MRM) と呼ぶ。同義語獲得における提案手法の有効性を示すために MRM 方法を Reuters-21578 に適用した。 実験結果によって、RTS と MRM が同義語抽出の品質の向上させることが示された。Popular methods for acquiring synonymous word pairs from a corpus usually require a similarity metric between two words, such as cosine similarity. This metric enables us to retrieve words similar to a query word, and we identify true synonyms from the list of synonym candidates. Instead of stopping at this point, we propose to go further by analyzing word similarity network that are induced by the similarity metric for the edges with the similarities that are ranked as top threshold number. By introducing the rank threshold for synonym candidate selection method (RTS), our analysis shows that the network exhibits a scale-free property. This insight obtained from the network leads us to a method for re-ranking the synonym candidates -a mutual re-ranking method (MRM). We apply our methods to Reuters-21578 to show the generality of the methods on synonym acquisition. The results show that RTS and MRM boosts the quality of acquired synonyms.
著者
斉藤 和巳 中野 良平
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.103, no.490, pp.13-18, 2003-12-01

本報告では,統計モデルとして定式化した2種類のニューラルネットを用いて,文書が属すると思われるトピックの推定とトピックを特徴づける単語群の抽出法を論じる.これら推定と抽出法の特徴は,事後確率の最大化によるトピック抽出に着目した目的関数を採用して学習し,その結果として得られたパラメータの大きさに基づいて特徴語を抽出することである.Web上のテキストヘの適用事例を通して,トピック抽出性能と特徴語抽出能力を評価する.
著者
山元 理絵 小林 大 吉原 朋宏 小林 隆志 横田 治夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.11, pp.38-48, 2007-06-15
被引用文献数
6

近年,Webサイトによる情報発信の重要性から,ユーザのニーズに適したサイト構築や情報提供の要求が高まってきている.WebアクセスログをWebページ推薦に用いる方法は,クライアント側に手を加える必要がなく有用であるが,これまで提案されている手法では,頻出アクセスパターンとわずかでも外れると適切な推薦ができない,あるいは順序を考慮できないといった問題点があった.我々は,それらの問題を解決するために,WebアクセスログからLCS(Longest Common Subsequences)を抽出してページ推薦に利用する手法であるWRAPLを提案している.本稿では,実際のWebアクセスログを用いた実験を通してWRAPLの効果を詳細に解析し,その実験結果から得られた知見を基に優先順位付け手法に対して改良を行い,その有効性を示す.Sophisticated websites satisfying users' requirement becomes much more important to propagate information via websites, nowadays. Web page recommendation methods using web access logs are useful for them because they need no modification in client-side applications to meet the requirement. However, traditional methods have problems of insufficient recommendation precision caused by strict matching of access patterns or neglect of access sequences. To solve the problems, we are proposing WRAPL as a method of extracting LCSs (Longest Common Subsequences) from web access logs and using them to recommend web pages for an active session. In this paper, we analyze the effects of WRAPL using actual web access logs and propose an enhanced weighting method for it to improve the precision based on the analyses.
著者
中野 次雄
出版者
早稲田大学法学会
雑誌
早稲田法学 (ISSN:03890546)
巻号頁・発行日
vol.57, no.1, pp.1-21, 1981-11-30
著者
眞砂 照美
出版者
佛教大学
雑誌
佛教大學大學院紀要 (ISSN:13442422)
巻号頁・発行日
vol.29, pp.175-191, 2001-03-01

視覚障害をもつ人の学習は、一般に点字図書と録音図書を使用して行われるが、わが国では、そのほとんどがボランティアによって制作されており、その絶対量の不足とジャンルの偏りが指摘されている。視覚障害者の学習環境は十分に整備されているとは言い難い状況である。本稿は、音訳活動をボランティアとしての捉え方ではなく、生涯教育の視点から考察するところに特長がある。まず盲先覚者の学び方を取り上げ、読みという活動について整理し、さらに非文字情報の音訳化の実験を通して音訳活動の性格について検討した。その結果、音訳活動には、読み手側の学習経験や読む能力が大きく影響し、視覚障害者のための音訳活動が結果的に、音訳者自身にとっても新たな学習形態を創り出すことが明らかになった。
著者
岡田 将吾 長谷川 修
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J91-D, no.4, pp.1042-1057, 2008-04-01

本研究では,オンライン教師なし学習手法であるSelf-Organizing Incremental Neural Network (SOINN)を用いて各状態の出力分布を自己組織的に近似可能な時系列データの学習モデルを提案する.提案手法は従来手法であるストキャスティックDP法を拡張した新規の手法である.ストキャスティックDP法では各状態を一つの多次元正規分布で近似しているのに対し,提案手法では各状態の出力分布がSOINNによって自己組織的に近似される上,各状態の出力分布が詳細に近似されるため,時系列データの頑健なモデル化が可能となる.提案手法の有効性を検証するために,動画像から得られる動作及び音素を用いた認識実験を行った.HMM (Hidden Markov Model)及びストキャスティックDP法と認識精度を比較することで提案手法の有効性を示す.
著者
栗田 多喜夫 麻生 英樹 梅山 伸二 赤穂 昭太郎 細美 章隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.2, pp.257-266, 1996-02-25
被引用文献数
9

本論文では, 多層パーセプトロンの中間層の各ユニットに独立なノイズを加えたとき, 学習結果がどんな影響を受けるかについて考察し, ノイズを付加することによりネットワークが構造化されることを示す. 具体的には, 中間層が1層のみで, 出力層の入出力関数が線形のネットワークの中間層の各ユニットに独立なノイズを加えた場合の誤差逆伝搬学習アルゴリズムの平均的な振舞いを解析し, 中間層から出力層への結合荷重はより小さな値をとるようになり, 逆に, 入力層から出力層への結合荷重は中間層の出力が0か1に近づくようになることを示す. これは, 中間層の各ユニットにノイズを付加することにより, ネットワークが自動的に構造化されることを意味している. その結果として間接的に汎化能力の高いネットワークが構成されることが期待でき, 学習におけるノイズの役割として非常に興味深い. 更に, パターン識別問題と論理関数の学習問題に対して, ノイズを加えて学習した場合とノイズを加えないで学習した場合を比較し, ノイズを加えることによりネットワークが構造化されることを実験的に確かめた.
著者
永田 智子 鈴木 真理子 森広 浩一郎
出版者
日本教育工学会
雑誌
日本教育工学会論文誌 (ISSN:13498290)
巻号頁・発行日
vol.29, pp.181-184, 2006
被引用文献数
3

筆者らは,教員養成課程の大学生が,デジタル・ティーチング・ポートフォリオを作成する授業を開発・実践してきている.本研究ではこのデジタル・ティーチング・ポートフォリオを,ブログを使って作成することの可能性について,授業実践を通して検討する.