著者
福本 文代 福本 淳一 鈴木 良弥
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.4, no.2, pp.89-109, 1997-04-10 (Released:2011-03-01)
参考文献数
28
被引用文献数
1

本稿では, 文脈依存の度合いに注目し, 重要パラグラフを抽出する手法を提案する. 本手法では, Luhnらにより提唱されたキーワード密度方式と同様, 「主題と関係の深い語はパラグラフを跨り一貫して出現する」という前提に基づく. 我々は, 文脈依存の度合, すなわち, 記事中の任意の語が, 設定された文脈にどのくらい深く関わっているかという度合いの強さを用いることで, 主題と関係の深い語を抽出し, その語に対し重み付けを行なった.本手法の精度を検証するため人手により抽出したパラグラフと比較した結果, 抽出率を30%とした場合, 50記事の抽出総パラグラフ数84に対し75パラグラフが正解であり, 正解率は89.2%に達した.
著者
鈴木 良弥 川隅 里奈 関口 芳廣 重永 実
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1995, no.51, pp.21-26, 1995-05-25
参考文献数
6

話し言葉中では助詞の省略,曖昧な発声などが頻繁に起こる.従って,話し言葉の認識や理解を行なうには助詞の推定を行なう必要がある.我々は朗読文用連続音声認識システムをすでに作成しているが,そのシステムの助詞推定能力を人間と比較した.まず,話し言葉(対話文とスピーチ)中の各助詞の出現回数などを調べた.その結果,良く使われる助詞は対話文でもスピーチでもほとんど同じであることがわかった.また認識システムの出力と学生73人にアンケートを行なった結果とを比較した.実験により,学生が作成した文の約94%をシステムが生成し,システムが作成した候補文の約3%を学生が作成したことを確認した.We are trying to make our speech recognition system to correspond to spoken dialogue. First, we investigated the frequency of each particle in some dialogues and speeches, and we registerd 29 frequently used particles to our system. Second, We sent out a questionnaire to 73 students in order to compare with the performance of estimation of particles by the linguistic processor (case structures, syntactic rules, and so on) of our speech recognition system. According to the comparison, our system can generate most of sentences which students can think out.
著者
福本 文代 鈴木 良弥
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.89, no.3, pp.552-566, 2006-03-01
被引用文献数
2

本論文では,人手により複数の分野名が付与された文書における分野名誤りのうち,文書分類の精度に悪影響を与えるものを自動的に検出し,修正する手法を提案する.我々は,誤り検出と修正の手掛りとして三つの点に注目する.1点目は分類に悪影響を与える事例を抽出するために機械学習Support Vector Machines(SVMs)で得られるサポートベクトルと機械学習Naive Bayes(NB)を利用する点である.2点目は誤り事例を検出するために損失関数を利用する点である.3点目は,過剰な修正を抑えるため,分野名をノードとする階層構造を利用する点である.Reuters1996のコーパスを用いて実験を行った結果,誤り検出と修正の精度はそれぞれ0.8391,0.767であった.更に,修正結果を文書分類へ適用した結果,分類精度が0.5〜1.7%向上することが分かり,誤り修正の効果が現れていることが確認できた.
著者
小谷 信司 鈴木 良弥 渡辺 寛望
出版者
山梨大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2012-04-01

発話が不可能で両手両足の自由がきかない重複肢体不自由者に対して、視線を利用したコミュニケーション実現を目指している。過去の研究において、短い語彙入力の場合、有効性が認められたが、長い文章入力の場合で、誤入力が生じると、極端に効率が悪くなることが判明した。そこで、静的属性(知識・経験)、基本属性(時間・空間的情報)、動的属性(周囲・人物情報)を組み合わせて、その状況に応じた予測変換を実現することを目指した。シミュレーション実験と健常者による実験において良好な結果が得られた。現在、支援学校に協力してもらい生徒と一緒に取組を行い、その有効性を検証中である。
著者
鈴木 良弥
出版者
山梨大学
雑誌
基盤研究(C)
巻号頁・発行日
2003

本研究では,新聞記事を対象とした自動要約に注目し,高精度な複数記事の要約をおこなうための第一歩として,(1)大規模コーパスから話題テンプレートを作成し,その話題テンプレートを利用して新聞記事から注目する記事の続報記事を高精度で抽出する.抽出した続報記事を話題クラスタごとに分類する(2)話題クラスタごとの要約を行い,クラスタ間のつながりを考慮し,続報記事全体の要約を行う。ことを目的とし,研究を行った.(1)では話題テンプレートや機械学習(Support Vector Machines)を用いて続報記事を抽出する手法を提案した.提案手法を用いて大規模コーパス(Topic Detection and Trackingのコーパスや毎日新聞コーパス)から続報記事を抽出する実験を行い,本手法が続報記事を高精度で抽出できることを示した(論文4,5).(2)に関しては,具体的にはクラスタ内の要約のために,クラスタに集められた文中の類似単語を検出する必要があることがわかり,類似名詞の抽出を行った(論文3,4).類似名詞の抽出のためにHindleの手法とLinの手法を比較し,日本語文書に対してはLinの手法がHindleの手法より勝っていることを示した.またLinの手法を日本語記事に適応させた類似名詞抽出手法を提案した.また,抽出された類似単語と記事のタイトルを利用して重要文抽出を行った(論文1,2).Linの手法を基に(論文3,4)で提案した手法を用いて記事のタイトル中の単語の類似単語を本文中より抽出し,重要文抽出に利用した.毎日新聞の記事とNTCIR2の重要文抽出タスクの解答を利用して重要文抽出実験を行い,本研究で抽出した類似単語の情報が重要文抽出に有用であることを示した.