著者
石岡 恒憲 亀田 雅之
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.16, no.1, pp.3-19, 2003
参考文献数
33
被引用文献数
8

アメリカで実施される適性試験のひとつであるGMAT(Graduate Management Admission Test)において,実際に小論文の採点に用いられているe-raterを参考にして,その日本語版ともいうべきJessを試作した.Jessは,文章の形式的な側面,いわゆる文章作法を評価する「修辞」と,アイディアが理路整然と表現されていることを示す「論理構成」と,トピックに関連した語彙が用いられているかを示す「内容」の3つの観点から小論文を評価する.毎日新聞の社説およびコラム(「余録」)を学習し,これを模範とした場合に適切でないと判断される採点細目に対して減点することで採点を行う.また書かれた小論文の診断情報を提示する.システムは現在UNIX上で動作し,800-1,600字の小論文を通常能力のパソコン(Plat'Home Standard System 801S; Intel Pentium III 800MHz; RedHat7.2)で1秒程度で処理する.
著者
石岡 恒憲 亀田 雅之
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.16, no.1, pp.3-19, 2003-12-20 (Released:2017-05-01)
被引用文献数
4

アメリカで実施される適性試験のひとつであるGMAT(Graduate Management Admission Test)において,実際に小論文の採点に用いられているe-raterを参考にして,その日本語版ともいうべきJessを試作した.Jessは,文章の形式的な側面,いわゆる文章作法を評価する「修辞」と,アイディアが理路整然と表現されていることを示す「論理構成」と,トピックに関連した語彙が用いられているかを示す「内容」の3つの観点から小論文を評価する.毎日新聞の社説およびコラム(「余録」)を学習し,これを模範とした場合に適切でないと判断される採点細目に対して減点することで採点を行う.また書かれた小論文の診断情報を提示する.システムは現在UNIX上で動作し,800-1,600字の小論文を通常能力のパソコン(Plat'Home Standard System 801S; Intel Pentium III 800MHz; RedHat7.2)で1秒程度で処理する.
著者
石岡 恒憲 峯 恒憲 亀田 雅之
出版者
独立行政法人大学入試センター
雑誌
基盤研究(C)
巻号頁・発行日
2014-04-01

センター試験など大学入試レベルの短答式記述試験における自動採点および人間採点を支援する実用可能なシステムの試作および実装をした.自然言語における完全な意味理解はこの数年では不可能であるという判断のもと,採点は設問ごとに作題者が用意した「採点基準」に従った自動採点を基本とし,その結果を人間が確認・修正できるものとする.システムは「(予め用意された)模範解答」と「実際の記述解答」との意味的同一性や含意性を判定するほか,プロンプトと呼ばれる素材文と解答文との意味的近似性なども考慮する.また採点結果は多値分類であることから,サポートベクターマシンではなくランダムフォレストによる機械学習分類を使う.
著者
亀田 雅之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1997, no.85, pp.119-126, 1997-11-12
被引用文献数
5

文書中の重要文を抽出するために、高順位の段落中の文を優先して文の重要レベルを付与する段落シフト法を主体にした手法を述べる。段落や文内のキーワード候補群間で構成単語レベルでの重複を計数して得た段落間及び文間関速度を、正規化分母の相違に応じて参照関連度と被参照関連度とに区別し、見出しは参照関連度平均値、段落は被参照関連度平均値、文は両関連度平均値の線形和を基本スコアとして順位付けする。この上で、見出しは見出し群内での順位値により、本文中の文は段落内での順位値を段落の順位でシフトして、各々重要レベルを付与し、さらに、見出しとの関連度等で補正を行う。本手法による重要文抽出の小実験(平均12.1文,42新聞記事)を行い、最高レベルの文で再現率約64%/適合率約71%の結果を得た。This paper describes a method to extract key-sentences from texts based on preference-ranking sentences within preference-ranked paragraph. Two types, a referring type and a referred-to type, of degree of relevance between two elements, determined by counting component words common to the two groupes of keyword-candidates, are used for ranking the elements, such as paragraphs or sentences. The key-sentence level assigned to a sentence is calculated by shifting the rank-value of the sentence within the paragraph by the rank-value of the paragraph including the sentence. The result of the highest level key-sentence extractions from 42 newspaper articles shows 64%-recall and 71%-precision compared to sentences selected by human readers.