- 著者
-
鈴木 英一
- 出版者
- 筑波大学
- 雑誌
- 萌芽研究
- 巻号頁・発行日
- 2003
最終年度の本年度には,過去二年間の研究を踏まえ,インターネット上の英語データから作製する言語データベースを英語研究・英語教育に利用し易いフォーマットに変更する方法を検討し,インターネットから良質の英語のウェブページを収集し,それから英語のデータベースを作成するための方法を検討した.このような方法をできる限り容易に実現できるように次のような検討を行った.(1)どのようなフォーマットをもつ言語データベースが一般的に最も柔軟で多目的であるかの検討(2)これまでの言語データベースを使用した経験に基づいた,言語研究・言語教育に最適なフォーマットの検討(3)データベースのフォーマットを使用者の希望に応じて再構成できるプログラムの検討(4)英語データの検索→英語文の抽出→英語データベースの作製→データベースのフォーマットの変更という手続きを簡単に行う方法の検討英語研究と英語教育に最も適切なデータベースの形式は,一つの文が一行になっている,すなわち,一つの英文が改行によって複数の行に分けられていないフォーマットであることが確認された.このような形でインターネットのウェブページを最も容易に利用できる方法は,MicrosoftやGoogleやYahooが提供する,いわゆるDesktop Searchと呼ばれるものである.これは,使用者のハードディスクの内容とインターネットのウェブページをシームレスに検索してくれるものである.また,データベースを作成するためにはhtmlファイルを効果的にテキストファイルに変換する必要があるが,最近,「html→テキスト変換」のソフトウェアがフリーウェアを含めて,かなりのものが出回っているので,どれがより使いやすいかを詳細に検討した.Desktop searchや「html→テキスト変換」によって得られたデータは,出典をタグとして付加し,さらに,行数も付け加えることによって,使い易くなることが明らかになった.今後は,3年間の研究を踏まえて,データベースの作成のためのプログラムの紹介や利用方法,作成された英語データベースのサンプル,英語データベースを利用した英語研究や英語教育への応用にいてまとめて,公刊したいと考えている.