著者
田中 省作
出版者
日本社会学会
雑誌
社会学評論 (ISSN:00215414)
巻号頁・発行日
vol.68, no.3, pp.351-367, 2017 (Released:2018-12-31)
参考文献数
30

膨大なテキストを機械処理し, 知識の発見や仮説の検証を行う, テキストマイニングとよばれる方法論がさまざまな分野で活用されはじめている. そのようなテキストマイニングと密接な関係にあるのが, 計算機で日本語や英語といった自然言語の処理を探究する自然言語処理である. 本稿では, 今後, テキストマイニングが社会学も含め多様な分野で展開されることを念頭に, 自然言語処理を概観し, その言語観や自然言語処理からみたテキストマイニングについて事例を交えつつ, 論じる.自然言語処理は, 情報科学, 言語学や認知科学などにまたがる学際的な分野である. 自然言語処理はテキストマイングを重要な応用として位置づけており, 汎用的な基礎解析だけではなく, 課題にそくした技術開発等も行われている. その自然言語処理は技術開発の際, 言語を大胆に捨象し, 近似することが日常的に行われる. その結果, 現在の技術水準では文脈などの大局的な言語情報は必然的に失われ, 自然言語処理を活用するテキストマイニングにも強く影響する. 得られる知識断片には, 専門家による関連知識の補完や解釈が必然的に求められることになる.
著者
神谷 健一 田中 省作 北尾 謙治
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.16, no.2, pp.2_45-2_58, 2009 (Released:2011-09-01)
参考文献数
13

本稿ではデータベース・ソフトウェアの1つである FileMaker Pro による,英語学習教材の自動作成における言語処理技術と教材作成の連携可能性を提案する.著者は,実際の英語の授業でも利用しやすいプリント教材や簡易 E-learning 教材を出力できるツールを開発し,無料公開している.これらのツールでは GUI 環境での操作が可能であるため,パソコン利用スキルが限られる一般の英語教員にも利用しやすく,任意の英文素材から Phrase Reading を軸とした精読教材および Cloze テストを利用した学習教材を短時間で作成することができる.
著者
小山 由紀江 杉森 直樹 田中 省作
出版者
名古屋工業大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

本研究の目的は理工系学生の英語語彙・語句に関する能力を測定するために、科学技術コーパスデータの分析に基づいたコンピュータ適応型テスト(CAT)を作成することである。この目的ため、科学技術コーパスを分析し、重要語彙・語句を抽出しこれを試験項目に使用した。テスト項目の分析と受験者の能力推定にはLatent Rank Theory(LRT)を採用し、予備テストを実施し230項目の項目バンクを作成した。これらを基に開発した理工系英語CATをmoodle上で実施した結果、科学技術英語のテストとして一定の妥当性があることが解った。
著者
徳見 道夫 冨浦 洋一 田中 省作 宮崎 佳典 小林 雄一郎
出版者
九州大学
雑誌
基盤研究(C)
巻号頁・発行日
2012-04-01

科学論文の執筆や論文の読解において求められる重要な英語語彙は,分野や組織によって異なるため,分野や部局等の組織別に選定されることが望ましい.本研究は,近年,大学などの主要な研究機関で整備されている機関リポジトリ(自機関の著作物を電子アーカイブし公開するオンラインデータベース)を活用し,大学・部局別の重要語彙リストを効率的に作成する方法を提案した.実際に,九州大学を対象として,提案手法による部局別重要語彙リストを作成し,その有用性を確認した.
著者
田中 省作 本田 久平 長谷川 由美
出版者
立命館大学
雑誌
挑戦的研究(萌芽)
巻号頁・発行日
2017-06-30

研究計画に従い,次のようなテーマを重点的に推進した.1. 崩れのモデルに基づいた指文字の生成:前年度提案した,掌と手の向きごとに分割した手指に対して生理構造の観点で最も安定的な手指の状態形状との一種の重み付き平均に基づいた手指形状の生成モデルの実装を進めた.このモデルのパラメタである重みの範囲が,指文字の崩れに連関する.そのパラメタは被験者実験で推定することを計画していたものの,コロナ禍の影響もあり,かなわなかった.2. 学習システムのプロトタイプの実装:カメラに向かって指定された指文字を表出し,それを自動的に認識した上で,その正誤を判定するようなモジュールの開発を進めた.1のテーマが進み,指文字ごとに許容される崩れの範囲がパラメタとして推定されれば,この学習システムの正誤判定にそのまま適用できる.3. 指文字学習のための新しいテキストの作成:これまでの指文字の崩れや,指文字間の錯誤に基づいた部分形状を活用した指文字の類型化を盛り込んだ,今までにない新しい指文字の学習テキストを作成した.
著者
行野 顕正 田中 省作 冨浦洋一 柴田 雅博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.1, pp.365-374, 2007-01-15
被引用文献数
1 2

スラッシュ・リーディングとは,意味のかたまりごとにスラッシュで区切られた英文を読むことにより,読解力の向上を目指す学習法である.多くのスラッシュ付き英文を読むことで,学習効果が上がると考えられるが,現在のところ十分な文書数のある学習教材が存在しないという問題がある.本稿では,統計的アプローチを用いて任意の英文にスラッシュを自動的に挿入する手法を提案する.英文中のスラッシュの位置を定める主な要因は,英文の部分的な構文構造・セグメント長のバランス・一部の単語であるという仮定に基づき,パラメトリックな確率モデルおよびSVM を構築する.既存の教材を学習データとしてモデルを学習することで,その教材のスラッシュ挿入規則を模倣したスラッシュ付き英文を作ることができる.3 つの既存教材を対象とした実験では,提案手法が,様々な教材におけるスラッシュ挿入規則を,従来手法よりも高い適合率・再現率で模倣できるという結果が示されている.In Slash Reading, learners read English sentences separated into segments (sense groups) with slashes to improve their reading skills. The more texts for Slash Reading a learner read, the more effect of learning could be expected. However, there are not enough materials for Slash Reading. This paper proposes methods for transforming automatically a plain sentence into a slashed sentence based on statistical approaches. A parametric model and a SVM model are built on the assumption that the factors to decide where to insert slashes into a sentence are a portion of the syntactic structure of the sentence, the lengths of the segments and words around the slashes. The models are learned from an existing material for Slash Reading. The systems based on these models, therefore, can transform automatically a plain sentence into a slashed sentence by imitating positions of slashes in the material. The results of the experiments using existing materials for Slash Reading indicate that the proposed methods imitate positions of slashes of the materials with the higher precision and recall than the previous methods.
著者
田中省作 冨浦洋一 宮崎佳典 小林雄一郎 徳見道夫
雑誌
第75回全国大会講演論文集
巻号頁・発行日
vol.2013, no.1, pp.83-85, 2013-03-06

科学論文などの英語(EAP)には,EGPとよばれるような一般的な英語とは異なる表現や構成が求められる.さらに,それらは分野によっても大きく異なることが知られており,分野ごとの学術表現リストの作成はEAPにおける重要な課題の一つである.本研究では,近年,多くの研究機関で整備されつつある自組織の研究者が執筆した著作物を電子的に蓄積・公開しているデータベース・機関リポジトリに着目する.それらのデータを活用することで,当該機関が扱う研究分野に依拠したような,従来よりも粒度の細かい部局別の英語学術表現リストの効率的な作成支援を試みる.
著者
池田 大輔 安東 奈穂子 田中 省作
出版者
ディジタル図書館編集委員会
雑誌
ディジタル図書館 (ISSN:13407287)
巻号頁・発行日
no.27, pp.1-8, 2005-03-08

電子図書館サービスの多くは、従来からある図書館サービスを電子的に行うことにより、図書館員が行う作業の効率化や資料への効率的なアクセスを実現するものであり、新たなサービスを提供するものは少ない。筆者らの研究グループは新たな電子図書館サービス構築を目指し研究を進めており、その過程で個人情報を含んだ貸出履歴をサービスに使うことの是非が大きな問題点として浮上した。本稿では、図書館の役割や利用者の個人情報について考察し、新たな電子図書館のサービスによる利便性向上と個人情報保護を両立するモデルを提案する。
著者
池田 大輔 安東 奈穂子 田中 省作
出版者
ディジタル図書館編集委員会
雑誌
ディジタル図書館 (ISSN:13407287)
巻号頁・発行日
no.27, pp.1-8, 2005-03-08

電子図書館サービスの多くは、従来からある図書館サービスを電子的に行うことにより、図書館員が行う作業の効率化や資料への効率的なアクセスを実現するものであり、新たなサービスを提供するものは少ない。筆者らの研究グループは新たな電子図書館サービス構築を目指し研究を進めており、その過程で個人情報を含んだ貸出履歴をサービスに使うことの是非が大きな問題点として浮上した。本稿では、図書館の役割や利用者の個人情報について考察し、新たな電子図書館のサービスによる利便性向上と個人情報保護を両立するモデルを提案する。