著者
柳 燁佳 金 明哲
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.9, no.1, pp.1-11, 2020-08-01 (Released:2020-10-06)
参考文献数
19

菊池寛には代筆疑惑を持つ作品がいくつか存在し,連載小説「受難華」がそのなかの1 つである.本研究の目的は,「受難華」の真の著者を明らかにすることである.「受難華」の代筆疑惑は川端康成の証言によって発覚した.川端によれば,「受難華」は横光利一の代筆であるが,他に代筆説を支持する証拠がないため,「受難華」の代筆問題が未だに解決されていない. 本稿では,計量文体学のアプローチで「受難華」の代筆問題を検証した.具体的に,菊池寛と横光利一のそれぞれ32 作品と「受難華」の22 回分の連載(全集では69 節からなるが,ごく短い節もあるため,連載時の回単位で分割した)から集計した読点の打ち方,形態素の品詞タグのbigram と文節パターンの特徴量データに対して,階層的クラスター分析,主成分分析,そしてランダムフォレスト,サポートベクターマシンをはじめとする7 つの分類器を用いて統合的に著者判別を行った.その結果,「受難華」の各回は菊池寛の作品だという結論に至った.
著者
柳燁 佳 金 明哲
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.11, no.1, pp.1-14, 2022-08-01 (Released:2022-09-29)
参考文献数
37

近年,代筆疑惑を検証するための著者識別の方法論が発展しつつあり,その応用も飛躍的に普及している.これまでの著者識別の関連研究のほとんどはジャンルの影響を考慮して,用いる文章のジャンルを統一するのが一般的である.しかし,諸事情により同じジャンルの文章を収集することが困難な場合もある.日本語においては,異なるジャンルの文章が混在する場合の著者識別に関する基礎研究はまだない.本研究では,5人の現役日本人作家の2ジャンル(小説,随筆)の計200篇の文章からなるコーパスを作成して,著者識別に有効と報告されている14種類の特徴量と7種類の分類器を用いて,異ジャンル文章が混在する場合における著者識別の精度を比較した.その結果,ジャンルによって使い方が大きく変わる特徴量があるものの,適切な特徴量と分類器を選択すれば,異ジャンル文章が混在しても高い精度で著者識別ができることが分かった.
著者
吉野 諒三 陳 艶艶 鄭 躍軍 林 文
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.9, no.1, pp.13-26, 2020-08-01 (Released:2020-10-06)
参考文献数
55
被引用文献数
2

本稿では, 歴史や文化を含む社会経済的・環境的要因をも考慮しながら,環境配慮に関する人々の行動が実効性を持つようなメカニズムを探索する中で, 現在の「環境問題」自体が内包する問題や課題について考察を巡らせる. 特に, 常に現実の政策立案と密接に研究を推進していた林知己夫による人々の意識の表層と基底の区別や意識調査一般についての知見にも留意し,環境問題について具体的に実効性のある方策とは如何にあるべきかに思いを巡らせる.
著者
芝井 清久
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.11, no.1, pp.37-50, 2022-08-01 (Released:2022-09-29)
参考文献数
50

本研究は,核軍縮における人々の価値観および世論の構造の分析を目的とした調査データの収集とデータ分析のメタ・リサーチ・デザインをまとめたものである.核軍縮が停滞する国際社会において,外交以外の核軍縮を後押しする手段の模索は重要な課題である.国家の安全保障政策を変えるためには,核抑止が存在してもなお核軍縮を選択するだけの効用が必要になる.世論は政府に影響する変数のひとつであることから,本研究は核問題に関する人々の価値観に関する調査し,ひいては世論の影響力を分析することを目指す.国家の置かれた環境によって世論は変化するものであるため,本研究では国家を被爆国・核保有国・潜在的核保有国・非核保有国の4群に分類し,それぞれに属する国家で調査データを取得し,国内・国家間・群間の比較分析をおこなう.それらによって核抑止と核軍縮に関する価値観と構成要因を検証し,核軍縮に賛同する世論を形成するための条件を探る.
著者
吉野 諒三 田中 康裕 小出 哲彰 稲垣 佑典 芝井 清久 前田 忠彦
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.8, no.1, pp.3-24, 2019-06-01 (Released:2019-11-22)
参考文献数
13

公開データ利用促進の任務を担う情報・システム研究機構データサイエンス共同利用基盤施設のプロジェクトの一部として,2018 年3 月13 日「第2 回人間・社会データ構造化シンポジウム」が開催された.特に,社会調査データの公開における個人情報保護等の法的規制と倫理的指針について,同施設の社会データ構造化センターの法律アドバイザーである牧野二郎弁護士により,一般公開の特別講義が行われた.講演に先立ち,同センターの研究者たちとの協議を経て,牧野総合法律事務所により講演資料が用意された.本稿は,筆者らがその資料を改稿し,シンポジウムでの討議や,2018 年5 月よりEU で施行されているGeneral Data Protection Regulation(一般データ保護規則)など関連資料やその後の推移の確認などを含め,官民学の社会調査関係者向けに概説したものである. 現実の法律の執行は,各研究者の解釈や意図とは必ずしも完全には一致しないこともあり得るが,本稿は実証的データに基づく人文社会科学の発展や政策立案を促進するための参考としてまとめた.
著者
坂本 佑太朗 柴山 直
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.6, no.1, pp.31-45, 2017-03-01 (Released:2020-04-02)
参考文献数
37

テストが測定すべき心理学的な特性が多様化してくるにしたがって,「テスト(項目)はそもそも何を測っているのか」という構成概念に関する精緻な検証が求められている.最近では,その手段として多次元IRTが注目されてきており,これまでそれほど測定論的な関心が注がれてこなかったテストの下位領域についての定量的な検証の必要性も指摘されている.そこで本研究では,わが国の学習指導要領に則って作成された平成18年度新潟県全県学力調査における中学校2年生数学データ (N=9,102)に対して,多次元IRTを使って下位領域特有の影響について定量的に検証した例を示す.その結果,テスト全体が測定する「数学力」よりも下位領域特有の影響を強く受けている項目は25項目中2項目存在し,その内容は定性的な観点からも妥当であることが確認できた.つまり,多次元IRTを用いることにより,テスト項目の測定内容に関して項目レベルで次元に応じた情報が得られることを意味し,今後のテストデータ分析においても,単にIRTモデルを適用するだけではなく,多次元IRT分析にもとづくより精緻な妥当性検証が可能であることが示された.
著者
高橋 正樹
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.10, no.1, pp.1-28, 2021-08-01 (Released:2021-11-09)
参考文献数
37

日本分類学会初代会長の林知己夫先生を囲んで,「木曜会」と称する研究会が,1990 年代より2002 年に氏がお亡くなりになる前年頃まで月1 回程度のペースで開催されていた.村上征勝氏(当時,統計数理研究所)を事務局に,当初は渋谷駅に近い桜ヶ丘の林事務所で,後には参加者が増えたこともあり統計数理研究所の会議室で,数名から10 数名が集まっていた.初期には林先生の各方面での研究の講義,後には参加メンバーの各々が自分の研究を発表し,気楽な茶飲み話のような雰囲気で互いに講評をするというものであった.その中で高橋正樹氏の発案で林先生への公開インタビューが,2001 年に全3 回開催された.本稿はその第2 回分を収録したものである.第1 回及び第3 回(の一部)はそれぞれ『行動計量学』(高橋, 2004),『社会と調査』(高橋, 2012)に掲載された.今回で全3 回分が公開されることになり,すべてがJ-stage 等を通じてWeb 上で一般にダウンロードが可能となる.本インタビューを含め,戦後統計学の大きな柱の1 つであった林先生の科学者としての哲学と,また今日でも通ずる「科学者のあり方」,データ取得のプロセスからデータ解析,政策立案への提言までの全体を俯瞰した真正の「データの科学」,そして社会的課題解決のための本当の学際的「共同研究」のあり方について,読者の方々が深い思いを寄せる機会となれば幸いである.(編集委員長吉野諒三)本稿は公開インタビューとして行われた第2 回分をまとめたものである.事前に告知したタイトルは「共同研究の意義と方法:統計学者の立場から」であった.テープ録音を高橋が文章に起こし,林先生自身が一度目を通され,テープの余白部分の追加・加筆,録音時に不明だった点や表現,人名の確認などといった修正・補足をしていただいている.なお,一連のインタビューは,実は当初から3 回分を予定していたわけではなく,この2 回目の「共同研究」というテーマは林先生自身から発案があったものである.「日本人の読み書き能力調査」をはじめ数多くの共同研究に関わり,その中で数量化理論等が創り上げられていったことを考えれば納得できるテーマ設定である.様々な調査や研究の経験については,それまでにも書かれたり話されたりする機会は少なくないのに対し,共同研究という切り口からのものはほとんどない1.内容は大きく3 つのパートに分けられる.冒頭ではまず共同研究とはどのようなものかについて語り,続いてその背景となった個人の研究史や共同研究の経験について触れている.そのうえで,共同研究はどうあるべきかについて言及している.その内容は研究そのもののあり方にも及び,3 回の中で最もメッセージ色が強いものともなっている.あらためて整理していると,統計学さらには「データの科学」の発展には共同研究が欠かせないのだという強い思いが,この発案にあったことを感じる.(なお,以下,全体を通じて,林文編集顧問と吉野編集長が論文誌の体裁に整備してある.脚注の中で,(T)及び(Y)はそれぞれ高橋と吉野による注釈を示す.)(高橋正樹)
著者
豊田 秀樹 池原 一哉 吉田 健一
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.4, no.1, pp.57-77, 2015-03-01 (Released:2020-04-02)
参考文献数
19

本研究の目的は,3 次までの積率を明示的にかつ独立に特定できる確率分布を構成することである.非対称正規分布の母数に変換を施して,平均・分散・歪度を直接パラメタライズできるように新たな確率密度関数を構成する.3 次までの積率を独立に特定することで,(1) 統計モデルの一部として組み込んだ際に,直接歪度を推定すること,(2) 潜在変数(因子)の歪度を直接推定すること,(3) 群間で歪度を比較することが可能となる.非対称正規分布とχ2 分布に関するシミュレーション研究により,母数の推定における妥当性が確認された.また,歪度が観察されやすいブランド価値データに提案手法を適用した結果,集団間での3 次までの積率の違いを細かく比較できることが示された.母数推定には,マルコフ連鎖モンテカルロ法によるベイズ推定を用い,サンプリング手法にはハミルトニアンモンテカルロ法を利用した.
著者
吉野 諒三
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.1, no.1, pp.23-39, 2011-09-01 (Released:2020-04-03)
参考文献数
50

世論調査の「回収率の低下」が問題となって久しく,多くの議論が展開されてきた.しかし一方で,世論調査と他の調査との適正な分類や各調査の目的に応じた課題への対処がなされていない懸念がある.この背景には,各分野で調査に従事している人々が,先人が築き上げてきた調査の歴史と理論と実践の現場を必ずしも把握できていないことをあるのではと推察させる. 本論文では,調査方法論を根本より再考することにより,世論調査と他の調査を区別し,今日の調査研究の課題を考える上での示唆を試みる.1 節で問題提起をする.その問題の解決を念頭に,2 節で世論調査の歴史を振り返り,3 節で海外の世論調査の方法について概観する.4 節では確率論の基礎の数学的定義を確認する.これらを考慮しながら,5 節では調査に関する用語の意味を再確認し,6 節では調査の分類に応じた課題に対して提言を試みる.最後に7 節で将来の展開へコメントする.
著者
許 麗梦 金 明哲
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.10, no.1, pp.45-57, 2021-08-01 (Released:2021-11-09)
参考文献数
25

企業の継続性に関する研究において,財務諸表がよく用いられている.また,経済レポートや電子掲示板,有価証券報告書などを活用して,計量的アプローチで企業の倒産の兆候となる情報を抽出し,企業評価と株価予測などの研究が行われている.本稿では上場企業が金融庁へ提出する年度報告書「有価証券報告書」に載せられた財務に関する数値データとテクストデータを結合して,企業の倒産判別分析を試みた.テクストデータについてはテキストマイニングの方法でデータセットを作成して用いた.その結果,数値データとテクストデータを結合して用いた場合,判別指標のマクロ平均F 値は0.941 に達し,数値データだけによる判別率0.880 およびテクストデータだけによる判別率0.895 を大きく上回ることが示された.
著者
豊田 秀樹 大橋 洸太郎 池原 一哉
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.3, no.1, pp.49-61, 2013-09-01 (Released:2020-04-02)
参考文献数
16

心理学を始めとして,科学的なアプローチを重視してきた様々な学問分野の中で近年注目を集めるようになってきた研究の1 つに自由記述を対象とした分析がある.自由記述データは,その内に含まれる知見を得るために,質問紙調査の自由記述項目欄や,種々の質的研究法を用いて得られたデータを最終的にテキストとしてまとめ,その後の理論を構築するためにカテゴリ化を伴う際等に利用される.しかし現状では,知見の収集の達成の程度については客観的な指標が存在しない.そこで本研究では,得られた自由記述データについて,資源量推定の方法を用いて知見数と飽和度を示す捕獲率を推定する方法を提案した.分析には(株)日経BP コンサルティングが発表しているブランドジャパンの提供による,2 つの企業に対する2006 年から2010 年までの自由記述形式の印象調査の回答を用い,多くの知見数が集まるまでに必要な精読量を明らかにした.その結果,それぞれの精読に当てる全時間の20%,10%の精読量で,全ての知見の80%が収集できていることが示された.
著者
Wolfgang Jagodzinski Hermann Duelmer 稲垣 佑典 前田 忠彦
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.8, no.1, pp.25-46, 2019-06-01 (Released:2019-11-22)
参考文献数
29

Yamagishi & Yamagishi は,アメリカと比べて日本では一般的信頼が低いことを示したうえで,日本社会で広く見られる長期的なコミットメント関係が,一般的信頼の欠如をもたらしたと考察した. これに対して本研究は,「日本人の国民性調査」の二次分析を通じて,日本におけるコミットメント関係への選好が過去35 年ほどの間に一般的信頼の水準に強い影響を及ぼしたという仮説に疑問を投げかけるものである. なお,分析からは,一般的信頼と以下のような事柄との関連性が示唆された. ①一般的信頼は「年齢」によって弱い正の影響を受けるが,「教育」によって強い正の影響を受ける.したがって,教育機会の拡大と政治的関心の広がりによる「認知動員」の上昇や日本社会の高齢化の過程は,一般的信頼の向上をもたらした可能性がある.②都市化の影響については,依然としてあいまいなままであった. ③「性別」について、初期の調査時点では女性の一般的信頼は低かったが,1990 年頃になるとこのような性差は消失した. ただし上記の変数は,いわゆる「失われた10 年」や2008 年の世界的な経済危機の影響によって生じたと考えられる,1990~2008 年の一般的信頼の低下を説明するものではなかった.
著者
豊田 秀樹 池原 一哉 吉田 健一
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.4, no.1, pp.57-77, 2015

<p> 本研究の目的は,3 次までの積率を明示的にかつ独立に特定できる確率分布を構成することである.非対称正規分布の母数に変換を施して,平均・分散・歪度を直接パラメタライズできるように新たな確率密度関数を構成する.3 次までの積率を独立に特定することで,(1) 統計モデルの一部として組み込んだ際に,直接歪度を推定すること,(2) 潜在変数(因子)の歪度を直接推定すること,(3) 群間で歪度を比較することが可能となる.非対称正規分布と<i><font face="roman">χ</font></i><sup>2</sup> 分布に関するシミュレーション研究により,母数の推定における妥当性が確認された.また,歪度が観察されやすいブランド価値データに提案手法を適用した結果,集団間での3 次までの積率の違いを細かく比較できることが示された.母数推定には,マルコフ連鎖モンテカルロ法によるベイズ推定を用い,サンプリング手法にはハミルトニアンモンテカルロ法を利用した.</p>