著者
山本 倫生
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.32, no.1, pp.21-44, 2019 (Released:2020-07-17)
参考文献数
56

探索的因子分析において, 因子負荷量行列を用いて結果の解釈を行う際には, いわゆる因子回転を行うことが有用であり, これまでに数多くの回転方法が開発されてきている. 因子回転問題自体は古典的な問題であり, 例えば Browne (2001) では2000年までの研究内容がよくまとめられている. 一方で, 因子回転基準の最適化における一般的なアルゴリズムである勾配射影法の開発や, component loss functionを用いた回転方法の提案など, 2000年以降も因子回転問題に関連する研究が継続して行われている. 本稿では因子回転法やその最適化アルゴリズムの古典的内容から比較的近年の内容についても解説を行うとともに, 構造方程式モデリングでの因子回転の利用や正則化法との関連などについても言及する.
著者
石岡 恒憲
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.18, no.1, pp.3-13, 2006-06-30
被引用文献数
2

K-means法の逐次繰り返しとBICによる分割停止基準を用いることで,クラスター数を自動的に決定するアルゴリズムx-means法を改良した.その手続きは,分割順序に起因する好ましくないと考えられる分割クラスターを併合するものである.この併合操作により,さまざまな事例に対して,適当と考えられるクラスター数を得ることのできる事例の数が大幅に増加することが確認された.この方法は,クラスター数未知のときに発見的な方法に拠らずに情報理論的に最適と考えられるクラスター数を求めることができる.その計算量(computational complexity)は標本サイズをN,クラスター数をkとしたとき,ο(N log k)となる.
著者
野口 聡一 湯淺 麻紀子 岩本 圭介 丸山 慎
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.28, no.1, pp.69-80, 2015

ツイッターをはじめとする現代のソーシャル・ネットワーキング・サービスの発展によって, 私たちのコミュニケーション活動は膨大なデータとしても記録され, そのデータの入手もきわめて容易に行えるようになった. しかしその一方で, 収集された膨大な情報の構造や特徴を解析し, その結果を何らかの目的に沿って有効に活用していくためには, どのような方法が適切かつ効率的なのかといった点については, 未だ十分な検討がなされているとはいえない.<br> そこで本研究では, ツイッターデータの分析に関する1つのモデルケースを示すことを目的として, テキストマイニングによる分析事例を紹介した. 対象としたデータは, 宇宙飛行士が宇宙滞在中および地球帰還後に投稿したツイッターの文章データとそれらに対する読者のリアクションデータであった. 分析の主たる結果から, 文章情報をつぶやくツイッターというフィールドにおいて, 読者が最も高い関心を寄せ, 即時的なリアクションを起こしていた内容は, 「写真」や「動画」であることが明らかになった. さらに本研究では, ツイッターデータの解析が, 単にデータの特徴を把握するだけに留まらず, それらを基にしたマーケティング領域 (例えば訴求力のある広報活動の展開) への応用可能性などについても示唆的な議論を展開した.
著者
清水 邦夫
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.19, no.2, pp.127-150, 2008-01-31 (Released:2017-05-01)
参考文献数
61
被引用文献数
1

方向統計学における主に2000年以降の文献に基づいて本分野の発展を概観する.円周上および球,トーラス,シリンダー,円盤上の分布の生成と応用例について述べる.その他,回帰と確率過程,推定と検定,ソフトウェアの現状について報告する.
著者
王 杰 岸田 和明 松井 幸子
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.8, no.2, pp.107-116, 1996-05-31

本研究では,採録論文数と被引用回数という2つの尺度によって,社会科学分野における重要な雑誌群である「コア・ジャーナル」を特定するための実験を行った.研究の素材としては,International Bibliography of the Social Sciences (IBSS)およびSocial Science Citation Index (SSCI)を使用した.その結果,経済学,政治学,社会学,社会人類学・文化人類学の分野別に,IBSSとSSCIの両者に採録されており,採録論文数とインパクト・ファクタ(被引用回数を掲載論文数で補正)の両者あるいはいずれかでコア・ジャーナルとなる雑誌群や,いずれかのコア・ジャーナルではあるが他方には採録されていない雑誌群など,5つの特徴ある雑誌群からなるコア・ジャーナルを特定した.さらに上記の4分野には含まれないが,社会科学分野全体ではコア・ジャーナルとなる学際性の高い雑誌群も見出した.最後に,得られたコア・ジャーナル・リストの利用方法について検討した.
著者
石村 友二郎
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.26, no.2, pp.93-103, 2014-06-20 (Released:2017-05-01)

本研究では,重回帰分析の統計量をグラフで表現したボンサイグラフを提案する.決定係数を盆栽の幹の太さ,標準偏回帰係数の絶対値を枝の長さ,偏相関係数を枝の角度といったように,重回帰分析の統計量を盆栽に見立てたグラフ上に表現することにより,重回帰モデルの良さを評価することができる.さらに,枝の角度に偏相関係数を用いる場合と単相関係数の場合とのグラフを比較することにより独立変数間の影響の程度をグラフ上から読み取ることができる.また,独立変数間に共線性がある場合とない場合とではボンサイグラフの形が異なって表現される.このように重回帰分析の統計量をグラフ化することで,一度に多くの情報量を含めることができ,総合的にモデルの評価をすることが可能になる.
著者
小木 しのぶ
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.28, no.1, pp.31-40, 2015 (Released:2017-05-01)
参考文献数
19

テキストマイニングという言葉が登場し, はや10年以上が経過している. テキストマイニングは魔法の杖で使えば何でもうまくいく, といった大きな勘違いからテキストマイニングに対する期待が一気に膨らんだ時期もあった. しかし実際はうまくいかないことも多く, テキストマイニングへの期待は大きく失われ, 実社会への適用がいったんすたれる傾向が見受けられた. そのことで, テキストマイニングは逆に地に足のついた研究や解釈がされるようになり, とかく巨大になりがちなテキストデータの分析において, ハードウェア並びに高速化技術によるデータ処理速度向上の助けも受け, 新たな発展が進んでいる. この報告では, これらの技術と変遷について研究と活用の動向をまとめる.
著者
石岡 恒憲 亀田 雅之
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.16, no.1, pp.3-19, 2003
参考文献数
33
被引用文献数
8

アメリカで実施される適性試験のひとつであるGMAT(Graduate Management Admission Test)において,実際に小論文の採点に用いられているe-raterを参考にして,その日本語版ともいうべきJessを試作した.Jessは,文章の形式的な側面,いわゆる文章作法を評価する「修辞」と,アイディアが理路整然と表現されていることを示す「論理構成」と,トピックに関連した語彙が用いられているかを示す「内容」の3つの観点から小論文を評価する.毎日新聞の社説およびコラム(「余録」)を学習し,これを模範とした場合に適切でないと判断される採点細目に対して減点することで採点を行う.また書かれた小論文の診断情報を提示する.システムは現在UNIX上で動作し,800-1,600字の小論文を通常能力のパソコン(Plat'Home Standard System 801S; Intel Pentium III 800MHz; RedHat7.2)で1秒程度で処理する.
著者
野口 聡一 湯淺 麻紀子 岩本 圭介 丸山 慎
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.28, no.1, pp.69-80, 2015 (Released:2017-05-01)
参考文献数
4

ツイッターをはじめとする現代のソーシャル・ネットワーキング・サービスの発展によって, 私たちのコミュニケーション活動は膨大なデータとしても記録され, そのデータの入手もきわめて容易に行えるようになった. しかしその一方で, 収集された膨大な情報の構造や特徴を解析し, その結果を何らかの目的に沿って有効に活用していくためには, どのような方法が適切かつ効率的なのかといった点については, 未だ十分な検討がなされているとはいえない. そこで本研究では, ツイッターデータの分析に関する1つのモデルケースを示すことを目的として, テキストマイニングによる分析事例を紹介した. 対象としたデータは, 宇宙飛行士が宇宙滞在中および地球帰還後に投稿したツイッターの文章データとそれらに対する読者のリアクションデータであった. 分析の主たる結果から, 文章情報をつぶやくツイッターというフィールドにおいて, 読者が最も高い関心を寄せ, 即時的なリアクションを起こしていた内容は, 「写真」や「動画」であることが明らかになった. さらに本研究では, ツイッターデータの解析が, 単にデータの特徴を把握するだけに留まらず, それらを基にしたマーケティング領域 (例えば訴求力のある広報活動の展開) への応用可能性などについても示唆的な議論を展開した.
著者
保科 架風
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.25, no.2, pp.73-85, 2013-06-17 (Released:2017-05-01)
参考文献数
14

高次元データに基づく線形回帰モデリングにおいて,モデルの推定と変数選択を同時に実行するlassoは新たなモデル選択手法となり,様々な発展的手法が提案されている.Bayesian lasso(Park & Casella, 2008)はlassoをベイズアプローチに拡張し,推定にマルコフ連鎖モンテカルロ法を適用したものである.これにより,lassoの事後分布の抽出やモデルの推定への事前情報の組み込みが可能となったが,Bayesian lassoには推定と変数選択の同時性が存在せず,モデル選択法として有効に機能しないということが分かった.この問題に対して,本論文ではBayesian lassoの推定値を事後確率に基づいて修正し,推定と変数選択の同時性を持たせる計算アルゴリズムを提案する.また,モンテカルロシミュレーションによって,提案アルゴリズムが推定精度や予測精度に与える影響などについて検証する.
著者
清水 邦夫
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.19, no.2, pp.127-150, 2008-01-31
被引用文献数
1

方向統計学における主に2000年以降の文献に基づいて本分野の発展を概観する.円周上および球,トーラス,シリンダー,円盤上の分布の生成と応用例について述べる.その他,回帰と確率過程,推定と検定,ソフトウェアの現状について報告する.
著者
保科 架風
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.25, no.2, pp.73-85, 2013-06-17

高次元データに基づく線形回帰モデリングにおいて,モデルの推定と変数選択を同時に実行するlassoは新たなモデル選択手法となり,様々な発展的手法が提案されている.Bayesian lasso(Park & Casella, 2008)はlassoをベイズアプローチに拡張し,推定にマルコフ連鎖モンテカルロ法を適用したものである.これにより,lassoの事後分布の抽出やモデルの推定への事前情報の組み込みが可能となったが,Bayesian lassoには推定と変数選択の同時性が存在せず,モデル選択法として有効に機能しないということが分かった.この問題に対して,本論文ではBayesian lassoの推定値を事後確率に基づいて修正し,推定と変数選択の同時性を持たせる計算アルゴリズムを提案する.また,モンテカルロシミュレーションによって,提案アルゴリズムが推定精度や予測精度に与える影響などについて検証する.
著者
杉本 知之 下川 敏雄 後藤 昌司
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.18, no.2, pp.123-164, 2007-02-28
被引用文献数
7

本稿では,樹木構造接近法とその発展の主要な流れを総合的に省察する.CARTの方法論は諸種の樹木構造接近法の理解と発展において避けることのできない基礎をなしている.MARS法はCART法の連続型への有意義な拡張である.最近の発展において,アンサンブル学習法と融合し組み立てられた接近法は,より強い予測性能をもち,より魅力的な変数重要度の結果を与える.ここでは,広範な応用への示唆を提供するために,これらの諸種の方法における適用例と簡単なシミュレーション結果を与える.最後に,各方法の特微を要約し,今後において関心のある研究を与える.
著者
石田 明日香 高柳 昌芳 保科 架風 岩山 幸治
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.36, no.2, pp.99-126, 2023 (Released:2024-01-11)
参考文献数
16

現在, バスケットボールの選手評価に使われる指標には, 評価値の信頼性に関する情報を得ることや選手同士の相乗効果に関する評価が難しいという問題がある. これに対し本論文では, チームメイトや対戦相手など同時に出場している選手の能力や, チームメイトとの相乗効果を考慮に入れたモデルをベイズ推定することでそれらの問題を解決する選手評価が可能になることを示した. また, 選手の攻撃・守備能力などの事後分布を解析的に導出することで, 選手の能力評価値やそれらのアフィン変換で得られる指標のベイズ信用区間を構築し, 能力値の推定の不確実性についても評価できることを示した. これは, マルコフ連鎖モンテカルロ法を利用するよりも計算コストを抑えることが可能である. また, アメリカ National Basketball Association (NBA) のデータを利用し, 既存手法との比較検証を実施し, 提案手法は既存手法よりも妥当な選手評価を提供することを確認した.
著者
村上 征勝
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.9, no.1, pp.65-74, 1997-05-30 (Released:2017-05-01)
参考文献数
23

近年のパソコンをはじめとするデータ処理機器の発達と,多変量解析などを中心とする統計手法の進歩に伴い,著者や成立時期などが不明の文献に対し,文の長さ,品詞の使用率,単語の使用率などを計量分析することによって,そのような問題の解決を試みる新しい文献研究の分野が確立されつつある. これまで,『新約聖書』の中の「パウロの書簡」,『源氏物語』,『ジュニアス・レター』,『連邦主義者』,『紅楼夢』など多くの重要な著作物が分析されており,それらの研究を通じて,文献の計量分析における問題点は次第に明らかになってきた.この論文では,まず文献の計量分析の歴史を簡単に紹介し,次にこれらの研究から明らかになった計量分析の課題を,特に日本語文献の計量分析に重点を置き論ずる.
著者
大谷 隆浩 菅澤 翔之助 野間 久史
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.31, no.1, pp.17-33, 2018 (Released:2019-02-27)
参考文献数
41

過去十数年の間に世界中で行われたゲノムワイド関連解析 (genome-wide association study; GWAS) の成果により, 様々な形質に関連する数千の一塩基多型 (single nucleotide polymorphism; SNP) が同定されている. これまでのGWASでは, 集団内におけるマイナーアレル頻度がある程度高いSNPを対象として研究が行われてきたが, 近年のDNAシークエンシング技術の飛躍的な発展に伴い, 頻度が極めて低い希少変異 (rare variant) に注目した研究が行われるようになっている. 統計学的な観点からも, 希少変異の関連解析は頻度が高いSNPの解析に比べてより困難となることから, GWASで一般的に採用されている単一のSNPによる単変量の関連解析ではなく, 注目する遺伝子やDNA領域内にある複数の変異の情報を集約した上で, 表現型との関連を検定する手法が提案されている. 本稿では, 近年の様々な方法論的研究で提案されている, 希少変異を対象とした関連解析手法のレビューを行う.
著者
村上 征勝
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.9, no.1, pp.65-74, 1997
参考文献数
23

近年のパソコンをはじめとするデータ処理機器の発達と,多変量解析などを中心とする統計手法の進歩に伴い,著者や成立時期などが不明の文献に対し,文の長さ,品詞の使用率,単語の使用率などを計量分析することによって,そのような問題の解決を試みる新しい文献研究の分野が確立されつつある. これまで,『新約聖書』の中の「パウロの書簡」,『源氏物語』,『ジュニアス・レター』,『連邦主義者』,『紅楼夢』など多くの重要な著作物が分析されており,それらの研究を通じて,文献の計量分析における問題点は次第に明らかになってきた.この論文では,まず文献の計量分析の歴史を簡単に紹介し,次にこれらの研究から明らかになった計量分析の課題を,特に日本語文献の計量分析に重点を置き論ずる.
著者
亀岡 瑶 宗像 昌平 八木 圭太 山本 義郎
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.29, no.2, pp.181-188, 2016 (Released:2017-05-01)
参考文献数
4

顧客の購買記録から何らかの基準で顧客を分類する意義のひとつに, 分類されたそれぞれの顧客群に対する各々の購入の特徴を見出すことで, 別個のレコメンドが考えられるという点がある. 自己組織化マップ (SOM) を用いることで, あらかじめクラスター数について議論する必要なく, 類似する観測データをまとめることができる. 本研究では, 会員制度を導入しているスーパーマーケットのPOSデータに対して, SOMに関するアルゴリズムを適用させ, 顧客の分類を行う. また, SOMによるマッピングの可視化を用いた顧客や店舗の特徴分析を行った.
著者
安川 武彦
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.28, no.1, pp.41-55, 2015 (Released:2017-05-01)
参考文献数
42

単語文書行列によって表現されたテキストデータのように, 非負値しかとり得ないデータを分析する方法として非負値因子行列分解がある. これは, 非負の要素のみからなる行列を, 非負制約の下で2つの行列に分解するものである. 本稿では, テキストデータの解析を行う上で重要と思われる点に焦点を絞り, 非負値行列因子分解の概要を紹介する. さらに, 過去25年間の日本計算機統計学会和文誌の要旨を対象に, 非負値行列因子分解を用いた分析結果を報告する.
著者
石岡 恒憲 亀田 雅之
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.16, no.1, pp.3-19, 2003-12-20 (Released:2017-05-01)
被引用文献数
4

アメリカで実施される適性試験のひとつであるGMAT(Graduate Management Admission Test)において,実際に小論文の採点に用いられているe-raterを参考にして,その日本語版ともいうべきJessを試作した.Jessは,文章の形式的な側面,いわゆる文章作法を評価する「修辞」と,アイディアが理路整然と表現されていることを示す「論理構成」と,トピックに関連した語彙が用いられているかを示す「内容」の3つの観点から小論文を評価する.毎日新聞の社説およびコラム(「余録」)を学習し,これを模範とした場合に適切でないと判断される採点細目に対して減点することで採点を行う.また書かれた小論文の診断情報を提示する.システムは現在UNIX上で動作し,800-1,600字の小論文を通常能力のパソコン(Plat'Home Standard System 801S; Intel Pentium III 800MHz; RedHat7.2)で1秒程度で処理する.