著者
柳本 武美 安楽 和夫
出版者
統計数理研究所
雑誌
一般研究(C)
巻号頁・発行日
1986

代表者の提案した障害的残差尤度の概念が実際的にAncillaryの概念より有用であることを検証している。本年特に重点的に研究を行ったのはGamma分布の母数の推定の場合である。Gamma分布は正の分布として代表的であるが、驚くべきことにその母数の推定については良く調べられていない。計算手段の向上にともなって推定法の改良が意義のあるものになっている。多くのシミレーションを通して研究した。周辺尤度を用いる方法については共同研究の遂行を行ったが初期の成果を上げることはできなかった。継続研究として次年度に成果を得るべく努力中である。しかしながらこの研究との関連において山本英二氏(岡山理大)とベータ2項ロジスティックモデルについて1つの結果を得ることができた。更に他の分布における推定においても条件付最尤法の良さについての研究を行った。この場合推定量の良さを何で捉えるが問題となる。統計推論の基礎としての規準についての研究と実際の推定量の良さの研究を平行して研究している。安楽は分割表において母数を多く含む場合に、尤度法の近似として得られる検定量を提案し、その比較を行った。
著者
福水 健次 鈴木 大慈 小林 景
出版者
統計数理研究所
雑誌
基盤研究(B)
巻号頁・発行日
2014-04-01

H29年度はカーネル法の効率的計算アルゴリズムの課題を中心に研究を遂行した.まず,カーネル法を用いた分布間の距離尺度としてよく用いられる Maximum Mean Discrepancy (MMD)の効率的計算に関して研究を行った.MMDの計算は,そのまま実行するとサンプル数 n に対して O(n^2) の計算量がかかるため大規模なデータに使うことが難しい.これに対し,MMDをU統計量として表現して,データからのランダムサンプリングを行う不完全U統計量の計算を行うと,計算量が削減されるだけでなく,分布の均一性検定の帰無分布が漸近正規性を満たすという非常に良いよい性質を持つことが分かった.この結果に基づいて,MMDの効率計算を従来から研究を行っていた事後選択推論(Post Selection Inference)に応用した論文をまとめて投稿準備を行っている.また,カーネル法を用いた自然言語処理における共起尺度に関して共同研究を行い,低ランク近似の方法を用いることによって比較的少ない計算量で尺度を構築することが可能で,巨大なコーパスからでも学習が可能であることを示した.さらに,カーネル法による分布埋め込みに関するサーベイ論文を出版した.このトピックは本課題においても大きな役割を果たす技術であるが,まとまって書かれた教科書などは存在していなかった.本サーベイ論文は技術を普及するうえで重量な役割を持つと考える.
著者
栗木 哲
出版者
統計数理研究所
雑誌
奨励研究(A)
巻号頁・発行日
1995

今年度本研究では、以下のことを行った。(1)多次元の未知母数を持つ連続な確率分布において、階層的な仮説の族を考え、対応する尤度比検定統計量の帰無仮説の下での同時分布の漸近展開を与えた。その結果以下の結果を得た。・各階層の尤度比検定統計量は、帰無仮説の下で0(1/n)まで独立に分布する。・各階層の尤度比検定統計量は、独立にバ-トレット補正が可能である。すなわち、各階層の尤度比検定統計量にそれぞれある定数を掛けると、同時分布は0(1/n)の範囲で独立なカイ2乗分布となる。研究の後にこれらの結果は既にBickel & Ghosh (1990,Ann.Statist.)が得ていたことが判明したが、本研究のとったアプローチはBickel & Ghoshとは異なるものであり、計算技法の開発などの点で新たに得た知見も多い。本結果は、現在投稿中である。(2)連続な多変数指数分布族における単純帰無仮説に対する尤度比検定統計量の特性関数の任意の次数までの漸近展開公式を得た。得られた公式は、集合の分割(set partition)を用いて表現されている。展開公式の形自体は、上でも述べたBickel & Ghosh論文が示しているが、その具体的な形(各係数の値)はBickel & Ghosh論文の方法では与えることができない。本研究では、指数分布族という特殊な場合ではあるが、特性関数の表現を陽に与えることに成功した。また、研究の過程で、一般化エルミート多項式、多変数ラグランジュ反転公式に関して、いくつかの知見を得ることができた。本結果も、現在投稿中である。
著者
杉本 晃久
出版者
統計数理研究所
雑誌
若手研究(B)
巻号頁・発行日
2007

我々は,edge-to-edgeタイル張り内でn個のタイルが1点に会する点をn価の集結点と呼ぶことにする.凸五角形タイル張り問題に関して,私はタイル張り内の集結点の性質に注目して研究を進めている.ここで,五角形で構成されたedge-to-edgeでかつnormalであるタイル張りをTとする.このとき,五角形タイル張りT内のそれぞれの五角形が同数の2種類の集結点(m個の3価集結点と5-m個のk価集結点)で構成されていると仮定すると,その五角形タイル張りTは4価と3価集結点((m,k)=(3,4))のみで出来ている場合か6価と3価集結点((m,k)=(4,6))のみで出来ている場合しか存在しないと証明した.球面上の円である球帽を用いた最密充填問題(Tammesの問題)の球帽個数N=10〜12に関して,私独自の系統的な方法で得た結果をまとめ,論文として発表した(その結果,N=1〜12に関して,私の方法で求めた結果とTammesの問題の解が完全に対応しているという興味深い事実を見いだした).とくにN=10に関して,いままでDanzerによって球帽の角直径が[1.154479,1.154480]と範囲のみで示されていたが,私は閉じた解(数式)を示した(私は約3年前に初めてN=10の場合の閉じた解を得たが,その数式はかなり長いものであった.本年度,私は3年前に得られた結果を再考し,以前と比べ格段に短い数式を導き出すことに成功しそれを発表した).
著者
前田 忠彦 朴 堯星 吉川 徹 尾崎 幸謙
出版者
統計数理研究所
雑誌
基盤研究(A)
巻号頁・発行日
2018-04-01

2019年度は,「日本人の国民性調査」に関連して次の内容を実施した。(1a)2018年度に実施した「日本人の国民性 第14次全国調査」についてのデータクリーニング、および関連する調査地点データ等の整備、(1b)同調査の基礎集計の吟味と主な時系列的な知見の整理、(1c)先に整理が進んだ過去のデータに基づく共同分析の実施と成果発表,(2)過去(第13次全国調査まで)の調査データに付帯するメタデータ情報の整理と共同利用研究のためのデータ整備、(3)オンラインパネルに対するウェブ調査の方法論の検討、等。(1a)に関しては調査報告書の発行とウェブ上での公表を予定していたが,データ整備の遅延により2020年度に先送りした。(1b)について,継続調査の中で長期にわたって利用されてきた調査項目の多くでは,(変化自体が観察されにくくなっていることを含めて)これまでの動きと同質の傾向性が見られる一方,2013年度実施の第13次全国調査で見られた「東日本大震災後」に特有の意識,たとえば自然災害に対する不安や,日本人の良い性質などについての項目で若干の「揺り戻し」とみられる動きが観察されること,などが分かってきている。(2)1953年に第1次調査が行われて以来の,2018年まで14回にわたる全国調査について,,今後の共同利用(のためのデータ公開)に向けて,メタデータおよび個票データの整備を進めた。すなわち調査データそのもの,コード表,調査地点情報の3点の整備を行った。また複数時点間で微妙に異なるコーディング法等をハーモナイズする方針などを検討した。(3)については確率標本に対する面接調査とオンラインパネルに対するウェブ調査の比較検証の前に,ウェブ調査の信頼性を揺るがす可能性がある,いわゆる手抜き回答の検出法等に関する成果発表を行った。
著者
松井 知子 村上 大輔 椿 広計 高橋 泰城 船渡川 伊久子 山形 与志樹
出版者
統計数理研究所
雑誌
挑戦的研究(開拓)
巻号頁・発行日
2021-07-09

COVID-19、SDGsの複雑に絡み合った課題に対しては、多くの異分野に跨がる学際的研究が 不可欠であり、異分野相関を俯瞰できる方法論が必要となる。従来の統合評価モデルによるアプローチには、1) 不確かさの所在が不明瞭、2) 多様なデータの十分な活用が困難、3) COVID-19のような突発事象への対応不可等の問題がある。本研究では、統計・機械学習により、この従来モデルをデータ駆動型の確率モデルに転換させて、上記の問題1)、2)を解決する方法論Iを確立する。さらにこの方法論Iを、突発事象を含め、様々な事象を包括できるモデル統合の方法論IIへと変革させ、問題3)を解決する。
著者
伊庭 幸人
出版者
統計数理研究所
雑誌
基盤研究(C)
巻号頁・発行日
2013-04-01

与えられた確率的な力学系(雑音を含む非線形のダイナミクス)に対して、珍しい現象(レアイベント)を効率的にサンプリングし、その確率をバイアスなしに計算する手法を研究し、「時間逆転シミュレーション」の方法を開発した。開発した手法は、ゴールとなる珍しい事象(たとえば東京に台風が来襲する)から初期値に向かって逆にパスを生成することで、ゴールの範囲が狭い場合の計算効率を高める点に特徴がある。逐次インポータンス・サンプリング法(SIS)を利用することで、適正な計算時間で確率をバイアスなく計算できることが示された。提案手法はさまざまな極端事象の解析に応用できることが期待される。
著者
水本 篤
出版者
統計数理研究所
雑誌
統計数理研究所共同研究リポート238 「言語コーパス分析における数理データの統計的処理手法の検討」
巻号頁・発行日
pp.1-14, 2010

本研究では,サンプルサイズが小さい場合に使用される統計的検定の比較を行った。特に,従来から使用されることが多いパラメトリック検定とノンパラメトリック検定,そして,並べ替え検定とフィッシャーの正確確率検定という正確なp値を得ることができる方法を比較することを目的とした。
著者
長谷川 政美 橋本 哲男 宮田 隆
出版者
統計数理研究所
雑誌
一般研究(B)
巻号頁・発行日
1991

前年度までの研究で,メタン細菌,好塩菌,エオサイトなどの古細菌が,真正細菌によりは真核生物に近縁であることが確かめられたが,これら3つの古細菌のグループと真核生物との関係は不明であった.今年度は,ペプチド鎖伸長因子のアミノ酸配列データを,われわれが開発した最犬法にもとづいて解析した結果,これらの古細菌がすべて系統的に一つのグループとしてまとまるという可能性のほかに,エオサイトが特に真核生物に近いという可能性も浮上した.ミトコンドリアなどのオルガネラをもたない真核原生生物の系統学的な位置づけは,真核生物の初期進化をさぐる上で極めて重要である.従来この問題は,リボソームRNAの配列データにもとづいて研究されてきたが,われわれはリボソームRNA分子系統樹の問題点を指摘した.最大の問題は,近縁な生物の間ででも,塩基組成が大きく異なることがあり,このことが間違った系統樹を導くことがあるということである。われわれは,ペプチド鎖伸長因子やRNA合成酵素などといった保存的なたんぱく質のアミノ酸配列データを解析し,塩基組成が大きく違っているような場合でも,たんぱく質のアミノ酸配列はその影響を受けず,そのようなデータからえられる分子系統樹の信頼性が高いことを示した。ミトコンドリアをもたない真核原生生物の一種であるギアルディアのペプチド鎖伸長因子EF-1αの遺伝子の塩基配列を決定し,この原生生物が真核生物の祖先型生物に近い可能性のあることを示した.
著者
前田 忠彦 松本 渉 高田 洋 伏木 忠義 吉川 徹 加藤 直子
出版者
統計数理研究所
雑誌
基盤研究(B)
巻号頁・発行日
2015-04-01

訪問面接調査や留置調査など調査員が介在する調査法,Web調査などそれ以外の調査モードを含む様々な調査で実施の際に付帯的に得られる調査プロセスに関する「調査パラデータ」を解析し,調査の精度管理に有用な情報を得ることを目指した検討を行った。また,調査不能率が高い場合に懸念される調査不能バイアスの影響を評価したり,それを調整する方法についての研究を行った。面接調査等の訪問記録や,電話調査での発信記録を分析することによって,調査員の行動をよりよく理解することができるようになり,調査員教育に生かすことができる。また他の調査モードで得られる回答所要時間のデータなどで回答者行動の理解を深めることができる。
著者
村上 征勝 古瀬 順一
出版者
統計数理研究所
雑誌
萌芽的研究
巻号頁・発行日
1999

川端康成のノーベル賞受賞作品「雪国」の代筆疑惑を解明するため、同作品と他の複数の川端作品との比較及び三島由紀夫の作品との比較を試みた。そのため川端と三島の作品の文章を単語分割し、品詞コードをつけたデータベースの構築を行い、品詞や読点などの情報を手がかりに同作品の文体特徴を明らかにする作業を行った。川端作品としては「雪国」、「みづうみ」、「山の音」、「伊豆の踊り子」、「虹」、「母の初恋」、「女の夢」、「ほくろの手紙」、「夜のさいころ」、「燕の童女」、「夫唱婦和」、「子供一人」、「ゆく人」、「年の暮」の14作品を,三島の作品としては「潮騒」、「金閣寺」、「眞夏の死」、「愛の渇き」の4作品の全文をまず入力した。この内,川端の「雪国」、「みづうみ」、「山の音」、「伊豆の踊り子」、「虹」の5作品と,三島作品の「潮騒」、「金閣寺」の2作品に関しては,文章を単語に分割し,品詞情報を付加したデータベースを構築した。このデータベースを用いて計量分析を試み以下のような結果を得た。これまでの研究から現代作家の文章において、読点のつけ方に作家の特徴が出やすいことを明らかにしていたので,読点のつけ方を中心に行った。川端の作品は,戦後の作品「みづうみ」から作風が変わったというのが従来の通説であるが,読点のつけ方の数量的分析からは,戦後の作品であっても著述年代がもっと遡る「山の音」から変わったと考えた方が妥当であるという結論を得た。また三島と川端との関係をみるため「潮騒」と川端作品を一緒に分析した結果、川端作品と「潮騒」では読点のつけ方に違いがあることも明らかとなった。現状では、一部の情報にとどまっており、明確な結論を出すまでには至っていないが、川端の文体の数量的研究に基盤はできたように思われる。
著者
江口 真透 栗木 哲 藤澤 洋徳 逸見 昌之 松浦 正明 間野 修平 小森 理 竹之内 高志 川喜田 雅則
出版者
統計数理研究所
雑誌
基盤研究(A)
巻号頁・発行日
2008

ゲノム・オミクスデータから導かれる科学的成果を得るための統計的方法の開発を行った。特に表現形(病型、治療奏功性、予後)の予測に適切な情報を抽出するために統計学と機械学習の方法の融合的な活用を実用化に向けて推進してきた。表現形の予測のためにROCカーブの下側面積の最大化によるブースト法を開発した。乳がんサブタイプを決める有効な遺伝子選択のためのLASSOクラスタリングを提案し、良好な成果が得られつつある。
著者
室田 一雄
出版者
統計数理研究所
雑誌
基盤研究(C)
巻号頁・発行日
2020-04-01

「離散凸解析」は,凸関数と離散構造と併せて考察する最適化の理論であり,連続世界の凸解析に匹敵する理論を離散世界に構築することを目標とした提唱された,連続と離散を繋ぐパラダイムである.本研究では,離散凸解析の双対理論を軸に据えて,離散資源の公平配分問題に関する理論とアルゴリズムを構築する.この問題に対して,コンピュータの負荷分散,グラフ理論における向き付け問題,経済学・ゲーム理論における不可分財の公平配分などの様々な文脈において個別の成果が得られているが,離散凸解析に基づく一般的な枠組を作ることによって,離散凸解析の特徴である「分野の横断性」をより発展させる.
著者
長尾 大道 樋口 知之
出版者
統計数理研究所
雑誌
統計数理 = Proceedings of the Institute of Statistical Mathematics (ISSN:09126112)
巻号頁・発行日
vol.61, no.2, pp.257-270, 2013-12

要旨あり環境リスクと統計解析 -データ基盤構築と解析-原著論文