タグ

統計に関するtakehikomのブックマーク (14)

  • 『1万票差でも多数確実が出せるワケ』という記事について - Interdisciplinary

    1万票差でも多数確実が出せるワケ - ゆとりずむについて、いくつか不正確に思える所がありましたので、シンプルに指摘します。 サンプル数 標に属するデータ数の事をサンプル数と表現するのは誤り。サンプルサイズが正しいです。 サンプル比率 サンプルサイズ / 母集団サイズ という量を、サンプル比率(リンク先の画像の表を参照)と表現してはいけません。表の上の方に載せられている標比率と全く同じ言葉(日語か英語かの違いだけ)なのに、違う意味が指されています。標比率や標割合というのは、標に属する、ある性質を持った要素の数の割合、の意味で、標の大きさを母集団の大きさで割った量は、(標)抽出率などと呼ばれるのが普通です(私は、抽出割合と表現します)。 信頼区間 表中にある信頼区間の列に書かれている数値は、信頼区間ではありません。これは、誤差幅や精度の半分、です。通常、信頼区間と言った場合には

    『1万票差でも多数確実が出せるワケ』という記事について - Interdisciplinary
  • P値が有意になるように頑張りすぎちゃっていませんか?

    Natureに統計学的検定の問題についてのエッセイが出ていた。フィッシャー、ネイマン、ピアソンの言い争いの紹介も含めて、P値にまつわる議論を短くまとめている。何でも、この世には統計学的に有意であるのに再現性の無い調査や研究は多々あるのだが、統計学的な検定を盲信してしまい考察が疎かになっているせいだそうだ。 P値を扱うときの問題が三つ上げられている。一つは、偽陽性の可能性がP値から連想する以上に高いことだそうだ。統計学的な厳密な議論は説明されていなかったが、例えば帰無仮説が0.5のときに、P値が0.01で有意になったとしても、再現実験では11%以上の確率で再現が得られないそうだ。一つは統計的有意であることに満足して、その効果の大きさを考察しないことがあるそうだ。一つは、P値が有意になるように分析方法を工夫しすぎてしまうケース(P-hacking)があるそうだ。 エッセイでは探索的研究と検証的

    P値が有意になるように頑張りすぎちゃっていませんか?
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • 感度 - Wikipedia

    感度(かんど、英: sensitivity)は、統計的な概念の一つ。分野によって定義が異なっているが、おおむね「ある対象に与えた刺激とそれに対する応答の関係」に関わる指標である。 感度 (火薬学) - 火薬の外部からの刺激に対する爆発感度性の尺度。 感度 (写真) - ISO感度。国際標準化機構(ISO)で策定された写真フィルムの規格であり、あるフィルムがどの程度弱い光まで記録できるかを示す。 感度 (電子工学) - 電子デバイスにおいて、ある信号対雑音比を有する出力信号を生成するために必要な入力信号の最小値。 感度 (計測機器) - 計測機器の分野においては、感度限界、感度係数のどちらかを意味する。 感度 (無線) - 無線電信において、アンテナの利得、受信機の感度を指したり、受信状態を表現するのに用いられる。 感度 (検査) - ある検査について「陽性と判定されるべきものを正しく陽性と

  • 感度・特異度と陽性的中率・陰性的中率 - データサイエンティスト上がりのDX参謀・起業家

    医学臨床の検査キットなどの性能を評価する指標に、感度(sensitivity)と特異度(specificity)というものがあります。 例えばある病気の検査を調べるとき、実際に病気に罹っている人のうち陽性と出る割合を感度、病気に罹っていない人のうち陰性と出る割合を特異度と言います。 一般的に、感度と特異度が高い検査キットの信頼性が高いとされています。 しかし、そのような検査で陽性と出たからといって、必ずしも実際に病気に罹っている可能性が高いわけではないこともあります。 その説明をこれからします。 まずは言葉の説明を。 検査で陽性と出た人のうち実際に病気に罹っている人の割合を陽性的中率(Positive Predictive Value, PPV)、陰性と出た人のうち実際に罹っていない人の割合を陰性的中率(Negative Predictive Value, NPV)と言います。 次の表で感

    感度・特異度と陽性的中率・陰性的中率 - データサイエンティスト上がりのDX参謀・起業家
  • はてなブログ | 無料ブログを作成しよう

    我が家のダグウッド ダグウッドとはハナミズキのことである。昔、日からポトマックリバーの桜の苗木を送った返礼として、アメリカから送られて来たのが日での始まりで、アメリカ原産でアメリカヤマボウシともいうらしい。 最近では日でも、あちこちで、街路樹であったり、庭木であっ…

    はてなブログ | 無料ブログを作成しよう
  • コラム:サンプル数とは何か?/独立行政法人 労働政策研究・研修機構(JILPT)

    JILPT研究員 堀 春彦 「サンプル数」という用語の氾濫 サンプル数とは何だろうか。アカデミックな研究雑誌で計量分析を行っている論文には必ずといってよいほど登場してくるのが、このサンプル数という言葉である。分析の対象となったデータの観察個数を示すものとして使用されている。われわれの周りには、このサンプル数という用語が氾濫している。しかしながら、このサンプル数という言葉を統計学辞典で検索しても、決してお目にかかることはない。あまりにも当たり前の用語なので、統計学辞典には掲載されていないのだろうか。 以前、執筆した論文を恩師に送付したところ、恩師から「あなたは研究者をやっている資格がありませんね。」と記されたメールを受け取ったことがあった。そこには、データの観察個数を示すために使ったサンプル数という用語の間違いが指摘されていた。データの観察個数を示すとすれば、標の大きさ(サンプル・サイズ)

    takehikom
    takehikom 2010/06/16
    『素人はサンプル数をもって、統計学者が言うところの「標本の大きさ」を言っています』
  • ご購入前のよくあるご質問:目次 | BellCurve(ベルカーブ)

    ご購入前のお問い合わせ先 フォームから問い合わせる メール:software@ssri.com お電話:(土日祝除く 平日 10:00~12:00 / 13:00~16:00)

    takehikom
    takehikom 2010/06/16
    『「サンプル数」は、サンプルサイズの意味で使われたり、幾つの集団があるかという意味で使われたりすることがあります』『当サイトでは、「サンプル数」ではなく「サンプルサイズ」という表現を採用しています』
  • 2段階t検定の是非 | Okumura's Blog

    2群の平均値の差の検定で,まずF検定で分散が等しいかどうか検定してから,通常のt検定かWelchの検定かに振り分けることを勧めるやサイトがまだ多い。何でそんな気持ち悪いことをするんだ!?という話を少し前に書いた(t検定の話)。理屈だけでは弱いので,シミュレーション結果を載せている論文がないか調べたところ, Donald W. Zimmerman, ``Some properties of preliminary tests of equality of variances in the two-sample location problem'', The Journal of General Psychology, Vol.123, pp.217-231 (1996) というのを見つけた(たくさんあるだろうが最初に見つかったのがこれである。ほかにあったら教えてください)。乱数で1万回ずつ

    takehikom
    takehikom 2010/06/09
    『2群の平均値の差の検定で,まずF検定で分散が等しいかどうか検定してから,通常のt検定かWelchの検定かに振り分ける』/数年前学生にさせてた
  • 有意差

    Tweets by @kumicit ■東芝がウェスチングハウスをコントロールできないことが勝利の決め手だった?(04/09) ■人生に意味を与えるUFO(03/14) ■UFO統計(03/14) ■2011年9月20日(01/30) ■180年くらい歴史がありそうな都市伝説「ブアメードの血」(08/06) ■143年の歴史を誇る都市伝説「ブアメードの血」Update 2016/08/05(08/05) ■メモ「人種偏見と発砲判断」(07/24) ■ハーブレメディは見過ごされている世界的健康被害(05/30) ■メモ「メスメリズムで死人が蘇生すると書いてたHahnemann」(05/08) ■メモ「ホメオパシーとデュナミスの関連調査中...」(05/05) ■メモ「危機的状況化での非難の政治力学」(04/24) ■メモ「災害後の人々の行動」(04/21) ■東芝がウェスチングハウスをコント

    有意差
  • EBMを見抜くための臨床統計学キーワード●EBM 第3回 「逆説のp値」

    1.p値とは何か? データを集めて統計学的分析を行うと、いろいろな計算結果が統計ソフトから出力される。その中で最も気になる数値は、なんといっても「p値」であろう。もしもp値が0.04ならば、5%より小さいので「統計学的に有意」となり、大喜びである。しかし、p値が0.06ならば6%となり、「有意でない」ので地団駄踏んで悔しがることだろう。わずか0.01、1%の違いで、天国と地獄ほども差がついてしまう。 このように、統計学の中にあって重要な決定権をもつp値であるが、そもそもp値とは何を表しているのだろうか。また、何で5%がそんなに重要なのだろうか。 p値とは、そもそも"p-value"という英語を、pはそのままで、"value"を「値」とした、変な訳語である。それでは、pは何かというと"probability"のpであり、「確率」ということになる。したがって、そのまま全てを訳すのなら

  • [d] detourist.net

    概要気象庁は、緊急速報メール配信の一部を廃止することを2021/10/12に発表したが、性急な廃止の方針に対して批判を受け、再検討を行うとしていた。そして先日、2022/10/18の発表により、今後の防災気象情報の的確な配信を目指した取り組みを進めていくとしながらも、当初計画のとおり、気象等に関する特別警報・噴火に関する特別警報についての緊急速報メール配信を廃止(2022/12月廃止予定)することを示した。 一方、件に対する報道やSNSの投稿の一部において、緊急速報メールの内容や技術的な仕組みについて誤解があると思われる記述も散見された。 記事では、緊急速報メールの種別と技術的な仕組みについて整理した上で、気象庁の対応の是非を論じる。 緊急速報メールの種別

  • 二群の平均値(代表値)の差を検定するとき

    二群の平均値(代表値)の差を検定するとき First upload: Feb 02, 2007 Last modified: Feb 10, 2007 1. はじめに 二群の平均値(代表値)の差の検定をするときに,両群の分散が違うといろいろ問題が残る。 粕谷によれば,そのようなときには,分散の影響を受けない中央値検定を採用すればよいと書いてあるという情報・書き込みがいくつも現れる。 当にそうだろうか。粕谷1)はそのように書いてあるのだろうか。 いろいろ検討してみたが,粕谷は「分散が等しくないから中央値検定」などと単純には言っていないようだし,その後の同じ学会誌に Markus Neuhäuser2) は別の提言をしている。 分散が等しくない場合の二群の代表値の差の検定に困難が伴うのは古くからの議論である。 しかし,だからといって,データ水準や検出力の面から考えて最低位に位置づけられれ中央

  • プログラミングのための線形代数 - プログラミングのための確率統計

    Last modified:2011/04/15 07:54:10 Keyword(s): References:[図書] [Pr.App] [Pr.Comment] [Pr.Cont.1] [Pr.Cont.2] [Pr.Cont.3] [Pr.Cont.4] [Pr.Cont.5] [Pr.Cont.6] [Pr.Cont.7] [Pr.Cont.8] [Pr.Cont.9] [Pr.Cont.A] [Pr.Cov.1] [Pr.Cov.2] [Pr.Cov.3] [Pr.Cov.4] [Pr.Def.1] [Pr.Def.2] [Pr.Def.3] [Pr.Def.4] [Pr.Def.5] [Pr.Def.6] [Pr.Def.7] [Pr.Def.9] [Pr.Disc.1] [Pr.Disc.2] [Pr.Disc.5] [Pr.Disc.6] [Pr.Disc.7] [Pr.

  • 1