タグ

統計に関するsotarokのブックマーク (10)

  • 重回帰と比例ハザードモデル - EBMのための臨床疫学入門講座

    重回帰と比例ハザードモデル 生存分析において予後因子がひとつ、つまり単変量ならば単純に群間の比較 をすればその因子の影響を見ることができます。もし、予後因子が複数以上、つ まり多変量であったらどうしたらよいでしょう。ここで多変量解析の考え方が必 要となります。 因子の影響を調べる方法として、1つの従属(目的)変数と1つの独立(説 明、または予測)変数の関係を見る単回帰分析があります。もし、独立変数が2 つ以上であれば、これと類似した方法として重回帰分析 multiple regression を用います。たとえば、血清コレステロールが体重と年齢に関連することを示す には次の式のようになります。 血清コレステロール=β0+β1・(体重)+β2・(年齢) β0、β1、β2の記号は重み付け(回帰係数)で、対応する変数の値を乗じま す。 もし、この方程式の係数が一連のデータより推定することがで

    sotarok
    sotarok 2010/01/13
    重回帰 比例ハザード Cox回帰
  • 「統計学関連なんでもあり」の過去ログ---024

    sotarok
    sotarok 2010/01/13
    Cox回帰,比例ハザード,生存分析
  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
    sotarok
    sotarok 2009/07/29
    クラスター分析 / clustering
  • 名称未設定

    生存分析は、時間を目的変数とする統計法である.生存分析といった場合、目的変数は死亡するまでの時間となるが、ある現象が発生するまでの時間と考えると他にも応用できる.例えば、酸素中止までの日数や中心静脈栄養中止までの日数、あるいはある部品が故障するまでの日数でもよい. まず生存分析に必要な基的な用語を理解しておく必要がある. 1)生存曲線:生存曲線は、全症例のうち生存しているものの割合を時間軸に対して表した図である. よく文献でみかけるのが、Kaplan-Meier法の生存曲線で階段状になっているものである. 2)ハザードとハザード比 上の図で、死亡率とは、ある時点(Ti)における死亡数を全症例数で割ったものである. 一方ハザードとは、ある時点(Ti)まで生存していた例数のうちの、死亡した症例の割合を示す.つまり、ある時点まで生き延びた者が、その時点において死亡する確率(瞬間死亡

    sotarok
    sotarok 2009/07/24
    生存分析
  • 打ち切りをヒゲにした Kaplan-Meier plot - Triad sou.

    LIFETEST Procedure のグラフ機能とか、GPLOT Procedure の symbol statement の value option の指定だけでは、打ち切りをヒゲにして出力できない。 ということで annotate を使って実装してみた。 proc datasets lib = work kill; run; option linesize = 130 pagesize = 9999 mprint; dm 'log; clear; output; clear'; %let execpath = " "; %let Path = " "; %macro setexecpath; %let execpath = %sysfunc(getoption(sysin)); %if %length(&execpath) = 0 %then %let execpath = %sy

    打ち切りをヒゲにした Kaplan-Meier plot - Triad sou.
    sotarok
    sotarok 2009/07/24
    Kaplan-Meier 生存
  • 2005-09-08 - [R] Cox回帰(比例ハザードモデル) - Action Potentials: 閾値以下

    NOVA の ScienceNow が今年の1月に放送した、ハリケーン襲来に対するニューオーリンズの脆弱性についてのクリップがウェブサイトに挙がってるね。私も今回の被害が報道されるまで知らなかったのだけど、海面よりも土地が低いニューオーリンズの脆弱性については、もうずいぶん前から指摘されていたらしい。少し前の NY Times Op-Ed にも、4年前これについて記事を書いていた Scientific American の記者が「それは予見されていた」という文章を寄稿して、大規模な工事計画まで立てられたものの結局それが実を結ばなかったことを嘆いていた。 NOVA のクリップのなかには、ここ何十年のあいだにメキシコ湾岸沿いの湿地帯が失われ、結果としてニューオーリンズが高波に対して緩衝地を失ったという話も。 R を使って、生存分析でもっともよく使われるCox回帰(比例ハザードモデル)をやってみ

    2005-09-08 - [R] Cox回帰(比例ハザードモデル) - Action Potentials: 閾値以下
    sotarok
    sotarok 2009/07/24
    Cox回帰/比例ハザード/生存分析
  • R勉強会第六回

    Rで時系列データってどう扱うの? 時系列オブジェクトを生成 時系列オブジェクトの合併 lhデータ データを覗いてみる UKgasデータ 出力が長いので要約した統計量を知りたい 開始時刻、終了時刻などなどを知りたい 時系列データの一部を取り出したい 時系列データをプロット ガス消費量のプロット 複数種類の時系列データを一度に表示する データを定常にする ラグ処理 実際にやってみる データの定常化 diff関数 自己相関係数 acfを使って、データが定常になるまで差分を取る 答え もう一個練習 答え ちなみに シミュレーションでデータを生成 シミュレーションでデータを生成してみよう sarimaのシミュレーション モデルの同定 偏自己相関係数の直感的理解 自己相関係数、偏自己相関係数から見るAR、MA、ARMAの特徴 ARモデル 使うデータ モデルを推定する arimaモデル ARIMAモデル

    R勉強会第六回
    sotarok
    sotarok 2009/07/16
    時系列解析
  • http://www.sci.kagoshima-u.ac.jp/~ebsa/ishikawa01/contents.html

  • tohru software:Graph-R

  • 主成分分析の基礎知識

    検索エンジンから直接きたひとは、フレーム目次が便利です。ここは 4章から入ります。 お急ぎで「主成分分析とは」を知りたい方は簡略版へどうぞ。 エクセルで層別散布図・等高線図を描きたい人は(おまけ)へ。 主成分といえば、むずかしそうに聞こえる。でももう君達は高校生のときに学校で教わっているのさ。 X軸とY軸の散布図を書いて、点々の真中ほどに直線を引いたろう?あれが第1主成分。 一番データの点々の広がった部分に直線を引いたはずだね。 第2主成分は、XとYの平均値(重心)を通って、第1主成分である直線に直角の線を引くと出来上がり。 主成分分析の計算過程を数学音痴向けに説明するね。 空中にまとまった点々があるから思い浮かべなさい。カトンボが空中を舞っている姿とか、子魚が群れをなして泳いでいる姿を思い浮かべるのじゃよ。 点々の分布が一番広がったところに、重心をとおってまず最初の直線を引きます。 フラ

  • 1