タグ

Rに関するtessy3のブックマーク (16)

  • R Packages (2e)

    Learn how to create a package, the fundamental unit of shareable, reusable, and reproducible R code. Welcome! Welcome to the online version of the 2nd edition of “R Packages” by Hadley Wickham and Jennifer Bryan. Packages are the fundamental units of reproducible R code. They include reusable R functions, the documentation that describes how to use them, and sample data. In this book you’ll learn

    R Packages (2e)
  • Welcome · Advanced R.

    This is the companion website for “Advanced R”, a book in Chapman & Hall’s R Series. The book is designed primarily for R users who want to improve their programming skills and understanding of the language. It should also be useful for programmers coming to R from other languages, as it explains some of R’s quirks and shows how some parts that seem horrible do have a positive side. Introduction F

  • Rプログラミングのための第一歩(未完) - Qiita

    R Advent Calendar@Qiita 3日目では、Rを扱う上で欠かせない関数についての説明と関数作成のためのRプログラミングの基礎について書きます。書き足りない点があったりということで未完 です(いつか書く、という意味も込めて)。 書いた人間はやっとこさ関数を書けるようになったひよっこなので、間違いやより良い記述方法などございましたら、コメントやTwitter(@u_ribo)にて報告いただければ幸いです 。 はじめに 関数型言語としてのR Rは関数型言語です。Rで行われるすべての操作は関数 Functionによって処理されています。Rにおいて関数はfunction()の形で定義されます。 次の2つの和算の実行結果を見てください。 2番目の例では、和の記号を関数として扱い、和算を行いました。では次に、関数のヘルプを読みだすように、この"+"のヘルプを出してみてくださいhelp("

    Rプログラミングのための第一歩(未完) - Qiita
    tessy3
    tessy3 2015/08/19
    forループ例の処理の解釈がおかしい。最後のiが5と出力されるのは、i=0から5回+1をしたからではなく、iを1:5まで値を変えてforループしたときの最後の5を出力しているだけ。
  • Pythonでのデータ分析初心者がまず見るべき情報源のまとめ - Qiita

    データ分析言語としてデータサイエンスの世界での存在を日々増している(と言われる)PythonPythonでのデータ分析、特にPandasの使い方についてまとめてみました。 ・Rユーザーの方がPythonを使いたい場合には特に有用だと思います。 ・基的なデータハンドリングの方法に主眼をおいています。 RユーザーがPandas,Numpyを使う場合の早見表 【Slide Share】Python for R uses Rで使う記法をPythonで再現するにはどうしたらいいかの 比較早見表が列記されており、RでやっていたことをPythonでやろうと 思ったらかなり有用だと思います。 http://www.slideshare.net/ajayohri/python-for-r-users 【Pandas Official】Pandas -comparison with R 上記と同様、Rで

    Pythonでのデータ分析初心者がまず見るべき情報源のまとめ - Qiita
  • Welcome · Stata to R

    This online resource about R is primarily designed for Stata users. Just as Stata is normally learned, operations on datasets are presented first, while operations on atomic vectors and lists follow. Unlike other resources on R for Stata users, this guide is centered on recent R packages - in particular dplyr and data.table which bring R syntax and memory gestion closer to Stata. Additionally, I

    tessy3
    tessy3 2015/01/27
  • 100MB超えたらnysolが良さそう - Qiita

    野球データを速く集計したい (R vs nysol) はじめに R advent calendar, 12月10日分です. nysolを使ってみた, という話です. 速度比較の記事を見ると, nysol使いたくなりますよね. 使ってみたら案外イケました. コードも書きやすいです. 野球データ解析のコードを例に, plyr, dplyr, nysolのコードと処理速度を比較してみました. メジャーリーグ: 大チャンスでの得点率 メジャーリーグで, 犠牲フライでも点が入る場面で, ちゃんと得点を挙げてくれる選手を調べます. 2013年メジャーリーグの全打席結果データ(77MB)を利用して, 集計してみます. データはretrosheetからダウンロード出来ますし, githubにもあります. . 集計は, 以下の3つの方法で行います. data.frame + plyr data.table

    100MB超えたらnysolが良さそう - Qiita
  • グラフのX軸に日付を入れる - My Life as a Mock Quant

    金融系なんで、時系列データ良く扱うわけですがグラフのX軸に日付を入れる方法を毎回忘れるのでメモ。肝はaxis.Date関数。 こんな感じでコードを書く。 x <- Sys.Date() + 1:1000 y <- cumsum(rnorm(1000)) par(xaxt="n") plot(x, y, main = "Title",xlab = "Date", ylab = "Val", type = "l") par(xaxt = "s") axis.Date(1, at = seq(min(x),max(x),"years")) par(xaxt="n")で一旦PLOT時にX軸書かせないよう設定した後にPLOTし、par(xaxt = "s")でまた軸を書けるようにしてaxis.Dateで日付を書く。結果はこんなグラフになる。 最後のaxis.Dateはaxisをオーバーライドしている

    グラフのX軸に日付を入れる - My Life as a Mock Quant
    tessy3
    tessy3 2013/12/12
    これは便利だ
  • Rによる調査データの整理 - FPU SLC

    barplot(100*prop.table(table(Q4, 性別), 2), main="Q4 by SEX",xlab="性別", names=c("不詳","男","女"), ylab="percent", col=topo.colors(4), beside=T) Rによる調査データの整理 † ↑ Rのインストール † http://cran.md.tsukuba.ac.jp/bin/windows/base/R-2.15.0-win.exe ・・・ ftpサイトではないので、ブラウザ上でクリックするだけでセットアッププログラムをダウンロードできる。 http://www.r-project.org/ ・・・ Rプロジェクトのサイト http://cran.md.tsukuba.ac.jp/  ・・・ 筑波大学のR関係サイト。ウィンドウズ版だけでなく、Linux版やMacOS

    tessy3
    tessy3 2013/11/26
  • 小標本問題と t検定 - ほくそ笑む

    統計を学び始めると「t検定」というのが最初のほうで出てくると思います。 t検定は、20世紀前半に活躍した統計学者、ウィリアム・ゴセットによって「小標問題」というのを解決するために考案されました。 小標問題とは、正規分布の平均値の検定に正規分布を用いると、サンプルサイズが小さい場合にαエラーを過小評価してしまうという問題です。 今日はこの小標問題とそれを解決する t検定について R によるシミュレーションを使って説明してみたいと思います。 正規分布の平均値の検定 確率変数 が正規分布に従うとき、その平均値もまた、正規分布に従います。 数式で書くと、 となります。(分散が されていることに注意) なので、正規分布の平均値の検定には正規分布を使用すれば良いように思われます。 これを R でシミュレートしてみましょう。 # 正規分布を使用して平均値が 0 と等しいかの p値を求める norm

    小標本問題と t検定 - ほくそ笑む
  • 一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家

    久しぶりの投稿です。この一年間、Rの勉強会などに参加したり主催したりしてきて、後輩や勉強会の方々の話をいろいろ聞くとこができました。そんな中、一年間でRと統計学・機械学習を身に付けれるようなフローを作れるかも?と思ったので、ここで記録しておきます。統計学や機械学習は理論を勉強するだけでなく、Rで実際に解析してみることで、より理解が深まります。 ステップ1. 分布・検定 理論 統計学入門 (基礎統計学?) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (79件) を見る R Rによるやさしい統計学 作者: 山田剛史,杉澤武俊,村井潤一郎出版社/メーカー: オーム社発売日: 2008/01/25メディア: 単行購入: 64人 クリック: 782回この商品を含

    一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家
    tessy3
    tessy3 2012/12/12
  • ソート、オーダー、ランク - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です2009-10-30 R の画像処理 RとJava 2009-10-29 Q&A (初級者コース)/11 GoogleEarthとR Rを使った学術論文 okinawa R running on mobile gadgets 2009-10-28 トップ頁へのコメント 2009-10-27 RでGIS R史 2009-10-26 配列Tips大全 行列Tips大全 2009-10-25 リンク集 2009-10-24 パッケージ 'Matrix' の情報 パッケージ 'methods' の情報 spatstat(空間ポイント・パターン分析)パッケージ中のオブジェクト一覧 2009-10-23 Rの関数定義の基 エディタでR パッケージ 'codetools' の情報 パッケージ 'tool

    tessy3
    tessy3 2009/10/30
    order()でベクトルのソート結果の添字を並べられる。
  • 階乗関数、二項係数 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です2009-10-30 R の画像処理 RとJava 2009-10-29 Q&A (初級者コース)/11 GoogleEarthとR Rを使った学術論文 okinawa R running on mobile gadgets 2009-10-28 トップ頁へのコメント 2009-10-27 RでGIS R史 2009-10-26 配列Tips大全 行列Tips大全 2009-10-25 リンク集 2009-10-24 パッケージ 'Matrix' の情報 パッケージ 'methods' の情報 spatstat(空間ポイント・パターン分析)パッケージ中のオブジェクト一覧 2009-10-23 Rの関数定義の基 エディタでR パッケージ 'codetools' の情報 パッケージ 'tool

    tessy3
    tessy3 2009/10/30
    階乗はgamma()、二項係数(nCk)はchoose()を使えばよい。
  • Rプログラム (TAKENAKA

    R でプログラミング:データの一括処理とグラフ描き started on 2005-06-06 updated on 2008-03-13 この文書は,フリーの統計解析・作図システム R を使って, データの一括処理と図化のプログラムを書けるようになるためのチュートリアルです. R の経験がまったくなくても読めるように書いています. ただし統計解析手法についての解説はほとんどしていません. 他のページや書籍を見てください. 目次 0. はじめに:この文書のねらい 1. 準備一般 2. ひとつのファイルからデータを読み込む 3. ひとつのファイルのデータの処理 4. グラフを描いてファイルに保存する 5. グラフのいろいろな設定 6. グラフの重ね描き 7. 繰り返しと条件分岐:コンピュータらしい仕事 8. 繰り返しと条件分岐で柔軟なグラフ描画 9. 補足:変数の寿命と有効範囲 10. デー

  • 生態学データ解析 - 統計学授業 2007

    統計学の授業やります (2007 年度後期, 2007 年 10 月 29 日より) 「生態系機能学総論」の一部 誰でも参加できます (講義のーと PDF file をダウンロード・印刷出力したものを持参して参加してください) 月曜日・木曜日の 14:45-16:15 教室: 北大・地環研 A 棟 8F A803A 教室 http://hosho.ees.hokudai.ac.jp/~kubo/ce/EesLecture.html 講釈: 久保拓弥 2007 年 10/29-11/19 の講義 (第 1 回) 10/29 (月) 生態学データ解析の統計モデリングとは? (第 2 回) 11/01 (木) さまざまな確率分布と最尤推定 (第 3 回) 11/05 (月) 一般化線形モデル (GLM) 1 -- ポアソン回帰 (第 4 回) 11/08 (木) 一般化線形モデル (GLM) 2

    tessy3
    tessy3 2007/11/30
    リファレンスというか参考というか。
  • MNP: R Package for Fitting the Multinomial Probit Model

    Imai, Kosuke and David A. van Dyk. (2005). ``MNP: R Package for Fitting the Multinomial Probit Model,'' Journal of Statistical Software, Vol. 14, No. 3 (May), pp. 1-32. MNP is a publicly available R package that fits the Bayesian multinomial probit model via Markov chain Monte Carlo. The multinomial probit model is often used to analyze the discrete choices made by individuals recorded in survey d

    tessy3
    tessy3 2007/07/13
    多項プロビットモデルのパッケージ?あとで読む
  • GNU Rでよく使うパッケージ一覧(2010/10/22 update) - ハリ・セルダンになりたくて

    現在、矢野が比較的良く使うRのパッケージをリストアップしました。専門の時系列解析に偏っていて、他の方にはあまり参考にならないかもしれませんが・・・ よく使うパッケージ一覧 tseries: 時系列解析関連の基パッケージ。ARMAやDicky-Fuller検定やBowman-Shenton検定(Jarque-Bera検定)など。 timsac: TIMe Series Analysis and Control package mvtnorm: 多変量正規分布と多変量t分布 mnormt: 多変量正規分布と多変量t分布(mvtnormとmnormtは少し実装が違うので、大規模計算をすると少し実行速度に差が出る。ケースバイケースで使い分け) normalp: Exponential Power Distribution (=Generalized Error Distribution) var

    GNU Rでよく使うパッケージ一覧(2010/10/22 update) - ハリ・セルダンになりたくて
  • 1