タグ

Rに関するkkobayashiのブックマーク (340)

  • R-SVG.org

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    R-SVG.org
    kkobayashi
    kkobayashi 2017/01/03
  • RPubs - Wikipediaページビュー数の推移

    kkobayashi
    kkobayashi 2015/06/20
  • 大規模データの高速処理 ーdata.table、dplyrー

    Rは便利な統計解析ツールですが、処理の遅さや大規模データの扱いにくさが弱点と言われています。 このような状況に対処すべく、現在ではパフォーマンスの向上に役立つパッケージが数多く開発されています。 そこで今回は「Rとウェブの融合」をお休みして、data.tableとdplyrによる大規模データの高速処理について紹介します。 この記事では2014年7月現在の最新バージョン(data.table 1.9.2及びdplyr 0.2)を利用しています。 必要に応じてインストールして下さい。また紙面の都合で実行結果の掲載は省略しているので、手元の環境で試して実行結果を確認してみることをお勧めします。 > # パッケージのインストールと読み込み > install.packages(c("data.table", "dplyr")) > library(data.table) > library(dpl

    kkobayashi
    kkobayashi 2015/01/27
    このへんがmodern Rって感じなのかなー。
  • Welcome · Stata to R

    This online resource about R is primarily designed for Stata users. Just as Stata is normally learned, operations on datasets are presented first, while operations on atomic vectors and lists follow. Unlike other resources on R for Stata users, this guide is centered on recent R packages - in particular dplyr and data.table which bring R syntax and memory gestion closer to Stata. Additionally, I

    kkobayashi
    kkobayashi 2015/01/27
  • Rのggplot2のスニペット(主に自分用) - About connecting the dots.

    主に自分用のメモです.ggplot2って,コマンドがややこしいので,いったん覚えてもすぐ忘れちゃうんですよね.なのでスニペットでもつくって楽したいですね,というのが今回の趣旨です. 基的な使い方 まずggplot()の中で,使用するデータフレームや変数名を指定します.そして描画するグラフをgeom_XXX()で指定した上で,ggplot()の後に+でつないであげればOKです.具体的には,以下のような形です. ggplot(data=mtcars, aes(x=wt, y=mpg))+geom_point() あとは,ひたすら具体例をさらしていきます.今日の内容はそんだけ. 前準備 まずは,ggplot2パッケージをインストールしておきましょう.それに付随して,関連するパッケージもまとめて入れておくことにします.それが終わったらデータセットの用意ですが,今回はデフォルトで入ってるmtcar

    Rのggplot2のスニペット(主に自分用) - About connecting the dots.
  • RPubs - 政府統計の総合窓口(e-Stat)のAPIを使ってみよう [R編]

    Hide Comments (–) Share Hide Toolbars

    kkobayashi
    kkobayashi 2014/12/30
  • Twitter's R package for detecting breakouts in time series

    Revolutions Milestones in AI, Machine Learning, Data Science, and visualization with R and Python since 2008 With so many more devices and instruments connected to the "Internet of Things" these days, there's a whole lot more time series data available to analyze. But time series are typically quite noisy: how do you distinguish a short-term tick up or down from a true change in the underlying sig

    Twitter's R package for detecting breakouts in time series
    kkobayashi
    kkobayashi 2014/11/25
  • RでBKB - 盆栽日記

    いい話がある。 http://gg-hogehoge.hatenablog.com/entry/2014/11/01/124501 私もバイク川崎バイクは大好きなのでRで作ってみた。 Windows7なので前準備としてkakasiをインストールしてPATHを通している。 RMeCabパッケージでMeCabを、Nipponパッケージでkakasiを叩いている。 結果 こんな感じ。 > getBKB("私は世のいはゆる健全なる美徳 清貧だの倹約の精神だの 困苦欠乏に耐へる美徳だの 謙譲の美徳などといふものはみんな嫌ひで 美徳ではなく 悪徳だと思つてゐる") file = C:\************** 私は世のいはゆる健全なる美徳 清貧だの倹約の精神だの 困苦欠乏に耐へる美徳だの 謙譲の美徳などといふものはみんな嫌ひで 美徳ではなく 悪徳だと思つてゐる 美徳 倹約 美徳 b! k! b!

    RでBKB - 盆栽日記
    kkobayashi
    kkobayashi 2014/11/05
  • dplyrのバージョンが0.2に上がって - 盆栽日記

    dplyrのバージョンが2.0に上がって少し便利になりました。 詳しくは以下のリリースノートをご覧ください。 https://github.com/hadley/dplyr/releases/tag/v0.2.0 以下の3点が大きな変更点。 %.%が%>%に変わった do()が生まれ変わった 新しい便利関数が加わった 簡単に解説します。 %.%が%>%に変わった %.%(chain演算子)は皆様多用されているかと思いますがいかんせんシフトキーを一度離す必要があるのでタイプしづらい。ということでmagrittrパッケージから%>%演算子をインポートしてきたとのことです。%.%はいずれ廃止するけど、すぐじゃないからまあ慌てるなとも。 do()が生まれ変わった do()は今回のバージョンアップに伴い生まれ変わったとのことです(completely overhauled)。 正直な話、do()使っ

    dplyrのバージョンが0.2に上がって - 盆栽日記
    kkobayashi
    kkobayashi 2014/05/23
    へぇ
  • 「偏差値の低そうな学校名」に関する考察 - MEMORANDUM

    2013-12-21 「偏差値の低そうな学校名」に関する考察 R Mathematics 非常にアレな言い方ではあるが,世の中には「偏差値の低そうな学校名」や「偏差値の高そうな学校名」があると思う. そこで「偏差値の低そうな学校名」というものは存在しないのか,あるいは字面からある程度偏差値を予測することは可能なのか,という疑問に対する1つの答えを出したい. 今回は,各高校名を構成する文字から,重回帰分析で偏差値を予測することで,これを確かめる. 始めに この記事は,自分で取得した偏差値データをムリヤリ重回帰分析の手法にねじ込んで遊んでいるだけの記事なので,絶対に真に受けてはいけない. 調査について 調査対象 今回は,高校について調査を行う.偏差値データはH25の予測偏差値を用いる. 各学校の偏差値データの取得 例によって全国高校受験ナビから取得する.詳細な取得方法については各高校の偏差値の

    「偏差値の低そうな学校名」に関する考察 - MEMORANDUM
    kkobayashi
    kkobayashi 2014/04/14
    面白い
  • RPubs - dplyr入門

    Hide Comments (–) Share Hide Toolbars

    kkobayashi
    kkobayashi 2014/03/28
    %.% ってそう使うのかー。関数型チックにネストさせるやり方でもできそうだが、best practiceとしてはchainした方がいいのかね
  • Shiny を使ってR言語のプログラムをWeb アプリ化する - Tech-Sketch

    R は統計解析向けのプログラミング言語で、お手軽にデータ分析を行うことができます。そして、R での分析結果は、Shiny というR のパッケージを使うことで、簡単にWeb アプリ化することができます。今回はR プログラムを簡単にWeb アプリ化するShiny パッケージと、Web アプリとして公開することができるShiny Server について紹介します。 What's Shiny? Shiny とはR のIDE である RStudio の開発元のRStudio Inc. が開発しているプロダクトです。Shiny を使うとR のプログラムを簡単にWeb アプリにすることができます。 Shiny で作成したWeb アプリはブラウザからのユーザー入力などをトリガーに、インタラクティブにR のプログラムを即時実行し、その実行結果を動的に確認できます。見た目に関しては、Shiny が内部的に T

    Shiny を使ってR言語のプログラムをWeb アプリ化する - Tech-Sketch
    kkobayashi
    kkobayashi 2014/03/17
  • Rで文芸的プログラミングがしたい - 300億円欲しい

    Rの話です. 文芸的プログラミングとは 文芸的プログラミングってなんですかね. その説明から入ります. ソースコードを読んでも, コードが何をしているのか分からないこと. ありますよね. 自分が書いたコードなんだから覚えているだろ...と甘えて, コメントをサボってしまいます. 結果理解できずに, また最初から書き直す羽目になります. アホですね. 解決策. コードをそのままドキュメントにすればいいんです. これが文芸的プログラミングだ....と思っています. 解説を書きながらコードを書くスタイルです. 文芸的プログラミング - コンピュータサイエンスの第一人者 Donald Knuth博士が提唱しているプログラミングスタイル。 Rのknitrで文芸的プログラミング ~knitr+pandocではじめる~『R MarkdownでReproducible Research』 from ter

    Rで文芸的プログラミングがしたい - 300億円欲しい
    kkobayashi
    kkobayashi 2014/02/26
    knitr、名前はちょくちょく見かける/%.%ってなんだろう
  • data.tableでcolnamesを使うと怒られる - 盆栽日記

    data.table型にしたデータに対してcolnames関数を使うとぐわーっと警告が出る。 > library(data.table) > iris <- as.data.table(iris) > colnames(iris) <- colnames(iris) Warning message: In `names<-.data.table`(`*tmp*`, value = value) : The colnames(x)<-value syntax copies the whole table. This is due to <- in R itself. Please change to setnames(x,old,new) which does not copy and is faster. See help('setnames'). You can safely ignor

    data.tableでcolnamesを使うと怒られる - 盆栽日記
    kkobayashi
    kkobayashi 2014/01/22
    まじか
  • http://atnd.org/events/45043

    http://atnd.org/events/45043
    kkobayashi
    kkobayashi 2013/12/27
  • ggplot2でなんでもプロット(table編) #RAdventJP - はやしのブログ Rev.3

    R Advent Calendar 2013の2日目です。 今回のネタは、当は去年どっかでやろうと思ってたものだったんですが、機を逃して温めすぎて発酵しかけてたものです(このネタの存在自体忘れてた)。とりあえず、日語での情報は少なくともまだウェブには無いようなので安心。ちなみにtable編と書いていますが、続編の予定はありません。もちろん、興味を持っていただいた方は好きに引き継いでもらってかまいません。 fortifyとは? さて、ggplot2を利用されている方は多いと思いますが、高機能な分みなさん使いこなすのに苦労されているようです。実際一朝一夕で使えるようにはならないものではあるんですが、実際には便利な機能があるのにそれを知らないために苦労してただけ、ということもあったりします。今回紹介するのは、そんな便利機能の中でも特に知名度が低いと思われるfortify()という機能(関数)

    ggplot2でなんでもプロット(table編) #RAdventJP - はやしのブログ Rev.3
    kkobayashi
    kkobayashi 2013/12/02
    べんり
  • データ・サイエンスのプログラミング言語はRからPythonに置き換わる | readwrite.jp

    これまでデータ・サイエンティストの選ぶプログラミング言語はRだったのだが、急激にPythonに置き換わろうとしている。 このシフトの理由はいくつかあるようだが、第一にはPython自体が汎用的で比較的学びやすい言語であるのに対し、Rが習得するにあたってやや複雑であることがあげられるだろう。 データにますます依存しつつある現代社会とデータに飢えたサイエンティストにとっては「簡単さ」こそが鍵となるのだ。 Rは実際にはプログラミング言語ではないRを覚えることに苦労する人が多い理由として考えられるのは、Rが実際にはプログラミング言語ではないからかもしれない。R専門家のジョン・クックいわく、Rとは「統計のためのインタラクティブな環境」であり、厳密にはプログラミング言語ではないのだ。彼はさらに「Rをプログラミング言語だと考るのではなく、Rがプログラミング言語を内包しているのだと考えた方が良いと分かった

    データ・サイエンスのプログラミング言語はRからPythonに置き換わる | readwrite.jp
    kkobayashi
    kkobayashi 2013/11/30
    Rのベクトルとデータフレームの扱いやすさは統計解析向きだしライブラリーの充実さも段違いだしなあ?実際どうなんだろ。
  • 7 Command-Line Tools for Data Science | Jeroen Janssens

    Data science is OSEMN (pronounced as awesome). That is, it involves Obtaining, Scrubbing, Exploring, Modelling, and iNterpreting data. As a data scientist, I spend quite a bit of time on the command-line, especially when there’s data to be obtained, scrubbed, or explored. And I’m not alone in this. Recently, Greg Reda discussed how the classics (e.g., head, cut, grep, sed, and awk) can be used for

    7 Command-Line Tools for Data Science | Jeroen Janssens
    kkobayashi
    kkobayashi 2013/09/20
    Rioは便利そう。Rをパイプで使いたいなーと思うことが結構あるので。
  • Rで計量時系列分析:VARモデルから個々の時系列データ間の因果関係を推定する - 渋谷駅前で働くデータサイエンティストのブログ

    前回の記事ではVARモデルの基礎までを取り上げました。ということで、今回はVARモデルに基づいて異なる時系列同士の因果関係を推定する3つの手法について取り上げてみようと思います。 ということで毎回毎回しつこいですが、使用テキストはいつもの沖です。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者:竜義, 沖朝倉書店Amazon 以下タイトルにのっとってRで各モデルの挙動を見ながらやっていきます。 必要なRパッケージ&サンプルデータ {vars}をインストールして展開して下さい。なお、Granger因果のグラフ構造表現及び偏Granger因果は、実はそもそもRでは実装されていません。ここだけMatlabの話題になりますので、悪しからずご了承を。。。 それから今回のサンプルデータですが、また{vars}同梱のCanadaでは芸がないので違うデータを使うことにします。沖

    Rで計量時系列分析:VARモデルから個々の時系列データ間の因果関係を推定する - 渋谷駅前で働くデータサイエンティストのブログ
    kkobayashi
    kkobayashi 2013/07/31
    時系列の勉強ちゃんとしなきゃいかんな
  • Rから利用するオープンデータAPI

    2013年10月8日に開催された標記勉強会で使用したスライドです。オントロジーエディタprotégéの使い方について、簡単な例を用いて説明しています。内容は入門レベルです。

    Rから利用するオープンデータAPI
    kkobayashi
    kkobayashi 2013/07/22
    よく分からんが便利そうだ!