タグ

統計に関するsato_sucroseのブックマーク (16)

  • ナメクジの出現を予測する!- 市民科学と最新統計の融合

    外来種問題は突然に 2014年7月某日、札幌市の円山原始林で私が出会ったのは、体長15cmもの巨大な豹柄のナメクジ、マダラコウラナメクジでした。私はそれを知っていました。過去に一度だけ、ドイツ・ドレスデンの森の中で見たことがあったからです。北欧原産のナメクジがどうしてここに? 慣れ親しんだ円山の森に現れた、不似合いな新参者との突然の出会いに、目眩がしました。私の知る北海道の生態系は、これからいったいどうなってしまうのか? 我々ヒトの生活への影響は? 体長15 cmほどのマダラコウラナメクジ 市民のブログが教えてくれた 予期せぬ出会いに衝撃を受けた私は、研究室に戻るや否や、飛びつくように現状を調べ始めました。わかったことは、マダラコウラナメクジが2006年に茨城県で最初に侵入・定着が確認されたということ、さらに2010年には福島県、2012年には長野県にも侵入し勢力を拡大しているということで

    ナメクジの出現を予測する!- 市民科学と最新統計の融合
    sato_sucrose
    sato_sucrose 2018/08/12
    年間400回同じ山に登る人、それだけでそもそも只の市民じゃないもんな……1日で2回登る日もあるってことよね……
  • グラフの作り方講座にげんめっ!(引き続き東京は暑くなっているのか問題を例に)

    まとめ グラフの作り方講座(東京は暑くなっているのか問題を例に) 【20150811追記】続き作りました→http://togetter.com/li/859488 基的には同じところ(気象庁)からデータを引っ張ってきていてもグラフの作り方次第でこうも違ったものになるという見のようなあれこれを見たので半ば自分用にまとめました。グラフ大事。 42934 pv 514 176 users 149 おさらい まげぱさんが作成された日最高気温を5℃ずつ区切って11年分数えた積み上げグラフです 各日の最高気温を5度刻みで何日あるかをカウントして11年分累計 5年ずつ開始年をずらして1996年-2007まで25グループを計算 各グループで、各日数が何%あるかを計算 計算した値を積み上げグラフにプロット (11年は太陽周期を意識したそうです)

    グラフの作り方講座にげんめっ!(引き続き東京は暑くなっているのか問題を例に)
  • 猛暑日の増加

    [2018-07-20] as.POSIXct() を as.Date() に変えました。 東京管区気象台の東京における雷日数や真夏日等の日数の変化というページを見ると,猛暑日(日最高気温35℃以上)の日数が1876年以来著しく増加していることがわかる。ところが,平均気温を見ると,地球温暖化・都市化の影響で徐々に増加しているが,激しく変わっているようには見えない。平均ではなくて猛暑日の日数を見るべきであるという議論もある。しかし,「猛暑日」(日最高気温35℃以上)や「真夏日」(日最高気温30℃以上)のような分布の裾の日数は,何℃で切るかによって印象が大きく異なる。気温変化を誇張することにならないか。 「東京」の観測地点は2014年12月2日に約900m離れた地点に移転している。詳しくは「東京」の観測地点の移転について(PDF,2014年11月14日,気象庁観測部)を参照されたい。 東京の日

  • 若い男性の草食化、「セックス離れ」はウソだった 「性交経験率5割超えは29歳」、実は20歳だった

    男性の性交経験率が5割を超える年齢は29歳――。驚きのデータとして各メディアで「若い男性のセックス離れ」と報じられ波紋を広げた調査に、実は誤りがあった。 正しくは20歳で、調査を行った団体によると、調査データの計算やまとめ方のミスがあったためだという。 第1報の段階で「29歳と聞いて安心した」「わずか6年で童貞卒業年齢が23歳から29歳に跳ね上がってる!格的童貞ブーム到来!」とはしゃいでいた輩にとっては、とんだぬか喜びの発表となってしまった。 正しくは男性20歳・女性19歳 誤りがあったのは「日家族計画協会」が2014年1月に発表し、男女3000人にセックスの頻度や関心などを調べた「第7回男女生活と意識に関する調査」だ。その中で、セックスを経験した人が50%を超える年齢について、14年調査で男性29歳・女性28歳としていた部分が、正しくは男性20歳・女性19歳だった。 同会によると、誤

    若い男性の草食化、「セックス離れ」はウソだった 「性交経験率5割超えは29歳」、実は20歳だった
  • 平均貯蓄1658万円は「“回答率”0.02%」の調査で算出した代物だった!

    2人以上世帯約3000万のうち、サンプル数はたった6363世帯 新聞を読んでいると、定期的に「家計調査」に関する記事が出てくる。ご存じの通り総務省が毎年行っているもので、毎年のように「1世帯あたりの平均貯蓄額は……」というタイトルが立つ。 「6363」 いきなり意味不明な数字を載せた。この数字は何だと想像するだろうか。実はこれ、「家計調査」のサンプル数である。総務省のサイトには2012年の家計調査結果が載っていて、その中に貯蓄に関するデータがあるのだが、「サンプル数(2人以上の世帯の集計世帯数)」がこの6363だったのだ。 著者は、データを見ながら気になった。 この「2人以上の世帯の集計世帯数」の単位は何だろうか? 「1千件」だろうか? 表に単位がなかったので、総務省の担当部署に電話を入れてみた。 「あのー、集計世帯数が載っていますが、これは単位は何ですか? 1千件ですか?」 それに対して

    平均貯蓄1658万円は「“回答率”0.02%」の調査で算出した代物だった!
    sato_sucrose
    sato_sucrose 2014/10/09
    回答率0.02ってことはサンプル数千人以上いて一人しか答えなかった設問か……と思ったらぜんぜん違ったでござる。平均より分布見ないといけないってところはいいと思うんだけど。
  • 異端的統計学者としてのナイチンゲール : 人類応援ブログ

    そんな彼女に科学者、しかも「戦闘的」で「異端的」で「革命的」な「統計学者」としての顔があったことを、皆さんはご存知でしょうか。

    異端的統計学者としてのナイチンゲール : 人類応援ブログ
  • サンクトペテルブルクのパラドックス - Wikipedia

    ダニエル・ベルヌーイ サンクトペテルブルクのパラドックス (St. Petersburg paradox) は、意思決定理論におけるパラドックスの一つである。極めて少ない確率で極めて大きな利益が得られるような事例では、期待値が発散する場合があるが、このようなときに生まれる逆説である。サンクトペテルブルクの賭け、サンクトペテルブルクの問題などとも呼ばれる。「サンクトペテルブルク」の部分は表記に揺れがある。 1738年、サンクトペテルブルクに住んでいたダニエル・ベルヌーイが、学術雑誌『ペテルブルク帝国アカデミー論集』の論文「リスクの測定に関する新しい理論」で発表した。その目的は、期待値による古典的な「公平さ」が現実には必ずしも適用できないことを示し、「効用」(ラテン語: emolumentum)についての新しい理論を展開することであった。 パラドックスの内容[編集] 偏りのないコイン[注釈 1

    サンクトペテルブルクのパラドックス - Wikipedia
  • マインスイーパで考える濃度のおはなし - ふーど/さいえんす

    はじめに まさかのダイアリーもう一つ作ってみました。(い、いまさらー!!)*1 改めまして ちょうど今、調理冷凍品からの農薬マラチオンの検出が話題です。 報道も加熱しておりますが、その中で「おやおや」と思うことがありましたので*2、何かわかりやすく説明できないかなー、と思ったのでやってみます。 はじめに:ppmとは parts per million の略。「100万分の」という感じです。 似たもので身近なのが%、(parts) per cent、「100分の」があります。こちらは日常的に使いますよね。ppmは%をさらに細かくしたもの、1% が10,000ppmとなります。 ホースでも羊羹でもなんでも良い、何か長いものを想像して、100個に切ったうちの一つが1%、もーーーっと細かく100万個に切ったうちの一つが1ppmという感じです。 で、このあたりの"なんとか分のなんとか"というものは

    マインスイーパで考える濃度のおはなし - ふーど/さいえんす
  • 少子化をあっという間に解決する方法:2人目出産で500万<追記あり>

    私が仮に少子化問題担当大臣になったら以下のシンプルな政策を実行します。

    少子化をあっという間に解決する方法:2人目出産で500万<追記あり>
    sato_sucrose
    sato_sucrose 2013/11/22
    児童虐待が捗るな
  • ココアを飲むと計算能力アップ──森永製菓が研究結果を発表

    ココアを飲めば計算力アップ──こんな研究結果を森永製菓が11月12日に発表した。中学生を対象に実施した試験に基づく結果といい、「ココアは受験生の強い味方」としている。 四天王寺大学佐藤広康教授との共同研究で、中学2~3年生の男女207人に実験。ココアか対照飲料(キャラメル風味飲料)を飲んでもらい、45分後に加算計算試験を実施したところ、ココアを飲んだ被験者の方が回答数・正答数ともに高かった。誤答率には有意差は見られなかった。 ココアに含まれるカカオポリフェノールとテオブロミンは摂取後1~2時間以内に血中濃度がピークに達するとされており、今回の計算能力の向上結果は、この2つの成分による効果と考えられるという。 ココアの飲用は単純な計算課題の遂行――具体的には注意力や持続的集中力、抗精神疲労など――に効果的であり、学習の効率化や知的作業のパフォーマンス向上につながることが期待されるとしている。

    ココアを飲むと計算能力アップ──森永製菓が研究結果を発表
  • 【舞田敏彦】博士課程修了者の多くが行方不明・死亡したと称するデマについて【またお前か】

    関連記事「株式会社はてなから情報開示請求を知らせるメールが来ました」を書きました。(2015年1月24日) 関連記事「舞田敏彦さんからDMCA違反の申し立てがありました」を書きました。(2016年9月29日) 先日、このようなツイートを見かけた。 2013年春の大学学部卒業生・博士課程修了生の進路図。何度でも言う。この現実を知らねばならぬ。 pic.twitter.com/CYaqFfowBB — 舞田敏彦 (@tmaita77) November 6, 2013 大学の博士課程を修了した者が、その後、正規雇用されず、多くが不安定な職業に甘んじたり、死亡したりした、とするツイートである。行方不明者がいるとまでは言っていないが、そのように誤読する者も多かった。 このツイートに対する主たる反響は、次のようなものであった。 【怖すぎ注意】学生の人はこの現実を必ず知っておいたほうがいいぞ・・・ 大

  • ポアソン分布 - Wikipedia

    統計学および確率論で用いられるポアソン分布(英: Poisson distribution)とは、ある事象が一定の時間内に発生する回数を表す離散確率分布である。 数学者シメオン・ドニ・ポアソンが1838年に確率論とともに発表した。 ある離散的な事象について、ポアソン分布は所与の時間内での生起回数の確率を示し、指数分布は生起間隔の確率を示す[1]。 定義[編集] 定数 λ > 0 に対し、0 以上の整数を値にとる確率変数 X が を満たすとき、確率変数 X は母数 λ のポアソン分布に従うという。 ここで、e はネイピア数 (e = 2.71828…)であり、k! は k の階乗を表す。また、λ は所与の区間内で発生する事象の期待発生回数に等しい。 P(X = k) は、「所与の時間中に平均で λ 回発生する事象がちょうど k 回(k は非負の整数)発生する確率」に相当する。例えば、事象が平

    ポアソン分布 - Wikipedia
  • 都道府県別の大学進学率

    現在では同世代の2人に1人が大学に進学しますが,大学進学率は,この2年間続けて下がっている模様です。2011年春が51.0%,2012年が50.8%,そして2013年が49.9%なり。 これは浪人込みの進学率ですが,浪人込みの率なんて出せるのか,という疑問もあるかと思いますので,当局の計算方法を説明いたしましょう。 大学進学率とは,同世代のうちどれほどが大学に進学したかという指標です。ベースは高卒者ではありません。文科省の『学校基調査』からこの値を計算する場合,当該年に大学に入った者の数を,推定18歳人口(3年前の中学校・中等教育学校前期課程卒業者)で除すことになります。 http://www.mext.go.jp/b_menu/toukei/chousa01/kihon/1267995.htm 分子の大学入学者数には,より上の世代(いわゆる浪人生)も含まれますが,当該年の18歳人口から

    都道府県別の大学進学率
  • 今回は因果関係があるのに相関関係が見られない4つのケースをまとめてみた(前編:検定力が低い) - Take a Risk:林岳彦の研究メモ

    どもお久しぶりです。林岳彦です。ローソンなどで売ってるいなばのタイカレーはそうめんのつけ汁として使ってもマジうまいのでオススメです。 さて。 今回は前々回の記事: 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ の続編として、逆のケースとなる「因果関係があるのに相関関係が見られない」ケースについて見ていきたいと思います。あんまり長いと読むのも書くのも大変なので、今回はまずは前編として「検定力の問題」に絞って書いていきます。 (*今回は上記の前々回の記事での記述を下敷きに書いていきますので、分からないところがあったら適宜前々回の記事をご参照ください) まずは(今回の記事における)用語の定義:「相関」と「因果」 今回も少しややこしい話になると思うので、まずは用語の定義をしておきたいと思います。(*細かいと

    今回は因果関係があるのに相関関係が見られない4つのケースをまとめてみた(前編:検定力が低い) - Take a Risk:林岳彦の研究メモ
  • セックスの回数が多い人は収入も多い=研究

    This copy is for your personal, non-commercial use only. Distribution and use of this material are governed by our Subscriber Agreement and by copyright law. For non-personal use or to order multiple copies, please contact Dow Jones Reprints at 1-800-843-0008 or visit www.djreprints.com. http://jp.wsj.com/article/SB10001424127887324562504579021761121513476.html

    セックスの回数が多い人は収入も多い=研究
    sato_sucrose
    sato_sucrose 2013/08/19
    また統計デマか
  • 進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!

    はじめに 最近超人気の漫画として私のTwitter TLを賑わす作品、その名も「進撃の巨人」。 これだけ人気なんだからきっと面白いに違いないのですが、 なんか絵が怖そうだし、人がバンバン死んでてグロいっぽいという噂を聞くので、 なんとか漫画を読まずに、それでいて進撃の巨人のキャラについては知りたい、 そう願う潜在的進撃の巨人ファンも全国に70万人くらいいらっしゃると思います。 そこで、データから進撃の巨人にどんなキャラが登場するか推測してみましょう。 扱うデータとして、pixivのタグ情報を利用します。 商品レビューコメントなどとは違い、ファンの創作活動がダイレクトに反映されるサービスなので、 そこに付与されるタグ情報は、ファンの熱(過ぎる)いメッセージが込められているに違いありません。 今回、以下のような縛りを入れています。 1.勿論原作は見ない 2.pixivのタグ情報は参照するけど、

    進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!
  • 1