「Mathematics for Machine Learning」は、微積・線型代数・統計など、機械学習に必要な数学をまとめて学べるテキストです。Amazonで5000円以上するのですが、なんとPDF版は無料で公開されてます。A… https://t.co/oIWWevAa6N
気象庁の定義で「上陸」とは、台風の中心が北海道・本州・四国・九州の海岸に達することをいいます。 日本に上陸する台風の多くは、南や南西方向から近づいてきます。統計上、台風上陸が最も多いのは鹿児島県で、これまでに42個の記録があります。九州では他に長崎県で17個、宮崎県で14個など多数が上陸しています。 福岡県や佐賀県は北側に海岸線があるため、九州の他の県に比べて北上する台風は上陸しにくい地理的条件です。今回の台風はほぼ真西から進んできて、福岡県の海岸線に達しました。福岡県に上陸したことで、九州では佐賀県だけが、統計開始以来の上陸の記録がないことになります。 >>最新の台風情報 台風14号は上空を吹く強い西風、ジェット気流には乗れず、九州に近づいてもあまり速度を上げることがありませんでした。さらに台風の北側の中国大陸に勢力を広げる高気圧に阻まれる形であまり北上できず、真東に近い進路で接近したこ
英イングランド南東部メードストンで、閉鎖された店舗の横を歩く人々(2021年2月12日撮影)。(c)Ben STANSALL / AFP 【2月13日 AFP】新型コロナウイルスの世界中の新規感染者数は、この1か月で半分近くに減少した。統計はAFPの専用データベースに基づく。 【写真特集】コロナ禍でも愛はそのままに AFPの統計によれば、世界中の新規感染者数は過去1か月で44.5%減少した。これは新型ウイルスの感染拡大が始まって以来最大の下落で、減少期間も最も長い。 今年1月5日から11日にかけては、1日当たりに確認された新規感染者数が74万3000人だったのに対し、先週も減少傾向がみられ、1日当たりの新規感染者数は平均で41万2700人だった。これは昨年10月以来、最も低い水準にある。 今週、新規感染者数が最も大きく減少したのは、54%減のポルトガルと39%減のイスラエルで、どちらもロッ
光栄にも大塚淳先生より新著「統計学を哲学する」(名古屋大出版会: 以下「本書」)を御恵投いただきました。御礼に替えて、簡単に内容を紹介し議論をしていこうかと思います。特に本書が導入した「存在論」「意味論」「認識論」という三つの区別の意義を大久保の視点から論じます。最後に、私が関心を持った今後の展開について言及します。 ・はじめに 科学哲学とは、どのような分野なのだろうか。もちろん私が考えるにはあまりにも大きすぎる問だが、他の人に紹介するなら「科学における概念や論争を分析すること」あるいは「ある学術的主張の背後で暗黙的に措定されている前提を分析すること」と答えるかもしれない。本書の著者がTwitter述べた通り、 Jun Otsuka@junotk_jp あと哲学っていうと論理が及ばないところを棍棒で殴り合う、っていうイメージがあるみたいだけど、それは全くの誤解ですね。むしろ私のイメージする
統計データの落とし穴 その数字は真実を語るのか? 著者:ピーター・シュライバー 出版社:ニュートンプレス ジャンル:数学 「統計データの落とし穴」 [著]ピーター・シュライバー 90年代のニューヨーク市警に、取り締まりや犯罪データの収集システムが確立した。ある分署長はそれを使い、警官や部署の活動を、数値評価し始めた。もちろん警官の行動は変わっていった。無意味な職務質問を増やしたり、重大犯罪を微罪として扱ったり、被害者が被害届を出すのを邪魔するようになったのだ。数値ノルマを達成するため、そのような行動は署の全体でなされた。数値評価を導入すると、人はそれに応じて行動を変える。結果として、その数値評価を通じて実現したかったことと、反対のことだって起こる。 数値評価は大切なように思える。なんせ数値は、数値で表せないものと比べて、はるかに見えやすいし、分かりやすいから。だから人は数値を見て、そこに答
安倍晋三首相はなぜ突然辞任したのか。統計データ分析家の本川裕氏は「コロナ対策、内閣支持率、実質GDPという3つのデータが、政権が末期であることを示していた。コロナ対策で機動性を欠き、7年8カ月のアベノミクスが水の泡となった責任を痛感したのではないか」という――。 統計データは知っている、安倍首相が突然の辞任を決めた本当の理由 8月28日、安倍晋三首相は官邸で記者会見し、持病の潰瘍性大腸炎の再発により首相の職務継続困難という理由で辞任する意向を表明した。その後、次期首相となる自民党の後継総裁選挙が自民党の3候補によって行われている。各候補はそれぞれ政策を主張しているが、結局、次期総裁=次期首相は「派閥の意向」で決まりそうだ。 ここで、7年8カ月と連続在職日数が歴代最長となった第2次安倍政権の評価を論じつくすことはできないが、私が注目するデータで政権の帰趨を振り返ってみよう。取り上げるデータは
LeanとDevOpsの科学[Accelerate]は、数年にわたる科学的で厳密な調査研究を基に、組織のパフォーマンス向上を促すケイパビリティを示した書籍です。 LeanとDevOpsの科学[Accelerate] テクノロジーの戦略的活用が組織変革を加速する impress top gearシリーズ www.amazon.co.jp ■デリバリーパフォーマンス(Four Keys)●従来の評価尺度の問題 組織レベルの目標達成に役立たない「忙しいが価値のない、見せかけの作業」を大量にこなした者を報奨するやり方では、混乱の壁を招いてしまう。作業量ではなく、グローバルな成果に焦点を当て、チームの協働を報奨する新たな尺度が必要。 ●望ましい尺度 ・デプロイの頻度 ・変更のリードタイム ・MTTR ・変更失敗率 ●2017年時点の統計値※書籍を参考に作成 ●2019年時点の統計値※State of
東部では、ロシア軍が果敢に何度も攻撃するもののウクライナ軍に撃破されている。 南部では、両軍の砲撃は続いているが、ウクライナ軍は攻勢準備中で、ロシア軍は防御のための壕を構築している。 この期間のロシア軍の損失(ウクライナ軍参謀部発表)をみると、兵器の種類によって、損失の多い時期が異なっている。 基本的には侵攻当初が最も多いのだが、その後減少して、7か月後から増大しているものもある。また、兵員の損失も同じような傾向がある。 この増減は、主に戦いの様相が変わったことによるものである。 地上軍の戦車・装甲車、火砲など、および兵員の損失に区分して、損失の変化と理由、充足の可能性および今後の戦闘の予測について考察する。
この記事について電通デジタルでデータサイエンティストをしている中嶋です。今回の記事では統計的仮説検定における検出力や効果量の概念及び、それらを考慮した事前のサンプルサイズ設計について説明します。読者層としては、既に統計的仮説検定の基本的な使い方を理解している方を主な対象としていますが、そうでない方にもわかるように最初に簡単な復習をします。 統計的仮説検定について 概要 統計的仮説検定(以下、仮説検定)とは、性質の異なるグループ間で平均や分散など各グループを代表するような数値を比較する際に、その差が偶然生じたものか、そうでなく何かしら必然性がありそうかを検証するための統計手法です。例えば比較分析したい2つの群(ex. ユーザーグループ)があった時にある指標(ex. 各群の年齢の平均値)を比較して、統計的に偶然ではないレベルで差異が生じているかを判定したいときに仮説検定を使うことができます。
統計学はやはり人類には早いと思う 仕事で数理統計学を勉強していて、趣味で統計検定1級を取ろうとしているのですが、 今日は統計的検定の話をしようと思っています。 というのも、これが僕の無知によるものなのか、それとも世間一般に言われる誤解なのかはわからないんですが、 統計的検定ってそもそも一体何であるのかについて、よく理解できた形で 議論をしている場面に出会ったことがあまりないと思ったからです。 この記事ではどうにか「検定するには母集団に対する仮説を持つことが重要ですよ」とか「仮説がふんわりしたところで検定すると危ないですよ」とか話しますが、 具体的に「母集団に対する仮説を雑に決めたことで大きな損失を得た事例」をよく知らないので、 説得力に欠ける話になっています。大きな損失を得た事例持ってる方いたら教えてくだし。 どこまでを話すか? 実際、統計的検定や、その結果の判断軸などについては完成した合
はじめに 統計学の講義や実習の際に使える心理系のデータセットをまとめました。アヤメの分類や経済統計もいいですが、やはり心理学に関連したデータを使う方が心理系の学生には興味をもって統計を学べると思います。ここには私が授業でよく使っているものをリストしました。他に良いものがあれば教えて下さい。 Open Stats Lab https://sites.trinity.edu/osl Psychological Science 誌に掲載された論文のデータが公開されています。データだけでなく、論文の概要や実習の手引きなども揃っています。回帰分析や因子分析など統計手法ごとに分類されているので、教材を選ぶ際にとても便利です。 datarium パッケージ https://rpkgs.datanovia.com/datarium/ R のパッケージです。パッケージをインストールすればすぐ使えるようになる
もちろん文脈には注意が必要だけど。 「一般的に読めない名前をつける親は頭が良くない可能性が高いです。よって、読めない名前の子供は遺伝により頭が悪い可能性が高いです」は差別でない 「一般的に読めない名前をつける親は頭が良くないです。よって、読めない名前の子供は遺伝により頭が悪いです。ワタナベマホトも頭が悪いんでしょう」は差別 言いたいのは、差別反対のために統計的事実を否定するのはよろしくないということ。 ひょっとすると、本当に、名前の可読性と知能は相関するかもしれない。女性の方が運転が下手かもしれない。年寄りの方が発想力が乏しいかもしれない。差別反対のために統計的事実を否定すると、仮にこうした「偏見」に統計的なエビデンスが示されとき、議論に蓋をするしか無くなってしまう。実際、社会には、ジェンダーや年齢によるバイアスは無数に事実として存在する。 大事なのは、事実(かもしれないこと)を否定するの
「あみだくじ」は当たりの真上に近いところほど当たりやすい。これは統計学でわかっている事実だ。「運がいい」「ツキがある」ということも、その多くは統計学で説明が付くという。文系向けの統計学の入門書『グラフとクイズで見えなかった世界が見えてくる すごい統計学』(飛鳥新社)より、一部を紹介する――。(第2回) 「あみだくじ」で当たりを引きたい人は「真上」を選ぶ じゃんけんだけでなく、複数で何かを決めるときに活躍するのが「あみだくじ」。これって、本当に公平なのでしょうか? あなたが住んでいるマンションで、自治会内の役職を決めます。7人の中から、あみだくじで会長を決めることになりました。あなたは絶対にやりたくありません。そこで、問題です。
先日、つれづれなるままに 時系列分析の勉強法の記事『統計初心者が時系列分析を学ぶための勉強法』 を書き殴ってみたところ、反響の大きさに驚きました。 正直、時系列分析なんてかなりニッチな分野だ(3人ぐらいしか読まないだろう)と思ってたからです。 ステイホームしているみなさんが、暇だから時系列分析を使ってFXで一儲けしようとでも考えているんでしょうか。 時系列分析のトピックである、状態空間モデルも統計モデリングの一種なわけですが、本日は、「統計モデリングとは何なのか」について、あらためて考えてみたいと思います。 統計モデリングといえば、みんな大好き緑本『データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)』です。 緑本はたしかに素晴らしい本ですが、緑本を読んだだけでは、「何が統計モデリングで、何が統計モデリングではないのか」「統計学における
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回は「スカラ」「ベクトル」「行列」「テンソル」の基礎知識を学びました。今回のテーマは、ベクトルの扱い方=計算方法です。 ところで、皆さんは英語を学習したことがあると思います。新たな英単語・英文法を学ぶことで、より多くの英文を読解できるようになることを経験しているはずです。何が言いたいかというと、今回のテーマを学ぶことは、数学に関連する文献を読むことにおける「単語や文法を学ぶ」ようなことに値します。つまり、より多くの文献を読解できるようになるはずなので、しっかり学んでいきましょう。 2次元のベクトル ベクトルの計算方法を解説するために、例として次のような2つのベクトルを考えます。 今回は2次元(要素が2つ)のベクトルで、次のような数字の集まり
槙野@日常アカ @makinoarco だから今回のストーリーで「もっと小出しに回想出しておいて欲しかったな~」とかの意見ある人はできるだけ回想回収しつつ「ストーリーもっとおかわり!」みたいなご意見送っておくといいと思うな~と思いました! 2022-04-05 11:34:01 槙野@日常アカ @makinoarco ゲームにも予算があって際限ないわけじゃないから「ゲームに必要とされていないと判断できてしまう統計が取れてしまうデータ」についてはガンガン削られていきます。「前作の良いところが新作でなくなってた」とかがあったら大体そうです。「支持する意見が届かない」というのは壊死と同じです。 2022-04-05 11:54:01
講座内容 本講座は、日本統計学会と日本行動計量学会の協力のもとに作成され、統計学Ⅰで学んだデータ分析の基礎および統計学Ⅱで学んだ推測統計の方法に引き続き、多変量データ解析手法について学習します。実際のデータは複数個の測定項目からなる多変量データであることが多く、そのようなデータの統計解析手法の学習は、統計手法の現実問題への応用で極めて重要なものです。本講座では、多変量解析法を実際のデータに適用する際の注意点や実際の応用例を中心に学習をします。 第1週:多変量データ解析法の概略と重回帰分析 多変量データ解析法の分類 変量間の関係(因果、回帰、相関) 研究の種類とデータ収集法 重回帰分析のモデル 結果の読み方 結果の解釈 説明変数の選択 ゲスト:選挙予測――未来の政権を知る(鈴木督久) 第2週:主成分分析と因子分析 主成分・因子分析にできること 主成分分析による可視化の原理 主成分分析の二通り
厚生労働省の統計不正問題を受け、政府の有識者会議は、不正の防止に向けた総合的な対策の素案を取りまとめ、民間の専門家による監査の導入や、統計に精通した人材を育成するための新たな資格の創設などを盛り込んでいます。 それによりますと、不正が起きた背景として、高い専門性が必要にもかかわらず、裏方的な業務と受け取られ、組織内の関心が持たれにくいことや、共働き家庭やオートロックマンションの増加など調査環境の変化による負担の増大などを指摘しています。 こうした状況を踏まえ、対策として、統計の品質向上に向け、民間の専門家による監査を導入するほか、総務省統計局を政府全体の統計業務を支援する機関と位置づけ、各府省庁への助言などを行うことや、統計に精通した人材を育成するための新たな資格制度を創設することなどを盛り込んでいます。 政府はこの素案をもとに、年内をめどに総合的な対策を取りまとめることにしています。
南アフリカ共和国(南ア)でオミクロン株(以下、ο株)が発見・報告されたのが2021年11月24日でしたが、それからわずかひと月で、ほぼ全世界の国々でο株Surge(サージ;波)が発生し、現在発見から3か月目に入りました。南アでの日毎新規感染者統計を見るとο株Surgeは、2021年11月初旬に始まっていますので、ちょうど丸3か月経過しています。筆者は、11月24日と1月15日公開の日刊SPA!記事中で、第6波エピデミックSurgeの予測を公開しましたが、現実は、最悪の推移をとりつつあります。1月31日には、文化放送「大竹まこと ゴールデンラジオ」にてお話しさせていただいていますのでご参考下さい*。 <*放送アーカイブ 大竹まこと ゴールデンラジオ!「大竹メインディッシュ」2022年1月31日 牧田寛 PodcastQR 文化放送> 本邦では、ο株が2021年11月29日に空港検疫で発見され
気象庁は観測結果をもとに、各地点について「〇〇年に一度の降水量」を算出し、発表しています。 ある期間内に1回起こると考えられる降水量のことを確率降水量といいます。気象庁の解説ページでは、確率降水量の推定方法が解説されていますので、これに基づいて「〇〇年に一度の大雨」の値を計算してみたいと思います。 大まかには次のような流れになっています。 年最大日降水量のヒストグラムを作成する 分布関数を当てはめる 分布関数の当てはまり具合を確認する 当てはめた分布関数から確率降水量を算出する 今回は、上記3. をとばして、4.の「当てはめた分布関数から確率降水量を算出する」を実際にやってみましょう! 再現年と確率降水量 気象庁の解説ページにもあるように、再現年 $T$ は $$ T = \frac{1}{1 – F(x; \theta)} $$ で与えられます。ここで、$F(x; \theta)$ は確
書評『統計のための行列代数』July 19, 2020 | 21 min read | 3,454 views jabookmathはじめに 『統計のための行列代数』(D. A. Harville 著,伊理正夫 監訳,丸善出版,2012年)を読んだので,まとめと感想を書きます. (そこまでの精読はできていませんが,それでも誤植と思われる箇所が散見されたので,気づいた範囲ですが末尾にまとめておきました.) まとめ+α 原題は『Matrix Algebra from a Statistician’s Perspective』で,統計学者が身につけるべき線形代数の知識や考え方を全2巻でまとめた著名な教科書です.線形代数は重要かつ範囲がとても広く,抑えるべきポイントがわかりづらいと大学時代から感じていたので,こういう応用を見据えた教科書はありがたいです. 一般的な線形代数の教科書ではあまり
先日、統計ダッシュボード機能(β)をリリースしました。記事をひとつでも公開している場合、Zennにログインすればどなたでも統計情報を表示できます。執筆頻度の確認や閲覧回数の参考にお役立てください。 本稿ではどのように実現したかについて課題とともに記録します。 TL;DR 投稿ページの表示イベントは Google Analytics から BigQuery へ連携しており、イベントデータ(BigQuery)と記事データ(Cloud SQL)をどうJOINさせるかが課題 外部接続でBigQueryからCloud SQLつなぐことにした 統計データ読み出し時、BigQueryを直接使うとクエリ毎に課金されてしまうため、BigQuery BI Engine を使うことにした スケジュールクエリを使い、BI Engineの容量に収まるように集計データを最小限にまとめる チャートは Chart.js
2. 年次推移 1) 肺炎 1899年における肺炎による死亡は,男子23,379人,女子19,934人の合計43,313人で,総死亡者数932,087人の4.6%を占めていた(図1). 年次推移をみると1899年から男女とも増加を続け1917年には男子52,727 人,女子46,509 人となっている.1918年には,いわゆるスペインかぜ6)の流行に呼応して急激に死亡者数が増加し,男子105,507人,女子100,026人の合計205,533人とピークを示し,総死亡者数1,493,162人の13.8%を占めた.さらに,1920年には第2波のスペインかぜの影響を受け.男子88,551人,女子87,123人となっている.それ以降1943年まで,男子では56,000~76,000人,女子では48,000~63,000人程度で推移する.1945年以降は,死亡者数は大幅に減少し,1964年には男子1
黒いトークンをくわえるミヤマオウム。ニュージーランド・オークランド大学のアマリア・バストス氏提供(2019年撮影、2020年3月3日提供)。(c)AFP PHOTO /AMALIA BASTOS PHOTOGRAPHY 【3月4日 AFP】オウム目の一種でニュージーランド固有種の大型の鳥「ミヤマオウム(ケアオウム)」には、確率に基づいて選択することを学習する能力があるとの研究結果が3日、発表された。意思決定の過程で統計モデリングを利用する動物は、大型類人猿以外では初めてだという。 野生動物の専門家チームは今回、統計に関する理解をテストするためのさまざまなゲームをミヤマオウム6羽に教えた。ミヤマオウムは高い知能を持つことで知られている。 6羽には、「黒色のトークン(代用硬貨)で餌のご褒美」「オレンジ色のトークンで餌なし」ということをそれぞれ関連付ける訓練を行った。 初期のテストでは、ミヤマオ
Wataru Inoue @Wataru__Inoue 最新の2021年と5年前の2015年も見たけど、インターネットのパソコン利用率が減少中? パソコン利用率:全国(東京) 2021年:48.1%(59.6%) 2020年:50.4%(64.8%) 2015年:56.8%(70.0%) 令和4年版情報通信白書 soumu.go.jp/johotsusintoke… 平成28年版情報通信白書 soumu.go.jp/johotsusintoke… pic.twitter.com/UnNPMnjFgk twitter.com/kis/status/165… 2023-05-16 06:12:31
元増田ではないが,出典になりそうな統計情報についてメモとして残しておく. 受刑者の IQ に関する統計は法務省の矯正統計で公開されており,令和 2 年度の結果は以下で公開されている. https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00250005&tstat=000001012930&cycle=7&year=20200&month=0&stat_infid=000032105743&result_back=1&tclass1val=0 ここの「能力検査値」とはおおよそ IQ と考えて良い.この統計データによると,令和 2 年度の新規の男性受刑者 14,850 人のうち,能力検査値が 70〜89 の範囲にある受刑者は 7,271 人であり,男性受刑者の約 49.0 % を占めている.これに対
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く