株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。
いぐぞー ✈️ 旅するプログラマー @igz0 旅とプログラミングをこよなく愛します。 アメリカ大陸🇺🇸を横断しました!!小学生からプログラミング→新卒SIer→Webに目覚め個人事業主兼会社員。テレビ出演経験あり。 Webサービスを作りました。AI・VRに没頭中。IT関連中心にツイートします!!アイコンは@ixy先生より利用許諾済み。Amazonアソシエイト。 note.com/igz0/ いぐぞー ✈️ 旅するプログラマー @igz0 Twitter公式が「バズる」ツイートの法則を徹底的に統計解析して168ページの資料にした代物、SNSマーケティングやっているプロが全員廃業するレベルの化け物級の優良資料だった。 ちなみに無料。 SNSで「バズりたい」と思う人は全員これ読めばいいんじゃないかってレベル。 marketing.twitter.com/content/dam/ma… pi
資料では、統計学がどんな学問なのか、統計学を学ぶことにどんな意義があるのかという初歩から解説。その上で統計学を「記述統計学」と「推計統計学」に大別し、それぞれの特徴や手法、注意点を説明している。 今回の無料公開は、ブレインパッドで働く有志のデータサイエンティストが技術資料などを外部に発信するプロジェクト「OpenBrainPad」の一環。「統計学をこれから学ぶ人も復習する人もぜひ利用してほしい」(ブレインパッド)という。同プロジェクトでは、過去にはプログラムのバージョンを管理するシステム「Git」のハンズオン(実際に手を動かして学ぶ)資料なども公開している。 関連記事 総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート 総務省が「誰でも使える統計オープンデータ」を開講。統計オープンデータを活用したデータ分析の手法を解説する無料講座だ。 AIの基礎をZoomで講義 新人研修用
津野 香奈美 | Kanami Tsuno, PhD, MPH @KanamiTsuno 「努力できる」「頑張れる」「やってみる」事が当たり前ではないと気付いたのは、某専門学校で初めて統計学を教えた時。黒板に数式書いても、誰も手が動かない。生徒全員がぽかーんとフリーズしたまま授業が終了。もちろん、質問は?と聞いても誰も手をあげない。帰り道、次からどう教えれば良いのか→ 2024-03-11 12:04:46 津野 香奈美 | Kanami Tsuno, PhD, MPH @KanamiTsuno 公衆衛生系大学院准教授/医学と社会学と心理学と行動科学の狭間を行く社会疫学者。研究テーマは労働時間、いじめ・ハラスメント、シビリティ、メンタルヘルス、健康格差。 『パワハラ上司を科学する』amzn.to/3IBEWwJ 『Tsuno Lab』note.com/kanamitsuno researc
タイトルの結論は、「役に立つ」です。 役に立つか立たないかの議論は一切せず、本記事では、如何に統計や数学が実社会で役に立つかを紹介します。 はじめに こんにちは。ZENKIGENデータサイエンスチーム所属の廣田です。原籍はオムロンソーシアルソリューションズ株式会社 技術創造センタですが、社外出向でZENKIGENに所属しており、数理最適化や機械学習を用いたデータの分析業務、それらの結果に基づいた顧客への提案をしております[1]。 出向先であるZENKIGENの同僚にも、原籍のオムロンの同僚にも、統計検定®の準1級や1級を持っている方がいて、私も負けじと準1級を受験しました。結果、統計検定®準1級に合格し、優秀成績賞までいただくことができました。 統計検定®合格証と優秀成績賞 試験対策を通じて、改めて統計学の考え方は有用と感じました。この手の検定試験は物事を体系的に学ぶきっかけになるため、私
令和4年の一年間で起こった「全事故」、つまり軽傷・重傷・死亡のすべてを含む交通事故の発生件数は300,839件。そのうち死亡事故は2,550件です(警察庁調べ)。これらは、どんな状況で発生しているのでしょうか。また、特に重大な事故につながりやすいのはどのようなシチュエーションなのでしょうか。 交通事故・死亡事故のデータを読み解くことで、重大な事故を回避する上で注意すべきポイントが見えてくるかもしれません。国内で発生した交通事故の情報を蓄積し、総合的な調査分析を行う「交通事故総合分析センター」の田久保宣晃さんに、さまざまな分析データを紹介してもらいつつ、見解を伺いました。そこには、ハンドルを握る人が、事故を起こさず、安全に車を運転するための、さまざまな示唆がありました。 【お話を聞いた人】 田久保宣晃(たくぼ・のぶあき)さん:工学博士。交通事故総合分析センター 研究部次長兼研究第一課長。警察
2023年11月19日に統計検定1級を受験し,統計数理,統計応用(社会科学)にダブル合格。 勉強期間半年(半分ダラダラ)で一発合格できた経験をもとに主観込み込みで綴っていきたいと思う。 結論 結論からいいます。統計検定1級に受かりたければやることはただひとつ。 現代数理統計学の基礎を完璧にする。 これだけです。現代数理統計学?統計検定準1級ワークブック?過去問?いりません。 現代数理統計学の基礎,この本を仕上げ切るまでは手をつけなくていいです。 なぜ僕がこう言い切れるのか軽く説明していきたいと思います。 簡単な自己紹介 某都内私立大学3年生。大学の授業で線形代数,微積,確率統計の基礎を履修。受験期は理系で数3も勉強していたためそこまで数学に対する抵抗はない。というか数学に抵抗のある方は統計検定1級に向いてないと思う。 なぜ現代数理統計学の基礎だけでいいのか 統計応用の勉強はどうするの?そう
じゃんけんで勝率を高める方法はあるか。データ分析・活用コンサルタントのサトウマイさんは「あるジャンケンに関する研究では、『グー』を出す確率が35.0%、『チョキ』を出す確率が31.7%、『パー』を出す確率は33.3%と、最もグーが多かった。心理学的には『人間は警戒心を持つと、拳を握る傾向がある』という説のほか、『チョキはグーやパーと比べて出しにくい』という説もある。こちらからじゃんけんを仕掛けるときは『最初はグー』という掛け声をスピードアップし、こうしたクセをより出やすくさせるといいだろう」という――。 ※本稿は、サトウマイ『はじめての統計学 レジの行列が早く進むのは、どっち⁉』(総合法令出版)の一部を再編集したものです。 人間のクセからみるじゃんけんの統計的な必勝法 運に関するゲームで、私たちの一番身近にあるのは「じゃんけん」ではないでしょうか? 手だけを使って、3種類の手の出し方(グー
新型コロナウイルスのパンデミックで世界的に普及したリモートワークや、リモートワークと職場での労働を半々で行うハイブリッドワークについて分析した統計データを、ニューヨーク・タイムズが公開しています。 Work From Home Data Shows Who's Fully Remote, Hybrid and in Person - The New York Times https://www.nytimes.com/interactive/2024/03/08/business/economy/remote-work-home.html 2020年に新型コロナウイルスのパンデミックが始まって以来、多くの労働者がリモートワークに移行しました。パンデミック期間には多くの企業がリモートワークを推進しましたが、新型コロナウイルスの流行が収束してからは、週の数日を自宅でリモートワークし、数日を職場
慶應義塾大学・株式会社Nospareの菅澤です. 今回はベイズ統計学を勉強するための参考書の順番 (私見) について紹介していきます. 3年ほど前に『日本語で学べるベイズ統計学の教科書10冊』を紹介しましたが,今回は「どのような順番でどの参考書を読んでいくと比較的スムーズに勉強が進められるのか」に焦点を当て,比較的最近の書籍や英語の書籍まで含めて紹介していきます. まずは全体的なフローのイメージを提示しておきます. 今回の記事では,「ベイズ統計学を勉強すること」のスタートとゴールを以下のように定めます. (スタート) 統計学の基礎的な内容 (統計検定2級程度の内容) は身についている (ゴール) ベイズモデリングに関する最新の論文がある程度理解して読め,自力でモデルを組んだり実装することができる また,このゴールへの道のりとして,大きく2通りのルートを想定します. (ルートA: フルスクラ
「PDCA回してかないとね」「それはPDCAでいこう」 ビジネスシーンで頻繁に使われる、この「PDCA」という言葉。Plan/計画、 Do/実行、 Check/評価、 Action/改善という4つのステップを踏んで事業のあり方を改善するフレームワークですが、果たして本当にPDCAの回し方を正しく理解し、実践できているでしょうか? そもそもPDCAを正しく回すために何が必要で、何が欠けると正しく回せないのか? そんな疑問をもとに今回お声がけしたのは、SNSや著作を通じてPDCAの考え方を紹介されてきた統計家、西内啓さんです。 「PDCAとは質の高い目標を立てるための考え方」だと語る西内さんに、知っているようで知らない、PDCAの正しい回し方を伺います。 西内啓さん。東京大学を卒業後、東京大学助教、大学病院医療情報ネットワーク研究センター副センター長、ハーバード大学ダナ・ファーバー癌研究所客員
[Book Review 今週のラインナップ] ・『統計学の極意』 ・『「まちライブラリー」の研究 「個」が主役になれる社会的資本づくり』 ・『円の実力 為替変動と日本企業の通貨戦略』 ・『科学がつきとめた 中年太りのすごい解消法』 評者・神戸大学教授 末石直也 キャッチーなタイトルから抱くイメージとは裏腹に、本書は一流の研究者によって著された深い洞察に満ちた統計学の入門書である。 数式は登場させないスタイル 「問題解決志向」の統計学入門 著者のシュピーゲルハルターは、「逸脱度情報量規準」という指標の提案者として知られる統計学の理論研究者である。同時に、医療統計学の分野において優れた貢献を果たしてきた応用研究者でもある。そんな著者による本書は、数式が登場しない読み物のスタイルを取りつつも、統計学の基本概念を厳密性を損なうことなく解説している。 本書のいちばんの特徴は、著者の言葉を借りると「
実質賃金上昇率が安定的にプラス基調となるのは2024年10-12月期 厚生労働省は8日に2月分毎月勤労統計を公表した。2月の現金給与総額は前年同月比+1.8%増加し、実質賃金は同-1.3%と23か月連続での低下となった。 春闘での賃上げ率は事前予想を大幅に上回ったが、その影響が毎月勤労統計の賃金に表れてくるのは、年央頃になるだろう。さらに、それが物価に与える影響が確認できるのは、夏以降となるだろう。 春闘の結果を受けて、ボーナスや残業代などを含まない、基調的な賃金部分である所定内賃金の前年比上昇率のトレンドは、現在の+1%台半ば程度から、今年後半には+3%程度にまで高まることが予想される。毎月勤労統計で実質賃金の計算に使われる消費者物価(持ち家の帰属家賃を除く総合)は、前年同月比でコアCPI(生鮮食品を除く消費者物価)よりも0.5%ポイント程度高い。 これらの点から、コアCPIの前年比上昇
日本各地で相次いで報告されているクマによる被害。22日は岐阜県や山形県でけが人が出ました。 クマに襲われてけがをするなど、被害にあった人の数をNHKがまとめたところ、今年度はこれまでに17の道府県で少なくとも160人にのぼり、国が統計を取り始めて以降、最も多かった3年前の158人を上回る被害となっていることがわかりました。 例年、クマが冬眠に入る12月ごろにかけて各地で被害が相次いでいることから、国や自治体などが対策の徹底を呼びかけています。 環境省によりますと、ことし4月から先月までにクマによる被害にあった人の数は合わせて109人に上っています。 その後、10月に入ってからの被害について、NHKが各地域局の取材をもとに集計したところ、被害にあった人は少なくとも51人で、環境省の9月までの集計とあわせると17の道府県で160人に上っています。 これは、環境省が統計を取り始めて以降、最も多い
SQL実行の流れ まずはSQLがどのような流れで実行されるのかを見ていきます。 SQL実行の流れは大まかに捉えると以下のようになります。 パーサ パーサでは、ユーザーから送信されたクエリを受け取り、その文法的な正確さを検証します。SQLクエリが正しくフォーマットされているか、必要な構文要素が全て含まれているかをチェックし、例えばFROM句で指定されたテーブルが存在するかどうかも確認します。 文法的なエラーがある場合、例えばカンマの欠落や存在しないテーブルの参照など、クエリはエラーとして返されます。 エラーがない場合は、クエリは「抽象構文木」というデータ構造に変換されます。これにより、データベースはクエリをより効率的に解析し、次の処理ステップに進めることができます。 オプティマイザ SQLクエリがパーサを通過した後、次にクエリの最適化を行うのが「オプティマイザ」です。オプティマイザの主な役割
世の中には様々なデータや統計があふれており、それらを視覚的に示す「グラフ」を見かけることも増えました。 仕事や学校でグラフを作成する人も少なくないでしょう。 そして、よく見かけるグラフの1つに「円グラフ」があります。 しかし、円グラフに対して否定的な意見を持っている人は少なくないようです。 オーストラリアのクイーンズランド工科大学(QUT)統計学部に所属するエイドリアン・バーネット氏は、「数学が苦手な人は数字を避けるが、数学が得意な人の多くは円グラフを避ける」と述べています。 世間で円グラフが多用されているにも関わらず、統計学者や専門家、数学が得意な人のほとんどは円グラフを使わないというのです。 それはどうしてなのでしょうか? バーネット氏の主張から円グラフのメリットとデメリットを考えてみましょう。
哲学的SF作家と称され、数々の作品が高い評価を受けているテッド・チャンは、ブラウン大学でコンピュータサイエンスを学んだあとに、SF作家に転じた経歴の持ち主だ。生成AIが世界の話題となるなか、AIを巡る彼の考え方に注目が集まっている。AIは世界を支配するのでは、との懸念を否定するチャンが、それよりも恐れることとは。 AIを別の言葉で表現すると? テッド・チャンにランチをご一緒しませんかと尋ねたところ、その返答は、彼の書く物語に似て簡潔かつ的確だった。 「AIの現状と、SFがそれにどう関与しているかについてなら、喜んでお話しします。でも、私の個人的な生活について話す気はありません。それでよろしければ、ランチをご一緒します」 私が興味があるのはチャンの私生活ではなく、彼の頭の中の世界だ。 この中国系アメリカ人作家は、同世代のSF作家の間でも最も評価の高い作家のひとりで、30年余りで執筆したわずか
はじめに 千葉大学・株式会社Nospareの川久保です.今回は,統計学(特に多変量解析)で多く出てくる行列演算の小技集を,線形回帰モデルにおける簡単な実用例を交えて紹介します. 転置に関する公式 行列の転置とは,$(i,j)$要素を$(j,i)$要素に入れ替えることです.$m$行$n$列の行列$A$の$(i,j)$要素を$a_{ij} \ (i=1,\dots,m; j=1,\dots,n)$とすると,$A$を転置した$n$行$m$列の行列$A^\top$の$(j,i)$要素が$a_{ij}$となります.また,自明ですが,転置行列の転置は元の行列になります.すなわち,$(A^\top)^\top = A$です. 行列の和の転置 行列$A$と$B$の和の転置は,転置行列の和です.つまり, が成り立ちます. 行列の積の転置 次に,行列$A$と$B$の積$AB$の転置としては,以下の公式が成り立
細々と統計学を調べ続けているが、最近ようやく統計学というものが何なのか、おぼろげながらわかるようになってきた(なお、統計学ができるようになってきたわけではない) 統計学を知る前の自分と今の自分をくらべたとき、間違いなく違うのは統計学に対する信頼だろう。以前は、統計学は数学の一分野であり、正しい分析手法を使えば真の答えが得られるものだと思っていた。しかし、実際には統計学者ジョージ・ボックスが言ったとされる「すべての(統計)モデルは間違っている、だが中には役立つものもある)」という言葉の方が実態に近い。 統計学は基本的に「不可能なことを可能にする(不良設定問題を扱う)」学問だ。例えば、1、3、5 という数字の列から何が言えるだろうか。確実なことは3つの実数値が観測された、ということだけで、それ以上のことは想像するしかない。奇数列かもしれないし、乱数から3つの値を取得した際に偶然それっぽい数字が
女性は1泊2日の登山ツアーに参加してガイドらと10人余りで白馬岳などを縦走し、2日目、山頂から下山するため「白馬大雪渓」に向かう途中に、崩れやすい岩が多い登山道でよろけて転倒し、10メートルほど滑落しました。 全身を強く打ったうえ頭から出血していたため自力で下山できなくなり、要請を受けて出動した救助隊員などに背負ってもらって下山したということです。 救助された女性 「コロナ禍の間は登山に行くのを控えていて、外出自粛期間が終わり、行きたかった山にようやく行ったものの、体力がかなり落ちていると感じました。行動時間が長く疲れが出て、集中力が落ちていたのだと思います。自分の体力に見あったツアーを選択すべきでした。幸い命に関わる事故にならず軽いけがですみましたが、多くの方のお世話になりご迷惑をかける結果となり、自分自身の一瞬のミスの重さを感じています」
講師は慶應義塾大学の安宅和人教授、統計情報研究開発センターの小西純氏、早稲田大学の西郷浩教授など、データサイエンスに携わる専門家が務める。統計学の基礎や統計データの見方など、統計データ分析の基本的な知識を学習できる同講座は、2015年の開講からのべ約19万2000人が受講したという。 受講登録は7月29日まで。 関連記事 データ分析初心者は“童心に帰る”べき── 現役データサイエンティストが説く、失敗しないための心構え コロナ禍の事業継続の姿勢から一転し、データ活用に関心を向ける企業が増えている。こ一方、ノウハウや人材不足により、思うような成果を出せない企業もある。現役のデータサイエンティストに分析初心者が持つべき心構えを聞いた。 総務省「社会人のためのデータサイエンス演習」リニューアル開講 無料で学べる 総務省の無料オンライン講座「社会人のためのデータサイエンス演習」がリニューアル開講。
中国国家統計局が17日に発表した2023年の年間国内総生産(GDP)は、不変価格表示で126兆582億元(約2587兆円)、前年比5.2%増となりました。第一次産業は8兆9,755億元(約184兆円)で前年比4.1%増、第二次産業は48兆2589億元(約985兆円)で同4.7%増、第三次産業は68兆8238億元(約1396兆円)で同5.8%増となりました。 米国議会の出資によって設立された短波ラジオ放送局の自由亜州電台の記事より。 2023年中国の経済成長率5.2%増!? 中国の李強首相は現地時間16日、スイスのダボスで開催された世界経済フォーラムで演説し、「中国経済は昨年5.2%の成長を達成し、公式目標の5%を上回った。」と述べ、外国人投資家が中国への投資を継続することを歓迎しました。 しかし、一部の専門家は李強首相の数字の信憑性を疑問視し、中国政府に『実際の行動を取る』よう促しました。
心理学者。キングス・カレッジ・ロンドンの精神医学・心理学・神経科学研究所の講師。2015年に科学的心理学会(アメリカ)の「期待の星(ライジンング・スター)」賞を受賞。『タイムズ』『ワシントン・ポスト』『ワイアード』などに数多く寄稿し、BBCラジオなどの出演もある。 Science Fictions あなたが知らない科学の真実 スタンフォード監獄実験はイカサマだった! 権威ある心理学研究の100件のうち、再現に成功したのはたったの39%!? 科学の信頼性を根底から揺るがす「再現性の危機」に迫る真実の書、日本上陸! 科学における不正・怠慢・バイアス・誇張が起きる仕組みを多数の実例とともに解説。既存の本で知ったウンチクを得意げに語る人に読ませたい、真実の書。 バックナンバー一覧 「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。 科学の「再現性の危機」をご存じだろうか。心理学、
心理学者。キングス・カレッジ・ロンドンの精神医学・心理学・神経科学研究所の講師。2015年に科学的心理学会(アメリカ)の「期待の星(ライジンング・スター)」賞を受賞。『タイムズ』『ワシントン・ポスト』『ワイアード』などに数多く寄稿し、BBCラジオなどの出演もある。 Science Fictions あなたが知らない科学の真実 スタンフォード監獄実験はイカサマだった! 権威ある心理学研究の100件のうち、再現に成功したのはたったの39%!? 科学の信頼性を根底から揺るがす「再現性の危機」に迫る真実の書、日本上陸! 科学における不正・怠慢・バイアス・誇張が起きる仕組みを多数の実例とともに解説。既存の本で知ったウンチクを得意げに語る人に読ませたい、真実の書。 バックナンバー一覧 「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。 科学の「再現性の危機」をご存じだろうか。心理学、
『メタバースは終わった』… 一時の劇的なメタバースブームも一旦の落ち着きを見せ、各種メディアではそんなショッキングな見出しも目立つ2024年の昨今ですが、実際のメタバース人口はブームによりどのように変化したのでしょうか? また、そのうち日本人はどれくらいの割合を占めるのでしょうか? ユーザーの性別や年齢構成はどうなっているのでしょうか? 本記事では、メタバースの革命性を論じた著書『メタバース進化論(技術評論社)』で「ITエンジニア本大賞2023(翔泳社)」を受賞し、MoguLive VTuber Award 2023「今年最も輝いたVTuber」にも選出された筆者「バーチャル美少女ねむ」が各種統計データを元に徹底解説します。約5,500字、書き下ろしです! 文/バーチャル美少女ねむ 2024年元日、VRChatの同時アクセスが「10万人」を突破メタバースの定義については識者からさまざまなも
書いた本人たけど、こないた財務省が統計を出してて(なんで厚労省じゃなく財務省かっていうと、「おい厚労省社会保障費足りないとかぶっ殺すぞ。年金も障害者福祉も医療保険も介護保険も全部全部無茶苦茶だろ」って会議体の資料だから)、こういう福祉がどんだけ受けられるかは自治体差がすごいらしい。 障害者福祉関連のサービスの利用額や給付金の人口あたりの額を都道府県別に並べると、東京都はかなり下位。 障害者手帳や療育手帳の人口あたりの発行枚数も 生活保護の新規認定数についても同じ。 ざっくり3倍くらい認定されやすさが違う。 東京はいろんな制度があっていいなと羨む声もあるけど、実態からすると、東京は障害者にもひとり親世帯にも生活困窮世帯にも優しくない。 障害者と認定してくれないし、ひとり親だからって相当低収入じゃないと支援はないし、生活保護の認定はおりにくい。 あれだ、75歳以上は高額医療費の上限が5万くらい
文部科学省の統計によると、私の地元の大学進学率は近隣市の1/4〜1/2程度で10%台半ば。県下でも最低水準とのことで、それをもって子育てに向かないやら教育行政に問題があるやらと語る人がいる。 しかしながら、私の地元や近隣市は、人口面でも面積面でも小規模〜中規模程度だ。市境を一つや二つまたいだ程度でそこまで学力に差がつくわけがない。肌感覚的な面でも、中学の同級生で大学に進んだのが5人に1人未満とは思いづらい。 ということでSNS等で貼られていた画像をもとに、ソースと思われる文部科学省の学校基本調査「卒業後の状況調査票(高等学校 全日制・定時制) 市町村別状況別卒業者数」(以下「件の統計」)を確認した。数字は件の画像と一致しており、確かに私の地元の大学進学率は低い数字であった。 ところが、よく見ると分母に当たる高校卒業者の数が、市内の中学3年生の人数の1/3程度しかない。年によって学年の人数に
気象庁は観測結果をもとに、各地点について「〇〇年に一度の降水量」を算出し、発表しています。 ある期間内に1回起こると考えられる降水量のことを確率降水量といいます。気象庁の解説ページでは、確率降水量の推定方法が解説されていますので、これに基づいて「〇〇年に一度の大雨」の値を計算してみたいと思います。 大まかには次のような流れになっています。 年最大日降水量のヒストグラムを作成する 分布関数を当てはめる 分布関数の当てはまり具合を確認する 当てはめた分布関数から確率降水量を算出する 今回は、上記3. をとばして、4.の「当てはめた分布関数から確率降水量を算出する」を実際にやってみましょう! 再現年と確率降水量 気象庁の解説ページにもあるように、再現年 $T$ は $$ T = \frac{1}{1 – F(x; \theta)} $$ で与えられます。ここで、$F(x; \theta)$ は確
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く