LightGBMとearly_stopping LightGBMは2022年現在、回帰問題において最も広く用いられている学習器の一つであり、機械学習を学ぶ上で避けては通れない手法と言えます。 LightGBMの一機能であるearly_stoppingは学習を効率化できる(詳細は後述)人気機能ですが、この度使用方法に大きな変更があったようなので、内容を記事にまとめたいと思います 変更の概要 early_stoppingを使用するためには、元来は学習実行メソッド(train()またはfit())にearly_stopping_rounds引数を指定していましたが、2021年の年末(こちらのissues)よりこの指定法は非推奨となり、コールバック関数lightgbm.early_stopping()で指定する方式へと変更になりました。 新たな方式であるコールバック関数によるearly_stopp
上記の方々の推奨本 2票(naotaka1128、カレーちゃん)[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear) 1票(naotaka1128)PythonとKerasによるディープラーニング 1票(naotaka1128)scikit-learnとTensorFlowによる実践機械学習 1票(mlm_kansai)機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン) 記事の概要 Kaggle参戦記 〜入門からExpert獲得までの半年間の記録 & お役立ち資料まとめ〜 *1) 特徴量エンジニアリング 次元削減系 LDA、PCA、tSNE Kaggle TalkingData Fraud Detection コンペの解法まとめ(基本編) 「カテゴリー変数を組み合わ
時系列データ関連のお勉強をしたときに、必ず登場する厄介な概念の1つが「定常性(Stationarity)」です。 定常性(Stationarity)は、時系列データの統計的な特性(平均、分散、自己相関など)が時間によらず一定であるという性質を指します。これは、時系列分析において重要な前提条件となる場合が多いです。 具体的には、定常性には以下のような特性があります。 平均が時間によらず一定: これはデータの「中心」が時間とともに変化しないことを意味します。つまり、ある時点での平均値が別の時点での平均値と同じであることを示します。 分散が時間によらず一定: これはデータの「ばらつき」が時間とともに変化しないことを意味します。つまり、ある時点での分散が別の時点での分散と同じであることを示します。 自己共分散(または自己相関)が時間によらず一定: これは2つの時点間の関連性がラグにのみ依存し、時間
この記事では、商用利用でき漢字も使える日本語フリーフォントを、まとめてご紹介します。 「日本語フリーフォントが増えすぎて、どれを使うか迷ってしまう」、というひとも多いでしょう。 定番アイテムから最近公開された新作フォントまで、「使える」日本語フリーフォントを一覧でまとめています。 コンテンツ目次 好きに選べる、好きなだけ使えるAdobe Fonts 明朝体(22書体) ゴシック体(35書体) 手書きフォント(26書体) 毛筆、行書体(16書体) ユニーク、その他の書体(61書体) 正しいフォント選びのこつとポイント 歴代ベストフリーフォント一覧 商用でも利用できる日本語フリーフォントを集めていますが、用条件やライセンスが変更されることもあるので、利用する前に確認しておきましょう。 好きに選べる、好きなだけ使えるAdobe Fonts 「日本語フォントをまとめてダウンロードしたい」 「できる
<日本でもアメリカでも、ネットを介した短いコミュニケーションで関係性を悪化させないための知恵が必要に> 日本の若者がLINEなどのメッセージで「句点(。)」を一切使わないということが、話題になっています。句点無しの短い文章を区切りながら繰り出すことで、リアルタイムのコミュニケーションを取るためのようです。それが完全に定着する中で、句点を使うことが「威圧感、怒りの感情」の表現として受け取られるようにもなっているようです。 若い人たちに指摘されて気付いたのですが、実はこれはアメリカでも全く同じです。短いメッセージをどんどん繰り出してリアルタイムの交信をする場合には、ピリオド(フル・ストップとも言います)を使いません。反対に、あえてピリオドで切るとそこには「納得していない」という拒絶や怒りのニュアンスが感じられるといいます。 英語の場合は、少しバリエーションがあり。二人称の you について、い
多くの論文や学会発表、大学院生が持ってくる解析結果で多変量回帰分析が使われていますが、結構間違って使ってるなー、と思うことが多いです。自分のところの大学院生が持ってきた内容だとその場で指摘できますし、少し前に学会でとても若い先生が指導してくれる人がいないと困っていたので、回帰分析の不備を伝えたところ、とても喜んでくれました。こう言う情報は意外と若い先生方に届いていなくて、自分のできる範囲で伝えられたらな、と思いました。 今回はよく見られる回帰分析の誤った使い方を修正するための、回帰分析について知っておくべき前提条件をまとめます。 どの回帰分析を使うかは従属変数次第 多変量回帰分析は1つの被説明変数(従属変数)と複数の説明変数(独立変数)を投入し、説明変数から被説明変数を導くための回帰式を作ります。多変量回帰分析には重回帰分析、ロジスティック回帰分析、Cox回帰分析と種類がありますが、どの回
Illustration by Matthew Cooley. Images in Illustration Warner Bros; Everett collection/ Lucasfilm LTD. Disney/PIXAR, Everett Collection, 2 Somewhere, in a galaxy far, far away, Georges Méliès never sends a bunch of folks on a trip to the moon. The adventures of space explorers and time travelers, androids and alien races don’t thrill a generation of kids chomping popcorn at Saturday matinees. The
音楽や映画など若者カルチャーを主に扱うアメリカの隔週雑誌「ローリング・ストーン」は、恒例企画として「史上最も偉大なシンガー200人」や「歴代最高の曲500曲」など、独自のランキングを発表しています。2024年1月1日には、ローリング・ストーンは「史上最高のサイエンス・フィクション(SF)映画ベスト150」として、科学技術や未来、管理社会などをテーマにした映画150本をランキング形式で紹介しています。 The 150 Best Sci-Fi Movies of All Time https://www.rollingstone.com/tv-movies/tv-movie-lists/best-sci-fi-movies-1234893930/tank-girl-1995-2-1234928496/ ローリング・ストーンはSF映画について、「もしSFが存在しなかったら、あるいは科学が研究とし
機械学習は現代社会において多くの分野で利用されています。 しかし、モデルの設定やハイパーパラメータの調整など、そのプロセスは非常に煩雑であり、多くの時間と専門知識が要求されます。そこで登場するのが「自動機械学習(AutoML)」です。 この記事では、AutoMLの中でも比較的人気のあるライブラリであるAuto-Sklearnを使って、誰でも簡単に機械学習モデルを構築できる方法を解説します。 基本的な使い方から応用例まで、Pythonの実行例付きでご紹介。機械学習に新しい風を吹き込むAuto-Sklearnで、あなたもデータ解析のプロになりましょう! はじめに なぜ自動機械学習(Auto ML)が必要なのか? 機械学習は今や多くの業界で応用されています。医療から金融、製造業まで、データを解析して有用な情報を引き出す力は計り知れません。 しかし、その一方で、機械学習モデルを設計、訓練、テストす
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く