はじめに なぜ、あとからサンプルを布置できると嬉しいのか? ドキュメントにそって インストール データの概要 訓練とテストに分割 訓練データで空間を学習 この潜在空間で学習 テストデータの潜在空間への布置 テストデータへの汎化性能 まとめ はじめに UMAPという新しい可視化の手法が開発された。 github.com 私的に、この手法の利点は大きく2つあると考えている。 t-SNEよりも高速でありながらt-SNEと同じような可視化の結果が得られる。 t-SNEと違って、学習済みの空間に、あとから新規のサンプルを布置できる。 特に、2番目について言及している。ブログ記事は日本語では見つからなかった。ので、2番目の強みの紹介がこのブログの目的である。 他にもパラメーターについてまとめている記事や qiita.com UMAPのgithubのREADMEの翻訳をしている記事が見つかったのでぜひ。