こちらの記事をご覧いただきありがとうございます。 以前SUUMOの物件データをスクレイピングした記事を投稿しました。今回はスクレイピングしたデータから見つかった、入力ミスと思われる変なデータをご紹介します。 スクレイピングした記事 ↓でスクレイピングしたデータから見つかった変なデータを紹介します。 前置き:SUUMOに批判的な意見を主張したいわけではありません。 やっていること自体は人の揚げ足取りと思われて致し方ないことですが、決して批判的な意見を言いたいわけではありません。 機械学習をするうえで、イレギュラーなデータを見つけることは分析精度を上げることにつながります。 てかむしろSUUMO凄くない? と思います。どう見ても入力ミスだよな…?と思う場面はそんなにありませんでした。 人は誰しも細かいミスをしてしまうものだと思いますし、自分も毎日ミスだらけです。スペルミスのエラーとか1分に1回