大学の授業では、先月報告したMLDP(Machine Learning for Developers)の課題を完成させました。

Kaggleからある商店の情報(商品が売れた日時、店舗のサイズ、気温等)を取得し、課題用のデータセットとして使用しました。

今回MLDPの課題は種類こそ違いますが、機械学習なので、私の研究分野にも類似する点が多く、今後の研究展開への参考となる部分が多かったです。

特に参考となったのがデータ分析の手順です。
以前までの私なら、データ分析は簡単に済ませてしまい、すぐに機械学習のパートに移っていたと思います。しかし、今回の課題で分析パートの重要性を実感しました。正確に分析、整理されたデータを使った機械学習とそうでない学習には、学習結果に大きな差が生まれてしまいます。
なので、より優れたモデルを作成するなら、機械学習パートより分析パートの時間を多くとることが重要だと学びました。

 

20230921121254401968c2710[1]

画像:学校の課題で行った機械学習(Linear Regression)

 

20230921121301625cf29eb11[1]

画像:学校の課題で行った機械学習(Random Forest)