うわっ…scikit-learn…むずすぎ！？

模擬試験は82.5点。scikit-learn以外は間違えなかった。

前回の記事で言及していた「最新のscikit-learnを使用していると写経コードでエラーになる」ですが

すでに書いてくださっている方がいた。ありがたい。

今日は欠損値の補完とカテゴリ変数のエンコーディングを学習しました。

何を言っているのかさっぱりわかりませんが私もさっぱりわかっていません。（？

おおざっぱにscikit-learnは

②インスタンス作って必要な値を内部メモリに確保する（fit）

③確保した必要な値をデータフレームに適用する(transform)

みたいな感じなのですが、、理解があっているか不明。

＜ここも参考にした＞

何が難しいってやっていることは単純なのですが

scikit-learnが馴染みがなさすぎるのと

載っているコードが古くて頑張って変換して読み取らないとだめなところですね、、

うーん。

今やっていることは結構データ分析の一個一個の作業なのですが

これを「完全にわかった」になったときは何らかのデータを与えられたときに

欠損値除去してカテゴリ変数エンコーディングしてデータフレームを加工して

matplotlbで表示、、とか出来るようになるんですかね。全然自信ないです。

とりあえず少しずつ学んでいきます。

私は迷いの中にいる