模擬試験は82.5点。scikit-learn以外は間違えなかった。
前回の記事で言及していた「最新のscikit-learnを使用していると写経コードでエラーになる」ですが
写経中に遭遇したscikit-learnのワーニングに対応してみた - Qiita
すでに書いてくださっている方がいた。ありがたい。
今日は欠損値の補完とカテゴリ変数のエンコーディングを学習しました。
何を言っているのかさっぱりわかりませんが私もさっぱりわかっていません。(?
おおざっぱにscikit-learnは
①インスタンス作る
②インスタンス作って必要な値を内部メモリに確保する(fit)
③確保した必要な値をデータフレームに適用する(transform)
みたいな感じなのですが、、理解があっているか不明。
<ここも参考にした>
scikit-learn の fit() / transform() / fit_transform() - Qiita
何が難しいってやっていることは単純なのですが
scikit-learnが馴染みがなさすぎるのと
載っているコードが古くて頑張って変換して読み取らないとだめなところですね、、
うーん。
今やっていることは結構データ分析の一個一個の作業なのですが
これを「完全にわかった」になったときは何らかのデータを与えられたときに
欠損値除去してカテゴリ変数エンコーディングしてデータフレームを加工して
matplotlbで表示、、とか出来るようになるんですかね。全然自信ないです。
とりあえず少しずつ学んでいきます。