私は迷いの中にいる

毎日眠気しかない謎の深海魚の一言日記

うわっ…scikit-learn…むずすぎ!?

Python

模擬試験は82.5点。scikit-learn以外は間違えなかった。

 

前回の記事で言及していた「最新のscikit-learnを使用していると写経コードでエラーになる」ですが

写経中に遭遇したscikit-learnのワーニングに対応してみた - Qiita

すでに書いてくださっている方がいた。ありがたい。

 

今日は欠損値の補完とカテゴリ変数のエンコーディングを学習しました。

何を言っているのかさっぱりわかりませんが私もさっぱりわかっていません。(?

 

おおざっぱにscikit-learnは

インスタンス作る

インスタンス作って必要な値を内部メモリに確保する(fit)

③確保した必要な値をデータフレームに適用する(transform)

みたいな感じなのですが、、理解があっているか不明。

 

<ここも参考にした>

scikit-learn の fit() / transform() / fit_transform() - Qiita

 

何が難しいってやっていることは単純なのですが

scikit-learnが馴染みがなさすぎるのと

載っているコードが古くて頑張って変換して読み取らないとだめなところですね、、

うーん。

 

今やっていることは結構データ分析の一個一個の作業なのですが

これを「完全にわかった」になったときは何らかのデータを与えられたときに

欠損値除去してカテゴリ変数エンコーディングしてデータフレームを加工して

matplotlbで表示、、とか出来るようになるんですかね。全然自信ないです。

とりあえず少しずつ学んでいきます。