セクション 2. 章 8
single
チャレンジ:カテゴリカル変数のエンコーディング
メニューを表示するにはスワイプしてください
前の3章をまとめると、どのエンコーダを使用すべきかを示す表は次のとおりです。
このチャレンジでは、penguins dataset(欠損値なし)を使用。すべてのカテゴリ特徴量(ターゲットの 'species' を含む)は、機械学習用にエンコードが必要。
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
'island'と'sex'はカテゴリカルな特徴量、'species'はカテゴリカルなターゲットであることに注意。
タスク
スワイプしてコーディングを開始
DataFrame の df が与えられています。すべてのカテゴリカルカラムをエンコードしてください。
OneHotEncoderからLabelEncoderとsklearn.preprocessingをインポート。- データを
X(特徴量)とy(ターゲット)に分割。 OneHotEncoderを作成し、'island'の'sex'とXカラムに適用。- 元のカラムをエンコード済みのバージョンで置き換え。
LabelEncoderを使用して'species'のyカラムをエンコード。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 2. 章 8
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください