Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ チャレンジ:カテゴリカル変数のエンコーディング | Scikit-learnによるデータの前処理
/
Pythonによる機械学習入門
セクション 2.  8
single

single

bookチャレンジ:カテゴリカル変数のエンコーディング

メニューを表示するにはスワイプしてください

前の3章をまとめると、どのエンコーダを使用すべきかを示す表は次のとおりです。

このチャレンジでは、penguins dataset(欠損値なし)を使用。すべてのカテゴリ特徴量(ターゲットの 'species' を含む)は、機械学習用にエンコードが必要。

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

'island''sex'はカテゴリカルな特徴量'species'はカテゴリカルなターゲットであることに注意。

タスク

スワイプしてコーディングを開始

DataFramedf が与えられています。すべてのカテゴリカルカラムをエンコードしてください。

  1. OneHotEncoder から LabelEncodersklearn.preprocessing をインポート。
  2. データを X(特徴量)と y(ターゲット)に分割。
  3. OneHotEncoder を作成し、'island''sex'X カラムに適用。
  4. 元のカラムをエンコード済みのバージョンで置き換え。
  5. LabelEncoder を使用して 'species'y カラムをエンコード。

解答

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 2.  8
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt