Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ モデル | モデリング
Pythonによる機械学習入門

bookモデル

メニューを表示するにはスワイプしてください

データの前処理とパイプライン構築の基本がカバーされました。次のステップはモデリングです。

Scikit-learnにおけるモデルは、.predict()および.score()メソッドを提供する**推定器(estimator)**であり、すべての推定器から継承された.fit()も備えています。

.fit()

データの前処理が完了し、モデルに渡す準備ができたら、モデル構築の最初のステップはモデルの学習です。これは.fit(X, y)を使用して行います。

Note
注意

教師あり学習(回帰、分類)の場合、.fit() には Xy の両方が必要。 教師なし学習(例:クラスタリング)の場合は、.fit(X) のみを呼び出す。y を渡してもエラーにはならず、単に無視される。

トレーニング中、モデルは予測に必要なパターンを学習。学習内容やトレーニング時間はアルゴリズムによって異なる。トレーニングは特に大規模データセットでは最も時間がかかる部分

.predict()

トレーニング後、.predict() を使用して予測を生成:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() は、通常 テストセット 上で訓練済みモデルを評価するメソッド。

model.fit(X, y)
model.score(X_test, y_test)

予測値と正解ラベルを比較する。デフォルトでは、分類問題の場合は 正解率(accuracy) が評価指標となる。

Note
ノート

X_test は、モデルの性能を訓練後に評価するために使用されるデータセットのサブセット(テストセット)を指す。これは 特徴量(入力データ)を含む。y_testX_test に対応する 正解ラベル のサブセット。これらを用いて、モデルが未知のデータをどれだけ正確に予測できるかを評価する。

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 4.  1

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 4.  1
some-alt