Svep för att visa menyn

Vi ska titta på arbetsflödet du skulle följa för att bygga ett framgångsrikt maskininlärningsprojekt.

Steg 1. Hämta data

Definiera problemet, välj en prestationsmetrik och bestäm vad som kvalificerar som ett bra resultat. Samla sedan in nödvändig data från tillgängliga källor och omvandla den till ett format som är redo för Python. Om datan redan finns i en CSV-fil kan förbehandlingen börja omedelbart.

Exempel

Ett sjukhus sammanställer patientjournaler och demografiska uppgifter i en CSV-fil. Målet är att förutsäga återinläggningar, med målsättningen att uppnå över 80 % noggrannhet.

Steg 2. Förbehandla data

Detta steg inkluderar:

Datastädning: hantering av saknade värden och icke-numeriska indata;
EDA: analys och visualisering av data för att förstå samband och upptäcka problem;
Feature engineering: val eller skapande av egenskaper som förbättrar modellens prestanda.

Exempel

Saknade värden (t.ex. blodtryck) fylls i och kategoriska egenskaper (t.ex. ras) omvandlas till numerisk form.

Steg 3. Modellering

Detta steg inkluderar:

Val av modell baserat på problemtyp och experiment;
Justering av hyperparametrar för att förbättra prestanda;
Utvärdering av modell på osedda data.

Läs mer

Hyperparametrar är justerbara kontroller som definierar hur modellen tränas—såsom träningslängd eller modellkomplexitet.

Exempel

En klassificeringsmodell väljs för att förutsäga återinläggning (ja/nej). Efter justering utvärderas den på en validerings-/testuppsättning för att bedöma generalisering.

Steg 4. Driftsättning

När en modell presterar bra driftsätts den i verkliga system. Modellen måste övervakas, uppdateras med ny data och förbättras över tid, vilket ofta innebär att cykeln startar om från Steg 1.

Exempel

Modellen integreras i sjukhussystemet för att markera högriskpatienter vid inläggning, vilket hjälper personalen att agera tidigt.

Notering

Vissa av de termer som nämns här kan låta obekanta, men vi kommer att gå igenom dem mer ingående senare i kursen.

Datapreprocessering och modellering kan utföras med scikit-learn. De kommande kapitlen introducerar preprocesseringsarbetsflöden och pipelines, följt av modellering med k-närmaste grannar (KNeighborsClassifier), inklusive träning, justering och utvärdering.

1. Vad är det primära syftet med steget "Hämta data" i ett maskininlärningsprojekt?

2. Vilket av följande beskriver bäst vikten av steget "Datapreprocessering" i ett arbetsflöde för maskininlärningsprojekt?

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 5

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Arbetsflöde för maskininlärning

Vi ska titta på arbetsflödet du skulle följa för att bygga ett framgångsrikt maskininlärningsprojekt.

Steg 1. Hämta data

Exempel

Ett sjukhus sammanställer patientjournaler och demografiska uppgifter i en CSV-fil. Målet är att förutsäga återinläggningar, med målsättningen att uppnå över 80 % noggrannhet.

Steg 2. Förbehandla data

Detta steg inkluderar:

Datastädning: hantering av saknade värden och icke-numeriska indata;
EDA: analys och visualisering av data för att förstå samband och upptäcka problem;
Feature engineering: val eller skapande av egenskaper som förbättrar modellens prestanda.

Exempel

Saknade värden (t.ex. blodtryck) fylls i och kategoriska egenskaper (t.ex. ras) omvandlas till numerisk form.

Steg 3. Modellering

Detta steg inkluderar:

Val av modell baserat på problemtyp och experiment;
Justering av hyperparametrar för att förbättra prestanda;
Utvärdering av modell på osedda data.

Läs mer

Hyperparametrar är justerbara kontroller som definierar hur modellen tränas—såsom träningslängd eller modellkomplexitet.

Exempel

En klassificeringsmodell väljs för att förutsäga återinläggning (ja/nej). Efter justering utvärderas den på en validerings-/testuppsättning för att bedöma generalisering.

Steg 4. Driftsättning

Exempel

Modellen integreras i sjukhussystemet för att markera högriskpatienter vid inläggning, vilket hjälper personalen att agera tidigt.

Notering

Vissa av de termer som nämns här kan låta obekanta, men vi kommer att gå igenom dem mer ingående senare i kursen.

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 5