Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Datentypen | Konzepte des Maschinellen Lernens
ML-Einführung Mit Scikit-Learn

bookDatentypen

Jede Spalte (Feature) in einem Trainingsdatensatz besitzt einen zugehörigen Datentyp. Diese Datentypen lassen sich in numerisch, kategorisch sowie Datum und/oder Zeit gruppieren.

Die meisten ML-Algorithmen funktionieren nur mit numerischen Daten gut, daher müssen kategoriale und Datums-/Zeitwerte in Zahlen umgewandelt werden.

Für Datum und Zeit können Merkmale wie 'year', 'month' und ähnliche extrahiert werden, abhängig von der Aufgabenstellung. Diese sind bereits numerische Werte und können daher direkt verwendet werden.

Mit kategorialen Daten ist die Verarbeitung etwas anspruchsvoller.

Arten von kategorialen Daten

Kategoriale Daten werden in zwei Typen unterteilt:

  • Ordinale Daten sind eine Art von kategorialen Daten, bei denen die Kategorien einer natürlichen Reihenfolge folgen. Zum Beispiel Bildungsniveau (von Grundschule bis Promotion) oder Bewertungen (von sehr schlecht bis sehr gut) usw.;

  • Nominale Daten sind eine Art von kategorialen Daten, bei denen keine natürliche Reihenfolge vorliegt. Zum Beispiel Name, Geschlecht, Herkunftsland usw.

Die Umwandlung von ordinalen und nominalen Datentypen in numerische Werte erfordert unterschiedliche Ansätze, daher müssen sie getrennt behandelt werden.

Note
Mehr erfahren

Es gibt bessere Methoden, um Datumsangaben in numerische Werte umzuwandeln, die jedoch den Rahmen dieses Einführungskurses sprengen. Wenn beispielsweise nur das Merkmal 'month' verwendet wird, wird nicht berücksichtigt, dass der 12. Monat tatsächlich näher am 1. als am 9. liegt.

question-icon

Ordnen Sie das Merkmal und seinen Datentyp zu.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain how to convert ordinal data into numerical values?

What are the common methods for encoding nominal data?

Why do machine learning algorithms require numerical data?

Awesome!

Completion rate improved to 3.13

bookDatentypen

Swipe um das Menü anzuzeigen

Jede Spalte (Feature) in einem Trainingsdatensatz besitzt einen zugehörigen Datentyp. Diese Datentypen lassen sich in numerisch, kategorisch sowie Datum und/oder Zeit gruppieren.

Die meisten ML-Algorithmen funktionieren nur mit numerischen Daten gut, daher müssen kategoriale und Datums-/Zeitwerte in Zahlen umgewandelt werden.

Für Datum und Zeit können Merkmale wie 'year', 'month' und ähnliche extrahiert werden, abhängig von der Aufgabenstellung. Diese sind bereits numerische Werte und können daher direkt verwendet werden.

Mit kategorialen Daten ist die Verarbeitung etwas anspruchsvoller.

Arten von kategorialen Daten

Kategoriale Daten werden in zwei Typen unterteilt:

  • Ordinale Daten sind eine Art von kategorialen Daten, bei denen die Kategorien einer natürlichen Reihenfolge folgen. Zum Beispiel Bildungsniveau (von Grundschule bis Promotion) oder Bewertungen (von sehr schlecht bis sehr gut) usw.;

  • Nominale Daten sind eine Art von kategorialen Daten, bei denen keine natürliche Reihenfolge vorliegt. Zum Beispiel Name, Geschlecht, Herkunftsland usw.

Die Umwandlung von ordinalen und nominalen Datentypen in numerische Werte erfordert unterschiedliche Ansätze, daher müssen sie getrennt behandelt werden.

Note
Mehr erfahren

Es gibt bessere Methoden, um Datumsangaben in numerische Werte umzuwandeln, die jedoch den Rahmen dieses Einführungskurses sprengen. Wenn beispielsweise nur das Merkmal 'month' verwendet wird, wird nicht berücksichtigt, dass der 12. Monat tatsächlich näher am 1. als am 9. liegt.

question-icon

Ordnen Sie das Merkmal und seinen Datentyp zu.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4
some-alt