Kursinhalt
Einführung in TensorFlow
Einführung in TensorFlow
Batches
Batches in der Datenverarbeitung
Beim Training eines maschinellen Lernmodells ist es üblich, die Daten in kleinen Stücken zuzuführen, anstatt alles auf einmal. Diese Stücke werden "Batches" genannt. Anstatt einem Modell ein einzelnes Datenobjekt zu zeigen (wie ein Bild oder einen Satz), geben wir ihm möglicherweise einen Batch von beispielsweise 32
Objekten zusammen. Dieser Ansatz kann das Training stabiler und schneller machen.
Wenn man an Tensors denkt, bedeutet dies, dass eine zusätzliche Dimension am Anfang hinzugefügt wird. Wenn die Daten eines einzelnen Objekts durch einen Tensor der Form (height, width)
dargestellt wurden, hätte ein Batch dieser Objekte die Form (batch_size, height, width)
. In diesem Beispiel, wenn die Batch-Größe 32
ist, wird die Form (32, height, width)
.
Angenommen, wir haben 2048
Datenproben, jede mit einer Form von (base shape)
. Dies ergibt einen Tensor von (2048, base shape)
. Wenn wir diese Daten in Batches von 32
Proben aufteilen, erhalten wir 64
Batches, da 64 * 32 = 2048
. Und die neue Form wird (64, 32, base shape)
.
Beim Entwerfen Ihres eigenen neuronalen Netzwerks oder eines anderen Modells können Sie unterschiedliche Formen für die oben genannten Aufgaben verwenden. Diese Formgebungstechniken sind jedoch in Tensorflow Standard, da sie sowohl logisch als auch hierarchisch strukturiert sind, um die Leistung von Lernalgorithmen zu optimieren.
Danke für Ihr Feedback!