Пакети
Пакети у обробці даних
Під час навчання моделі машинного навчання зазвичай дані подаються невеликими частинами, а не всі одразу. Ці частини називаються «пакетами». Замість того, щоб подавати моделі один елемент даних (наприклад, одне зображення чи одне речення), ми можемо подавати пакет із, наприклад, 32 елементів одночасно. Такий підхід робить навчання стабільнішим і швидшим.
Щодо тензорів, це означає додавання додаткового виміру на початку. Тобто, якщо дані одного елемента представлені тензором форми (height, width), то пакет таких елементів матиме форму (batch_size, height, width). У цьому прикладі, якщо розмір пакета — 32, то форма стає (32, height, width).
Припустимо, у нас є 2048 зразків даних, кожен із формою (base shape). Це дає тензор розміром (2048, base shape). Якщо розбити ці дані на пакети по 32 зразки, отримаємо 64 пакети, оскільки 64 * 32 = 2048. Нова форма буде (64, 32, base shape).
Під час проєктування власної нейронної мережі чи іншої моделі можна використовувати різні форми для зазначених вище завдань. Однак ці підходи до формування є стандартними у Tensorflow, оскільки вони структуровані як логічно, так і ієрархічно для оптимізації продуктивності алгоритмів навчання.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain why using batches makes training more stable and faster?
How do I choose the right batch size for my model?
What does the "base shape" refer to in this context?
Awesome!
Completion rate improved to 5.56
Пакети
Свайпніть щоб показати меню
Пакети у обробці даних
Під час навчання моделі машинного навчання зазвичай дані подаються невеликими частинами, а не всі одразу. Ці частини називаються «пакетами». Замість того, щоб подавати моделі один елемент даних (наприклад, одне зображення чи одне речення), ми можемо подавати пакет із, наприклад, 32 елементів одночасно. Такий підхід робить навчання стабільнішим і швидшим.
Щодо тензорів, це означає додавання додаткового виміру на початку. Тобто, якщо дані одного елемента представлені тензором форми (height, width), то пакет таких елементів матиме форму (batch_size, height, width). У цьому прикладі, якщо розмір пакета — 32, то форма стає (32, height, width).
Припустимо, у нас є 2048 зразків даних, кожен із формою (base shape). Це дає тензор розміром (2048, base shape). Якщо розбити ці дані на пакети по 32 зразки, отримаємо 64 пакети, оскільки 64 * 32 = 2048. Нова форма буде (64, 32, base shape).
Під час проєктування власної нейронної мережі чи іншої моделі можна використовувати різні форми для зазначених вище завдань. Однак ці підходи до формування є стандартними у Tensorflow, оскільки вони структуровані як логічно, так і ієрархічно для оптимізації продуктивності алгоритмів навчання.
Дякуємо за ваш відгук!