Visão Geral de uma Rede Neural Básica

Agora você chegou a um estágio em que possui o conhecimento essencial de TensorFlow para criar redes neurais por conta própria. Embora a maioria das redes neurais do mundo real seja complexa e normalmente construída usando bibliotecas de alto nível como Keras, construiremos uma rede básica utilizando ferramentas fundamentais do TensorFlow. Essa abordagem proporciona experiência prática com manipulação de tensores em baixo nível, auxiliando na compreensão dos processos subjacentes.

Em cursos anteriores como Introdução às Redes Neurais, você deve se lembrar do tempo e esforço necessários para construir até mesmo uma rede neural simples, tratando cada neurônio individualmente.

O TensorFlow simplifica significativamente esse processo. Ao utilizar tensores, é possível encapsular cálculos complexos, reduzindo a necessidade de codificação detalhada. Nossa principal tarefa é configurar um pipeline sequencial de operações com tensores.

Segue um breve resumo das etapas para iniciar o processo de treinamento de uma rede neural:

Preparação dos Dados e Criação do Modelo

A fase inicial do treinamento de uma rede neural envolve a preparação dos dados, abrangendo tanto os inputs quanto os outputs que a rede irá aprender. Além disso, os hiperparâmetros do modelo são definidos – estes são os parâmetros que permanecem constantes durante todo o processo de treinamento. Os pesos são inicializados, normalmente extraídos de uma distribuição normal, e os biases, que geralmente são definidos como zero.

Propagação Direta

Na propagação direta, cada camada da rede normalmente segue estes passos:

Multiplicação da entrada da camada pelos seus pesos.
Adição de um viés ao resultado.
Aplicação de uma função de ativação a essa soma.

Em seguida, o erro (loss) pode ser calculado.

Propagação Reversa

O próximo passo é a propagação reversa, onde ajustam-se os pesos e vieses com base em sua influência sobre o erro. Essa influência é representada pelo gradiente, que o Gradient Tape do TensorFlow calcula automaticamente. Os pesos e vieses são atualizados subtraindo o gradiente, escalado pela taxa de aprendizado.

Loop de Treinamento

Para treinar a rede neural de forma eficaz, os passos de treinamento são repetidos várias vezes enquanto se acompanha o desempenho do modelo. Idealmente, a perda deve diminuir ao longo das épocas.

Tarefa

Swipe to start coding

Crie uma rede neural projetada para prever os resultados da operação XOR. A rede deve consistir em 2 neurônios de entrada, uma camada oculta com 2 neurônios e 1 neurônio de saída.

Comece configurando os pesos e vieses iniciais. Os pesos devem ser inicializados usando uma distribuição normal, e todos os vieses devem ser inicializados em zero. Utilize os hiperparâmetros input_size, hidden_size e output_size para definir os formatos adequados desses tensores.
Utilize um decorador de função para transformar a função train_step() em um grafo do TensorFlow.
Realize a propagação direta pelas camadas oculta e de saída da rede. Utilize a função de ativação sigmoide.
Determine os gradientes para entender como cada peso e viés impacta a perda. Certifique-se de que os gradientes sejam calculados na ordem correta, correspondente aos nomes das variáveis de saída.
Modifique os pesos e vieses com base em seus respectivos gradientes. Incorpore o learning_rate nesse processo de ajuste para controlar a intensidade de cada atualização.

Solução

Conclusão

Como a função XOR é uma tarefa relativamente simples, não precisamos de técnicas avançadas como ajuste de hiperparâmetros, divisão de conjuntos de dados ou construção de pipelines de dados complexos neste estágio. Este exercício é apenas um passo em direção à construção de redes neurais mais sofisticadas para aplicações do mundo real.

Dominar esses conceitos básicos é fundamental antes de avançar para técnicas de construção de redes neurais mais avançadas nos próximos cursos, onde utilizaremos a biblioteca Keras e exploraremos métodos para aprimorar a qualidade do modelo com os recursos avançados do TensorFlow.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4

single

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Deslize para mostrar o menu

Visão Geral de uma Rede Neural Básica

Segue um breve resumo das etapas para iniciar o processo de treinamento de uma rede neural:

Preparação dos Dados e Criação do Modelo

Propagação Direta

Na propagação direta, cada camada da rede normalmente segue estes passos:

Multiplicação da entrada da camada pelos seus pesos.
Adição de um viés ao resultado.
Aplicação de uma função de ativação a essa soma.

Em seguida, o erro (loss) pode ser calculado.

Propagação Reversa

Loop de Treinamento

Tarefa

Swipe to start coding

Crie uma rede neural projetada para prever os resultados da operação XOR. A rede deve consistir em 2 neurônios de entrada, uma camada oculta com 2 neurônios e 1 neurônio de saída.

Comece configurando os pesos e vieses iniciais. Os pesos devem ser inicializados usando uma distribuição normal, e todos os vieses devem ser inicializados em zero. Utilize os hiperparâmetros input_size, hidden_size e output_size para definir os formatos adequados desses tensores.
Utilize um decorador de função para transformar a função train_step() em um grafo do TensorFlow.
Realize a propagação direta pelas camadas oculta e de saída da rede. Utilize a função de ativação sigmoide.
Determine os gradientes para entender como cada peso e viés impacta a perda. Certifique-se de que os gradientes sejam calculados na ordem correta, correspondente aos nomes das variáveis de saída.
Modifique os pesos e vieses com base em seus respectivos gradientes. Incorpore o learning_rate nesse processo de ajuste para controlar a intensidade de cada atualização.

Solução

Conclusão

Mude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4

single

Implementação de Rede Neural

Visão Geral de uma Rede Neural Básica

Preparação dos Dados e Criação do Modelo

Propagação Direta

Propagação Reversa

Loop de Treinamento

Solução

Conclusão

Implementação de Rede Neural

Visão Geral de uma Rede Neural Básica

Preparação dos Dados e Criação do Modelo

Propagação Direta

Propagação Reversa

Loop de Treinamento

Solução

Conclusão