Conteúdo do Curso

Fundamentos de Visão Computacional

1. Introdução à Visão Computacional

O Que É Visão Computacional?Fundamentos do Processamento de Imagens Álgebra Linear para Manipulação de Imagens

2. Processamento de Imagens com OpenCV

Transformações Básicas Transformada de Fourier Filtros Passa-Baixa e Passa-Alta Redução de Ruído e Suavização Equalização de Histograma Técnicas de Super-Resolução Detecção de Bordas Detecção de Cantos e Blobs

3. Redes Neurais Convolucionais

Introdução às Redes Neurais Convolucionais Camadas de Convolução Camadas de Pooling Achatamento Funções de Ativação Visão Geral dos Principais Modelos de CNN Desafio: Construindo uma CNN

4. Detecção de Objetos

Localização de Objetos Detecção de Objetos Previsões de Caixas Delimitadoras Interseção Sobre União (IoU) e Métricas de Avaliação Supressão Não Máxima (NMS)Caixas Âncora Visão Geral do Modelo YOLO Desafio: Detecção de Objetos com Modelo Personalizado e YOLO

5. Visão Geral de Tópicos Avançados

Aprendizado por Transferência em Visão Computacional Visão Geral do Reconhecimento Facial Visão Geral da Geração de Imagens

Introdução às Redes Neurais Convolucionais

O que é uma CNN e por que ela é diferente das redes neurais tradicionais?

Uma rede neural convolucional (CNN) é um tipo de inteligência artificial que permite que computadores "enxerguem" e compreendam imagens. Diferente das redes neurais comuns, que processam imagens como uma lista de números, as CNNs analisam imagens em seções, reconhecendo padrões como bordas, formas e texturas. Isso as torna muito mais eficientes no processamento de fotos e vídeos.

Como as CNNs são inspiradas pelo olho humano

As CNNs funcionam de maneira semelhante à forma como o cérebro humano processa imagens. Quando olhamos para algo, nossos olhos enviam informações ao cérebro, que primeiro reconhece formas simples como bordas e cores. Em seguida, camadas mais profundas do cérebro combinam essas informações para identificar objetos, rostos ou cenas completas. As CNNs seguem essa mesma lógica, começando por características simples e evoluindo para reconhecer objetos complexos.

Assim como nossos olhos focam em áreas específicas, as CNNs também processam imagens em pequenas seções, o que as ajuda a identificar padrões independentemente de onde estejam. No entanto, ao contrário dos humanos, as CNNs precisam de milhares de imagens rotuladas para aprender, enquanto as pessoas conseguem reconhecer objetos mesmo tendo visto poucas vezes.

Visão geral dos principais componentes: convolução, pooling, ativação e camadas totalmente conectadas

Uma CNN é composta por várias camadas, cada uma desempenhando um papel distinto no processamento de imagens:

CNNs são poderosas porque podem aprender automaticamente características a partir de imagens, sem a necessidade de que humanos programem cada detalhe. Por isso, são utilizadas em carros autônomos, reconhecimento facial, imagens médicas e muitas outras aplicações do mundo real.