Conteúdo do Curso

Fundamentos de Visão Computacional

1. Introdução à Visão Computacional

O Que É Visão Computacional?Fundamentos do Processamento de Imagens Álgebra Linear para Manipulação de Imagens

2. Processamento de Imagens com OpenCV

Transformações Básicas Transformada de Fourier Filtros Passa-Baixa e Passa-Alta Redução de Ruído e Suavização Equalização de Histograma Técnicas de Super-Resolução Detecção de Bordas Detecção de Cantos e Blobs

3. Redes Neurais Convolucionais

Introdução às Redes Neurais Convolucionais Camadas de Convolução Camadas de Pooling Achatamento Funções de Ativação Visão Geral dos Principais Modelos de CNN Desafio: Construindo uma CNN

4. Detecção de Objetos

Localização de Objetos Detecção de Objetos Previsões de Caixas Delimitadoras Interseção Sobre União (IoU) e Métricas de Avaliação Supressão Não Máxima (NMS)Caixas Âncora Visão Geral do Modelo YOLO Desafio: Detecção de Objetos com Modelo Personalizado e YOLO

5. Visão Geral de Tópicos Avançados

Aprendizado por Transferência em Visão Computacional Visão Geral do Reconhecimento Facial Visão Geral da Geração de Imagens

Detecção de Objetos

Detecção de objetos é um avanço crucial em relação à classificação e localização de imagens. Enquanto a classificação determina qual objeto está presente em uma imagem e a localização identifica onde um único objeto está, a detecção de objetos expande isso ao reconhecer múltiplos objetos e suas localizações dentro de uma imagem.

O que Torna a Detecção de Objetos Diferente?

Ao contrário da classificação, que atribui um único rótulo para toda a imagem, a detecção de objetos envolve classificação e localização para múltiplos objetos. Um modelo de detecção deve prever caixas delimitadoras ao redor de cada objeto e classificá-los corretamente. Isso torna a detecção de objetos uma tarefa mais complexa e computacionalmente intensiva do que a simples classificação.

Abordagem de Janela Deslizante e Suas Limitações

Um método tradicional para detecção de objetos é a abordagem de janela deslizante, onde uma janela de tamanho fixo se move pela imagem para classificar cada seção. Embora seja conceitualmente simples, apresenta várias limitações:

Computacionalmente custosa: exige varredura da imagem em múltiplas escalas e posições, resultando em alto tempo de processamento;
Tamanhos de janela rígidos: os objetos variam em tamanho e proporção, tornando janelas de tamanho fixo ineficientes;
Cálculos redundantes: janelas sobrepostas processam repetidamente regiões semelhantes da imagem, desperdiçando recursos.

Devido a essas ineficiências, métodos de detecção de objetos baseados em aprendizado profundo substituíram em grande parte a abordagem de janela deslizante.

Métodos Baseados em Regiões: Selective Search & Redes de Proposta de Região (RPN)

Para melhorar a eficiência, métodos baseados em regiões propõem Regiões de Interesse (RoIs) em vez de escanear toda a imagem. Duas técnicas principais são:

Selective search: abordagem tradicional que agrupa pixels semelhantes em propostas de regiões, reduzindo o número de previsões de caixas delimitadoras. Embora mais eficiente que janelas deslizantes, ainda é lenta;
Redes de proposta de região (RPNs): utilizadas no Faster R-CNN, as RPNs usam uma rede neural para gerar regiões potenciais de objetos diretamente, melhorando significativamente a velocidade e a precisão em relação ao selective search.

Abordagens Iniciais Baseadas em Deep Learning

O deep learning revolucionou a detecção de objetos ao introduzir redes neurais convolucionais (CNNs) nos pipelines de detecção. Alguns dos modelos pioneiros incluem:

R-CNN (Regions with CNNs): este método aplica uma CNN a cada proposta de região gerada pelo selective search. Embora significativamente mais preciso que métodos tradicionais, é computacionalmente lento devido às avaliações repetidas da CNN;
Fast R-CNN: uma melhoria em relação ao R-CNN, este modelo processa toda a imagem com uma CNN primeiro e depois aplica o RoI pooling para extrair características para classificação, acelerando a detecção;
Faster R-CNN: introduz redes de proposta de região (RPNs) para substituir o selective search, tornando a detecção de objetos mais rápida e precisa ao integrar a geração de propostas de região na própria rede neural.

A detecção de objetos baseia-se em classificação e localização, permitindo que modelos reconheçam múltiplos objetos em uma imagem. Métodos tradicionais como janelas deslizantes foram substituídos por técnicas baseadas em regiões mais eficientes, como R-CNN e seus sucessores. O Faster R-CNN, com o uso de redes de proposta de região, representa um avanço significativo em direção à detecção de objetos em tempo real e com alta precisão. À medida que avançamos, técnicas mais modernas como YOLO e SSD irão aprimorar ainda mais a velocidade e a eficiência da detecção.

1. Qual é a principal vantagem do Faster R-CNN em relação ao Fast R-CNN?

2. Por que a abordagem de janela deslizante é ineficiente para detecção de objetos?

3. Qual das alternativas a seguir é um método de detecção de objetos baseado em deep learning?

Qual é a principal vantagem do Faster R-CNN em relação ao Fast R-CNN?

Select the correct answer

Faster R-CNN utiliza busca seletiva para propostas de regiões.

Faster R-CNN detecta apenas um objeto por imagem.

Faster R-CNN incorpora uma rede de propostas de regiões (RPN) para maior velocidade e precisão.

Faster R-CNN não utiliza CNNs.

Por que a abordagem de janela deslizante é ineficiente para detecção de objetos?

Select the correct answer

Processa cada região de forma independente, resultando em cálculos redundantes.

Funciona apenas com imagens em escala de cinza.

Não pode detectar objetos maiores que o tamanho da janela.

É utilizada apenas em aplicações em tempo real.

Qual das alternativas a seguir é um método de detecção de objetos baseado em deep learning?

Select the correct answer

ResNet

R-CNN

VGG

SVM

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 2

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Conteúdo do Curso

Fundamentos de Visão Computacional

1. Introdução à Visão Computacional

O Que É Visão Computacional?Fundamentos do Processamento de Imagens Álgebra Linear para Manipulação de Imagens

2. Processamento de Imagens com OpenCV

3. Redes Neurais Convolucionais

Introdução às Redes Neurais Convolucionais Camadas de Convolução Camadas de Pooling Achatamento Funções de Ativação Visão Geral dos Principais Modelos de CNN Desafio: Construindo uma CNN

4. Detecção de Objetos

5. Visão Geral de Tópicos Avançados

Aprendizado por Transferência em Visão Computacional Visão Geral do Reconhecimento Facial Visão Geral da Geração de Imagens

Detecção de Objetos

O que Torna a Detecção de Objetos Diferente?

Abordagem de Janela Deslizante e Suas Limitações

Computacionalmente custosa: exige varredura da imagem em múltiplas escalas e posições, resultando em alto tempo de processamento;
Tamanhos de janela rígidos: os objetos variam em tamanho e proporção, tornando janelas de tamanho fixo ineficientes;
Cálculos redundantes: janelas sobrepostas processam repetidamente regiões semelhantes da imagem, desperdiçando recursos.

Devido a essas ineficiências, métodos de detecção de objetos baseados em aprendizado profundo substituíram em grande parte a abordagem de janela deslizante.

Métodos Baseados em Regiões: Selective Search & Redes de Proposta de Região (RPN)

Para melhorar a eficiência, métodos baseados em regiões propõem Regiões de Interesse (RoIs) em vez de escanear toda a imagem. Duas técnicas principais são:

Selective search: abordagem tradicional que agrupa pixels semelhantes em propostas de regiões, reduzindo o número de previsões de caixas delimitadoras. Embora mais eficiente que janelas deslizantes, ainda é lenta;
Redes de proposta de região (RPNs): utilizadas no Faster R-CNN, as RPNs usam uma rede neural para gerar regiões potenciais de objetos diretamente, melhorando significativamente a velocidade e a precisão em relação ao selective search.

Abordagens Iniciais Baseadas em Deep Learning

O deep learning revolucionou a detecção de objetos ao introduzir redes neurais convolucionais (CNNs) nos pipelines de detecção. Alguns dos modelos pioneiros incluem:

R-CNN (Regions with CNNs): este método aplica uma CNN a cada proposta de região gerada pelo selective search. Embora significativamente mais preciso que métodos tradicionais, é computacionalmente lento devido às avaliações repetidas da CNN;
Fast R-CNN: uma melhoria em relação ao R-CNN, este modelo processa toda a imagem com uma CNN primeiro e depois aplica o RoI pooling para extrair características para classificação, acelerando a detecção;
Faster R-CNN: introduz redes de proposta de região (RPNs) para substituir o selective search, tornando a detecção de objetos mais rápida e precisa ao integrar a geração de propostas de região na própria rede neural.

1. Qual é a principal vantagem do Faster R-CNN em relação ao Fast R-CNN?

2. Por que a abordagem de janela deslizante é ineficiente para detecção de objetos?

3. Qual das alternativas a seguir é um método de detecção de objetos baseado em deep learning?

Qual é a principal vantagem do Faster R-CNN em relação ao Fast R-CNN?

Select the correct answer

Faster R-CNN utiliza busca seletiva para propostas de regiões.

Faster R-CNN detecta apenas um objeto por imagem.

Faster R-CNN incorpora uma rede de propostas de regiões (RPN) para maior velocidade e precisão.

Faster R-CNN não utiliza CNNs.

Por que a abordagem de janela deslizante é ineficiente para detecção de objetos?

Select the correct answer

Processa cada região de forma independente, resultando em cálculos redundantes.

Funciona apenas com imagens em escala de cinza.

Não pode detectar objetos maiores que o tamanho da janela.

É utilizada apenas em aplicações em tempo real.

Qual das alternativas a seguir é um método de detecção de objetos baseado em deep learning?

Select the correct answer

ResNet

R-CNN

VGG

SVM

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 2