avatar
Publicado por

Estudo sobre impacto de resolução de imagens em geração de previsões de classificação

Authors
  • avatar
    Name
    Gabriel Gava Pinheiro
    Twitter

Resolução da Câmera em Dispositivos Android: Impacto no Treinamento de Modelos de Visão Computacional

Resumo

Este estudo investiga a influência da resolução da câmera em dispositivos Android no treinamento de modelos de visão computacional. Envolvendo seis dispositivos distintos, abordamos tarefas como classificação, segmentação, e detecção de objetos, analisando como a variação na resolução impacta o desempenho dos modelos. Além disso, discutimos requisitos cruciais em conjuntos de dados para otimizar o treinamento considerando resolução, foco, brilho e exposição.

Introdução

A visão computacional desempenha um papel vital em diversas aplicações. Este estudo concentra-se na resolução da câmera em dispositivos Android como um fator crítico que pode afetar os resultados do treinamento de modelos para tarefas específicas.

Metodologia

Seis dispositivos Android foram escolhidos, cada um com uma resolução de câmera distinta. Modelos de aprendizado profundo pré-treinados foram aplicados em tarefas de classificação, segmentação, e detecção de objetos, variando a resolução durante o treinamento para avaliar seu impacto.

Resultados

A baixo temos alguns exemplos de algoritimos e seus resultados em relação ao dimensionamento das imagens

texto-1
texto-1

algoritimo yolo parara reconhecimento de sapatos

Também testamos para algortmos treinados a partir de CNN classicas para reconhecimento de abelhas. Podemos ver o resultado a baixo das duas imagens

abelhas abelhas

Impacto da Resolução no Desempenho dos Modelos

Os resultados revelaram uma correlação positiva entre uma resolução mais alta e um desempenho mais preciso. Métricas específicas foram utilizadas para avaliar acurácia, precisão e recall em diferentes resoluções, oferecendo uma análise detalhada.

Requisitos em um Conjunto de Dados

Destacamos a importância de conjuntos de dados diversificados, considerando resoluções, variações de foco, condições de iluminação e exposição para otimizar o treinamento dos modelos, garantindo robustez em cenários diversos.

Exemplos e Impacto nas Tarefas

  • Xiaomi Redmi Note 11:
    • Classificação: A alta resolução da câmera traseira permite melhor distinção de detalhes, resultando em maior precisão.
    • Segmentação: A resolução favorável contribui para contornos nítidos e detalhes refinados.
    • Detecção de Objetos: A câmera traseira de 50 MP é vantajosa para detecção precisa, especialmente para objetos pequenos.
  • Samsung Galaxy A13:
    • Classificação: A resolução da câmera traseira é vantajosa, enquanto a frontal é adequada.
    • Segmentação: A resolução mais baixa da câmera frontal pode afetar a precisão dos contornos.
  • Galaxy A54:
    • Classificação: Ambas as câmeras possuem resoluções favoráveis.
    • Segmentação: A alta resolução da câmera frontal é benéfica.
    • Detecção de Objetos: A câmera traseira de 48 MP é adequada, enquanto a frontal é útil para objetos próximos.
  • Samsung Galaxy S21 FE:
    • Classificação: A câmera traseira de alta resolução é vantajosa.
    • Segmentação: A resolução da câmera frontal é adequada.
    • Detecção de Objetos: Ambas as câmeras contribuem para detecção eficaz.
  • Samsung Galaxy S23 Ultra:
    • Classificação: A câmera traseira de altíssima resolução oferece detalhes excepcionais.
    • Segmentação: A resolução da câmera frontal é significativa.
    • Detecção de Objetos: A câmera traseira de 108 MP é vantajosa para detecção.
  • Realme C21Y:
    • Classificação: A resolução da câmera traseira é suficiente, embora possa ter limitações em detalhes finos.
    • Segmentação: Pode enfrentar desafios devido à resolução mais baixa.
    • Detecção de Objetos: Limitações podem ocorrer na detecção de objetos menores.

Conclusão

A resolução da câmera impacta diretamente o desempenho dos modelos de visão computacional em dispositivos Android. A escolha criteriosa da resolução é vital, considerando a aplicação específica e as características do ambiente em que o modelo será implementado.

Bibliografia

https://www.mdpi.com/2077-0472/13/3/713

https://www.mdpi.com/2075-4450/14/1/54#fig_body_display_insects-14-00054-f002

https://www.researchgate.net/publication/361255545_Insect_detection_from_imagery_using_YOLOv3-based_adaptive_feature_fusion_convolution_network

https://www.mdpi.com/2076-3417/12/19/10167

https://www.kaggle.com/code/dima806/farm-insects-image-detection-vit/notebook