Modelo de visão computacional para identificação de alimentos em refeições a partir da segmentação obtida por múltiplas redes completamente convolucionais

CARVALHO, Marcos Alberto de

Repositório UNIFEI UNIFEI - Campus 1: Itajubá PPG - Programas de Pós Graduação Teses

Use este identificador para citar ou linkar para este item: https://repositorio.unifei.edu.br/jspui/handle/123456789/4112

Tipo:	Tese
Título:	Modelo de visão computacional para identificação de alimentos em refeições a partir da segmentação obtida por múltiplas redes completamente convolucionais
Autor(es):	CARVALHO, Marcos Alberto de
Primeiro Orientador:	PIMENTA, Tales Cleber
metadata.dc.contributor.advisor-co1:	SILVÉRIO, Alessandra Cristina Pupin
Resumo:	A estratégia de contar os carboidratos dos alimentos consumidos é recomendada por sociedades científicas como uma forma de melhorar a qualidade de vida dos pacientes com diabetes. O monitoramento da ingestão de alimentos pode ser facilitado através do uso de um aplicativo móvel que reconhece automaticamente os alimentos em uma refeição. O reconhecimento automático de imagens de alimentos é considerado uma tarefa desafiadora para a visão computacional devido à semelhança entre os alimentos. Esse desafio aumenta quando o objetivo é classificar alimentos de uma região específica e com um conjunto de dados contendo apenas alimentos dessa região e, portanto, pequeno em comparação com conjuntos de dados públicos de outros países. Para essa tarefa, este trabalho apresenta um modelo que utiliza um conjunto de Redes Completamente Convolucionais (Fully Convolutional Network - FCNs) para gerar segmentações dos alimentos em uma refeição. Essas segmentações são processadas por um algoritmo que classifica os alimentos utilizando técnicas de processamento digital de imagens. O modelo tem baixos custos de treinamento e é escalável, ou seja, pode ser treinado para reconhecer um novo alimento sem a necessidade de re-treinar o modelo inteiro. Nos testes, foram utilizados alimentos consumidos no Brasil, obtendo 98.2% de acurácia e 87.8% de sensibilidade.
Abstract:	The strategy of counting carbohydrates in consumed foods is recommended by scientific societies as a way to improve the quality of life for diabetes patients. Monitoring food intake can be facilitated by using a mobile application that automatically recognizes the foods in a meal. Automatic recognition of food images is considered a challenging task for computer vision due to the similarity between foods. This challenge increases when the goal is to classify foods from a specific region and with a dataset containing only foods from that region, and therefore, small compared to public datasets from other countries. For this task, this work presents a model that uses a set of Fully Convolutional Networks (FCNs) to generate segmentations of foods in a meal. These segmentations are processed by an algorithm that classifies the foods using digital image processing techniques. The model has low training costs and is scalable, meaning it can be trained to recognize a new food without the need to retrain the entire model. In the tests, foods consumed in Brazil were used, achieving an accuracy of 98.2% and a recall of 87.8%.
Palavras-chave:	Visão computacional Processamento digital de imagens Identificação automática de alimentos
CNPq:	CNPQ::ENGENHARIAS::ENGENHARIA ELÉTRICA
Idioma:	por
País:	Brasil
Editor:	Universidade Federal de Itajubá
Sigla da Instituição:	UNIFEI
metadata.dc.publisher.department:	IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
metadata.dc.publisher.program:	Programa de Pós-Graduação: Doutorado - Engenharia Elétrica
Tipo de Acesso:	Acesso Aberto
URI:	https://repositorio.unifei.edu.br/jspui/handle/123456789/4112
Data do documento:	10-Jul-2024
Aparece nas coleções:	Teses

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Tese_2024039.pdf		9,15 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas