PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA (PPGI)

UNIVERSIDADE FEDERAL DA PARAÍBA

Telefone/Ramal
Não informado

Notícias


Banca de DEFESA: ANNIE ELISABETH BELTRÃO DE ANDRADE

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: ANNIE ELISABETH BELTRÃO DE ANDRADE
DATA: 29/08/2022
HORA: 10:00
LOCAL: Google meet
TÍTULO: ABORDAGEM DE APRENDIZAGEM DE MÁQUINA PARA PREDIÇÃO DE FAMÍLIAS DE PEPTÍDEOS ANTIMICROBIANOS VEGETAIS
PALAVRAS-CHAVES: Light Gradient Boosting Machine, Aprendizagem Supervisionada, Classificação, Biologia Molecular, Plantas
PÁGINAS: 74
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Metodologia e Técnicas da Computação
ESPECIALIDADE: Sistemas de Informação
RESUMO: Os peptídeos antimicrobianos (AMPs) vegetais consistem em moléculas com 29 a 100 aminoácidos e geralmente carregadas positivamente, sendo encontrados em uma ampla variedade de formas de vida. A maioria dos AMPs tem ação anti patogênica direta, enquanto outros apresentam atividade imunomoduladora. Num contexto de rápido desenvolvimento de multi resistência crescente aos antibióticos convencionais, e a necessidade da diminuição da utilização de agentes agrotóxicos, esforços para o desenvolvimento de produtos biotecnológicos baseados em AMPs vêm se acelerando. AMPs são conhecidos por terem composição de sequência específica para suas famílias, característica que pode ser utilizada para atuar na prospecção e ‘design’ de AMP, auxiliando na caracterização de funções, padrões bioquímicos e características de interesse industrial. No entanto, abordagens experimentais são custosas e laboriosas. Nesse sentido, o objetivo deste trabalho foi o desenvolvimento de modelos utilizando métodos de aprendizagem supervisionada capazes de classificar seis famílias de peptídeos antimicrobianos de plantas: Tioninas, LTPs, Heveínas, Snakinas, Defensinas e Ciclotídeos, visto que essa caracterização pode acelerar pesquisas com AMP. Os métodos utilizados para classificação foram o LightGBM, regressão logística, vizinhos mais próximos, árvore de decisão, máquina de vetor de suporte e naive bayes. O treinamento foi feito usando as bases de dados PhytAMP e PlantpepDB, cujos rótulos foram atribuídos por metodologias experimentais. Os resultados foram comparados com os sistemas CAMPSing e o descrito em Quintans (2019), bem como, foram realizados testes com o modelo desenvolvido para classificação das bases de dados do CAMPR3, que contempla as famílias Tionina e Defensina; e OneKP, utilizada por Quintans (2019), que contempla as famílias Tioninas, LTPs, Heveínas e Snakinas, ambas as bases têm rótulos atribuídos por metodologias in silico. Em relação aos resultados, considerando as bases de treinamento, o algoritmo LightGBM apresentou os melhores valores de desempenho em relação aos demais. Após as definições dos melhores hiperparâmetros, o LightGBM apresentou uma acurácia média de 91,5%. Em relação à base de dados OneKP, o método apresentou uma acurácia média de 91,2%, sendo o desempenho de predição variável entre as classes. Por fim, para a base do CAMPR3, o modelo apresentou uma acurácia média de 93%.
MEMBROS DA BANCA:
Presidente - 1743917 - THAIS GAUDENCIO DO REGO
Interno - 2813926 - TIAGO MARITAN UGULINO DE ARAUJO
Externo ao Programa - 1827772 - YURI DE ALMEIDA MALHEIROS BARBOSA