PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA (PPGI)

UNIVERSIDADE FEDERAL DA PARAÍBA

Telefone/Ramal
Não informado

Notícias


Banca de QUALIFICAÇÃO: ANNIE ELISABETH BELTRÃO DE ANDRADE

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE: ANNIE ELISABETH BELTRÃO DE ANDRADE
DATA: 26/08/2021
HORA: 17:00
LOCAL: https://meet.google.com/aat-nrvj-isy
TÍTULO: ABORDAGEM DE APRENDIZAGEM DE MÁQUINA PARA PREDIÇÃO DE FAMÍLIAS DE PEPTÍDEOS ANTIMICROBIANOS VEGETAIS
PALAVRAS-CHAVES: Aprendizagem de Máquina, Classificação, Biologia Molecular, Plantas.
PÁGINAS: 66
RESUMO: Os peptídeos antimicrobianos (AMPs) consistem em peptídeos com cerca de 29 a 100 aminoácidos e geralmente carregados positivamente, encontrados em uma ampla variedade de formas de vida. A maioria dos AMPs tem ação antipatogênica direta, enquanto outros apresentam atividade imunomoduladora. Num contexto de rápido desenvolvimento de multi resistência crescente aos antibióticos convencionais e necessidade da diminuição de agentes agrotóxicos, os esforços de desenvolvimento de produtos biotecnológicos baseados em AMPs estão se acelerando. Nesse sentido, o objetivo deste trabalho foi o desenvolvimento de modelos utilizando métodos de aprendizagem supervisionada capazes de classificar quatro famílias de peptídeos antimicrobianos de plantas, Tioninas, LTP, Heveínas e Snakinas, uma vez que essa caracterização pode auxiliar na determinação de funções, padrões bioquímicos e características de interesse industrial, diminuindo o custo de triagens experimentais e acelerando pesquisas com AMP. Os métodos utilizados foram o XGBoost da biblioteca xgboost, regressão logística, vizinhos mais próximo, árvore de decisão, máquina de vetor de suporte e naive bayes. O treinamento foi feito usando as bases de dados PhytAMP e PlantpepDB, cujo os rótulos foram atribuídos através de metodologias experimentais. Os resultados foram comparados com os sistemas CAMPSing e o descrito em Quintans (2019), onde foram realizados testes com as bases de dados do CAMPR3 e OneKP, com rótulos atribuídos através de metodologias in silico. Em relação aos resultados, considerando as bases de dados experimentais, o algoritmo XGBoost apresentou as melhores métricas de desempenho em relação aos demais. Após as definições dos melhores hiperparâmetros, o método apresentou uma acurácia média de 98%, com apenas uma instância predita erroneamente. Em relação a base de dados OneKP, o método apresentou uma acurácia média de 71%, sendo o desempenho de predição variável entre as classes. Por fim, para a base do CAMPR3, considerando que o CAMPSing apenas atribui rótulo a tioninas, o modelo apresentou uma acurácia de 98% para essa classe.
MEMBROS DA BANCA:
Presidente - 1743917 - THAIS GAUDENCIO DO REGO
Interno - 2813926 - TIAGO MARITAN UGULINO DE ARAUJO
Externo ao Programa - 1827772 - YURI DE ALMEIDA MALHEIROS BARBOSA
Externo à Instituição - ISADORA L ALVES DA COSTA RIBEIRO