PROGRAMA DE PÓS-GRADUAÇÃO EM MODELOS DE DECISÃO E SAÚDE (PPGMDS)

CENTRO DE CIÊNCIAS EXATAS E DA NATUREZA (CCEN)

Telefone/Ramal
(83) 3216-7592/7592

Notícias


Banca de DEFESA: DANILO RANGEL ARRUDA LEITE

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE: DANILO RANGEL ARRUDA LEITE
DATA: 23/08/2022
HORA: 14:00
LOCAL: LIEV - sala 810
TÍTULO: DESENVOLVIMENTO DE UM MODELO DE CLASSIFICAÇÃO DA TIPOLOGIA DOS SINAIS VOCAIS COM BASE NO DEEP CNN VGG-16
PALAVRAS-CHAVES: Espectrogramas; Tipologia da voz; Deep Learning; GRAD-CAM.
PÁGINAS: 84
GRANDE ÁREA: Multidisciplinar
ÁREA: Interdisciplinar
RESUMO: A voz é um dos principais meios de comunicação do ser humano, sua emissão deve ser agradável, sem esforços e conforme aos interesses profissionais, sociais e pessoais do interlocutor. Qualquer alteração na sua emissão, pode ser classificada como distúrbio de voz. Diagnosticar o distúrbio no seu estágio inicial, pode ser crucial para evitar situações de morbidade mais sérias, pois fornece ao paciente a oportunidade de um tratamento sem complicações, oferecendo uma qualidade de vida melhor. Na prática clínica tradicional, são necessários diversos exames médicos para detectar um distúrbio de voz, como a observação das pregas vocais por meio de laringoscopia, para visualizar possíveis alterações morfológicas, ou a análise de parâmetros acústicos, úteis para evidenciar possíveis alterações funcionais. Esses exames são muitas vezes invasivos e demorados podendo causar desconforto ao paciente durante o procedimento. A análise acústica tem sido indicada como uma ferramenta auxiliar que utiliza procedimentos não invasivo, de baixo custo, utilizando técnicas de processamento digital de sinal de voz colaborando no diagnóstico de patologias da voz. Dentre as possibilidades de análise acústica, a espectrografia é um recurso de grande relevância, a partir dela podem ser visualizadas informações como presença de ruído em média e altas frequências, intensidade, instabilidade dos harmônicos, quebras de sonoridade, entre outras e independe do grau de aperiodicidade do sinal avaliado. Diante do exposto, esse estudo construiu um modelo inteligente de classificação automática utilizando uma DNN pré-treinada baseada no VGG-16 para classificar imagens espectrográficas da tipologia do sinal da voz da vogal sustentada “é” baseada na proposta de Titze e Sprecher. Também foi utilizado o GRAD-CAM para marcar na imagem as partes mais relevantes utilizadas pelo modelo na classificação. A arquitetura desenvolvida na metodologia resultou em uma Acurácia Global do Teste de 0.93, Precision de 0.94, F1Score 0.93, kappa 0.90, sensibilidade e especificidade 0.93 e 0.98, respectivamente. O modelo construído pode ser utilizado como ferramenta na etapa de pré-análise indicando que análises podem ser feitas a partir da classificação, auxiliando o clínico na sua toma decisão.
MEMBROS DA BANCA:
Externo à Instituição - ANA CRISTINA CORTES GAMA
Interno - 1668545 - ANNA ALICE FIGUEIREDO DE ALMEIDA QUEIROZ
Presidente - 2634755 - LEONARDO WANDERLEY LOPES
Interno - 2379027 - LILIANE DOS SANTOS MACHADO
Interno - 337967 - RONEI MARCOS DE MORAES
Externo à Instituição - SUZETE ÉLIDA NÓBREGA CORREIA