PROGRAMA DE PÓS-GRADUAÇÃO EM MODELOS DE DECISÃO E SAÚDE (PPGMDS)
CENTRO DE CIÊNCIAS EXATAS E DA NATUREZA (CCEN)
- Telefone/Ramal
-
(83) 3216-7592/7592
Notícias
Banca de DEFESA: ALEXANDRA CHRISTINE DE A SILVA
Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE: ALEXANDRA CHRISTINE DE A SILVA
DATA: 20/02/2025
HORA: 13:00
LOCAL: Auditório Humberto Nóbrega (CCS/UFPB)
TÍTULO: MODELO PARA O RECONHECIMENTO DE DIFERENTES ESTADOS EMOCIONAIS A PARTIR DA VOZ COM BASE NA LÓGICA FUZZY
PALAVRAS-CHAVES: Voz; Reconhecimento de voz; Emoções Expressas; Processamento de Voz; Inteligência Artificial; Lógica Fuzzy
PÁGINAS: 146
GRANDE ÁREA: Multidisciplinar
ÁREA: Interdisciplinar
RESUMO: INTRODUÇÃO: A voz é produzida por um complexo processo neurofisiológico que envolve diversas estruturas e sistemas do corpo, pode ser influenciada pelo estado emocional do indivíduo e por características da personalidade. A construção de um modelo que utilize o sinal de voz em diferentes emoções irá servir de base para elaboração e desenvolvimento de sistemas de reconhecimento que sejam robustos na automatização do reconhecimento das emoções. A definição de características acústicas próprias de cada estado emocional poderá permitir a efetiva separação das emoções por meio de técnicas de reconhecimento de padrões de voz. OBJETIVO: Desenvolver um modelo baseado na lógica fuzzy capaz de reconhecer as emoções a partir da voz de falantes do português brasileiro. MÉTODO: Trata-se de um estudo de natureza tecnológica,descritiva, observacional e transversal, que utilizou dados secundários, provenientes do Banco de Vozes Brasileiro nas Variações das Emoções - EmoVox-BR, que conta com um conjunto de dados composto por 182 sinais sonoros associados às emoções básicas:alegria, medo, tristeza, raiva, surpresa, nojo e estado neutro, produzidos por 26 atores profissionais e em formação. Foram extraídos parâmetros acústicos como medidas de frequência fundamental (fo), jitter, shimmer, medidas de ruído glótico Glottal to NoiseExcitation Ratio (GNE) e Harmonics-to-Noise Ratio (HNR), medidas cepstrais Cepstral Peak Prominence Smoothed (CPPS), Mel-Frequency Cepstral Coefficients(MFCC) e os parâmetros acústico-prosódicos da fo, duração e intensidade a partir dosdados do EmoVox-BR. A partir desses, desenvolveu-se o modelo de reconhecimento dasemoções. RESULTADOS: O estudo apresentou um modelo inovador baseado em lógica fuzzy para o reconhecimento dos estados emocionais a partir da voz, com a integração de parâmetros acústicos e prosódicos selecionados de forma criteriosa. O modelo utiliza18 parâmetros de entrada e 7 de saída. Foram implementadas 23 regras fuzzy para discriminação de sete categorias emocionais. O modelo apresentou acurácia de 89,01%e coeficiente Kappa de 87,18%, com sensibilidade variando entre 76,92% para alegria e100% para tristeza e estado neutro. As especificidades foram superiores a 93% em todas as categorias, indicando alta capacidade de diferenciação emocional. Variáveis sobrepostas, como alguns parâmetros acústicos e mel-cepstrais, foram removidas para simplificar o modelo e refinar seu desempenho. Além de otimizar a simplicidade e eficiência no reconhecimento das emoções, o modelo superou métodos convencionais em robustez em comparação com algoritmos de aprendizado de máquina como o Random Forest e Kernel SVM. CONCLUSÃO: O modelo de reconhecimento emocional,desenvolvido com lógica fuzzy a partir da voz humana, alcançou alta acurácia e precisão na diferenciação de emoções. O resultado prevê aplicações promissoras em computação afetiva e tecnologias interativas, a abordagem demonstra eficácia ao capturar nuances emocionais, com adaptação a diferentes contextos para tornar interações humano-máquina mais empáticas e personalizadas.
MEMBROS DA BANCA:
Externo à Instituição - ANA CAROLINA CONSTANTINI
Interno - 1668545 - ANNA ALICE FIGUEIREDO DE ALMEIDA QUEIROZ
Interno - 2634755 - LEONARDO WANDERLEY LOPES
Interno - 2379027 - LILIANE DOS SANTOS MACHADO
Externo à Instituição - REGIVAN HUGO NUNES SANTIAGO
Interno - 337967 - RONEI MARCOS DE MORAES