Réseaux de neurones pour la détection des sibilants dans les sons acoustiques respiratoires dans le but d'une implantation efficace temps-réel sur circuit FPGA

Semmad, Abdelkrim (2021). Réseaux de neurones pour la détection des sibilants dans les sons acoustiques respiratoires dans le but d'une implantation efficace temps-réel sur circuit FPGA. Mémoire. Rimouski, Université du Québec à Rimouski, Département de mathématiques, informatique et génie, 91 p.

[thumbnail of Abdelkrim_Semmad_novembre2021.pdf]

PDF
Télécharger (2MB) | Prévisualisation

Résumé

RÉSUMÉ : Les maladies pulmonaires obstructives chroniques (MPOC) sont considérées comme l'une des causes principales de mortalité selon l'organisation mondiale de la santé (OMS). Un diagnostic précoce et un traitement médical adéquat sont recommandés pour diminuer les risques liés à de telles affections. En effet, un bon diagnostic médical repose sur une identification rigoureuse des sons respiratoires produits par un patient. Face aux limites inhérentes aux techniques de diagnostic conventionnelles (auscultation par stéthoscope, spirométrie, etc.), des techniques basées sur le traitement du signal et l'apprentissage machine ont été adoptées pour l'identification automatique des sons respiratoires adventices. L'objet principal de ce travail de recherche est la détection automatique et en temps réel, des sibilants qui sont un symptôme lié le plus souvent à la maladie d'asthme. Pour ce faire, le travail a été divisé en deux parties. En première partie, un ensemble de méthodes ont été proposées pour la caractérisation des sons respiratoires à l'aide des coefficients cepstraux et chacune de ces méthodes a été combinée avec des techniques d'apprentissage automatique basées sur des réseaux de neurones. Le but étant d'atteindre les meilleurs taux de détection des sibilants. Étant donné la similitude qui existe de point de vue acoustique entre les sons respiratoires et la parole, des techniques telles que les coefficients cepstraux à l'échelle de Mel (MFCC), les coefficients cepstraux à filtres gammatone (GFCC) et les coefficients cepstraux à l'échelle de Bark (BFCC), d'habitude utilisées pour la caractérisation de la parole, ont été employées ici pour l'extraction des caractéristiques à partir des sons respiratoires. Quant à la classification, notre choix s'est porté sur les réseaux de neurones, plus particulièrement le perceptron multicouche (MLP) et le réseau de neurones avec mémoire à court et long terme bidiriectionnel (BiLSTM). Dans la seconde partie, un modèle de détection basé sur une combinaison MFCC-MLP a été sélectionné afin d'être implanté. Une implantation matérielle sur une puce FPGA a été réalisée pour permettre la détection en temps réel sur un dispositif portable. Pour les applications à faible débit, une architecture complètement sérialisée du classifieur MLP, basée sur une seule unité de traitement a été proposée afin de réduire les ressources matérielles et la puissance totale consommée. L'architecture proposée a été concrétisée à l'aide de Xilinx System Generator (XSG) qui est un outil de programmation de haut niveau pour les circuits FPGA de Xilinx. Les résultats de classification obtenus ont été évalués en termes de la spécificité et de la sensitivité ainsi que des critères d'exactitude et de performance. Les meilleurs scores de classification ont été obtenus avec la combinaison MFCC-BiLSTM (96% d'exactitude). Quant à la nouvelle architecture proposée pour l'implantation du MLP, elle a été validée étant donné qu'elle produit les mêmes résultats de classification que l'architecture parallèle considérée comme référence. -- Mot(s) clé(s) en français : Sons respiratoires, MFCC, GFCC, BFCC, MLP, LSTM, Sibilants, Détection des sibilants, FPGA. --
ABSTRACT : According to the world health organization (WHO), chronic obstructive pulmonary diseases (COPD) are considered as one of the leading causes of mortality. An early diagnosis and an adequate medical treatment are recommended to reduce the risks related to such conditions. Indeed, an accurate medical diagnosis is based on a rigorous identification of the respiratory sounds produced by a patient. Because of the inherent limitations of conventional diagnostic techniques (auscultation by stethoscope, spirometry, etc.), techniques based on signal processing and machine learning have been adopted to automatically identify adventitious respiratory sounds. The primary purpose of this research is the automatic real-time detection, from respiratory sounds, of wheezing, that is a symptom related to asthma disease. This work has been achieved in two steps. In the first step, a set of methods has been proposed to characterize respiratory sounds using cepstral coefficients, and each of these methods was combined with machine learning techniques based on neural networks. The goal was to achieve the best detection rates of wheezes. Given the similarity, on the acoustic point of view, between breath sounds and speech, techniques such as Mel-scale cepstral coefficients (MFCC), gammatone frequency cepstral coefficients (GFCC), and Bark frequency cepstral coefficients (BFCC), usually used for speech characterization tasks, have been employed here for feature extraction from respiratory sounds. For classification, we chose neural networks, more specifically the multilayer perceptron (MLP) and the bidirectional long short-term memory (BiLSTM). In the second step, a detection model based on an MFCC-MLP combination was selected to be implemented. A hardware implementation on an FPGA chip has been realized to enable real-time detection on a mobile device. For low data rate applications. A fully serial architecture of the MLP classifier, based on a single processing unit, has been proposed to reduce the resource utilization and the total power consumption. The proposed architecture has been implemented using Xilinx System Generator (XSG), a high-level programming tool for FPGA chips from Xilinx. The classification results obtained were evaluated in terms of specificity, sensitivity and the resulting accuracy and performance criteria. The best classification scores were obtained with the MFCC-BiLSTM combination (96% accuracy). The new architecture was validated as it produces the same classification results as the parallel architecture. -- Mot(s) clé(s) en anglais : Respiratory sounds,MFCC, GFCC, BFCC, MLP, LSTM, Wheezing, Wheezing detection, FPGA.

Type de document :	Thèse ou mémoire de l'UQAR (Mémoire)
Directeur(trice) de mémoire/thèse :	Bahoura, Mohammed
Information complémentaire :	Mémoire présenté dans le cadre du programme de maîtrise en ingénierie en vue de l'obtention du grade de maître ès sciences appliquées (M.Sc.A.).
Mots-clés :	Sons respiratoires; Sibilance; Sibilant; Diagnostic; Détection automatique; Identification automatique; Réseaux de neurones; Apprentissage machine.
Départements et unités départementales :	Département de mathématiques, informatique et génie > Génie
Date de dépôt :	22 févr. 2024 18:07
Dernière modification :	22 févr. 2024 18:07
URI :	https://semaphore.uqar.ca/id/eprint/2896

Éditer la notice (administrateurs seulement)

Statistiques de téléchargement Plus de détails

Téléchargements

Téléchargements par mois depuis la dernière année