Sow, Thierno Hamidou (2025). Détection d'intrusion avec l'apprentissage automatique : analyse comparative des forêts aléatoires, XGBoost et des réseaux de neurones profonds. Mémoire. Rimouski, Université du Québec à Rimouski, Département de mathématiques, informatique et génie, 48 p.
|
PDF
Télécharger (9MB) | Prévisualisation |
Résumé
RÉSUMÉ : Les systèmes de détection d'intrusion (IDS) sont essentiels pour protéger les infrastructures informatiques contre les cyberattaques. Toutefois, les IDS doivent relever plusieurs enjeux majeurs, notamment l'amélioration du taux de détection et la réduction du taux de fausses alarmes. Dans cette étude, nous proposons une analyse comparative de trois algorithmes d'apprentissage automatique, à savoir les forêts aléatoires (RF), XGBoost et les réseaux de neurones profonds (DNN), dans le but d'améliorer les performances des IDS. La méthodologie mise en œuvre comprend la normalisation des données, la sélection des caractéristiques, l'équilibrage des classes à l'aide de la Synthetic Minority Oversampling Technique (SMOTE), ainsi que l'optimisation des hyperparamètres avec Optuna. Les expérimentations ont été menées sur le jeu de données NSL-KDD, en utilisant les bibliothèques Scikit-learn sous python pour l'implémentation. L'évaluation des modèles a été réalisée par validation croisée, suivie d'une comparaison avec les approches existantes rapportées dans la littérature. Les métriques retenues incluent l'exactitude, la précision, le rappel et le score F1. Les résultats obtenus montrent que le RF atteint une exactitude de 99,80%, surpassant XGBoost (99.79%) et DNN (98,65 %). Par rapport aux travaux existants, notre étude apporte une contribution expérimentale en comparant trois algorithmes sous les mêmes conditions méthodologiques afin d'identifier celui offrant la meilleure précision. -- Mot(s) clé(s) en français : Cybersécurité, IDS, apprentissage automatique, SMOTE, RF, XGBoost, DNN, Classification. --
ABSTRACT : Intrusion Detection Systems (IDS) are essential for protecting IT infrastructures against cyberattacks. However, IDS face several major challenges, including improving the detection rate and reducing the false alarm rate. In this study, we present a comparative analysis of three machine learning algorithms, namely Random Forest (RF), Extreme Gradient Boosting (XGBoost), and Deep Neural Networks (DNN), with the aim of improving IDS performance. The implemented methodology includes data normalization, feature selection, class balancing using the Synthetic Minority Oversampling Technique (SMOTE), as well as hyperparameter optimization with Optuna. Experiments were conducted on the NSL-KDD dataset, using the Scikit-learn libraries in Python for implementation. Model evaluation was performed by cross-validation, followed by a comparison with existing approaches reported in the literature. The chosen metrics include accuracy, precision, recall, and F1-score. The results show that Random Forest achieves an accuracy of 99.80%, surpassing XGBoost (99.79%) and DNN (98.65%). Compared to existing studies, this work provides an experimental contribution by comparing the three algorithms under the same methodological conditions to identify the one offering the highest accuracy. -- Mot(s) clé(s) en anglais : Cybersecurity, IDS, machine learning, SMOTE, RF, XGBoost, DNN, Classification.
| Type de document : | Thèse ou mémoire de l'UQAR (Mémoire) |
|---|---|
| Directeur(trice) de mémoire/thèse : | Adda, Mehdi |
| Information complémentaire : | Mémoire présenté dans le cadre du programme de maîtrise en informatique en vue de l'obtention du grade de maître ès sciences. |
| Mots-clés : | Systèmes de détection d'intrusion (Sécurité informatique); Ids; Forêts d'arbres décisionnels; XGBoost; Réseaux de neurones convolutifs; Réseaux de neurones profonds (DNN). |
| Départements et unités départementales : | Département de mathématiques, informatique et génie > Informatique |
| Date de dépôt : | 10 févr. 2026 17:02 |
| Dernière modification : | 10 févr. 2026 17:02 |
| URI : | https://semaphore.uqar.ca/id/eprint/3453 |

Service de la bibliothèque
Statistiques de téléchargement
Statistiques de téléchargement