Chúc mừng sinh viên lớp HTTT2022.2 có bài báo được chấp nhận đăng tại Hội nghị Khoa học Quốc tế FDSE 2025
Hội nghị FDSE (Future Data and Security Engineering) là một diễn đàn khoa học quốc tế uy tín trong lĩnh vực Dữ liệu và Kỹ thuật bảo mật, thu hút các nhà nghiên cứu, học giả và chuyên gia từ học thuật, công nghiệp và chính phủ. FDSE là nơi thảo luận về các vấn đề tiên tiến và các giải pháp sáng tạo trong việc áp dụng các kỹ thuật bảo mật và dữ liệu vào các hệ thống phức tạp. Sự phát triển của khoa học dữ liệu, trí tuệ nhân tạo và an ninh mạng là những yếu tố quan trọng giúp ngành công nghệ thông tin vươn tới những thành tựu đột phá trong tương lai.
FDSE 2025 sẽ tiếp tục là điểm hội tụ của các chuyên gia từ nhiều quốc gia trên thế giới, cùng nhau chia sẻ kết quả nghiên cứu, cập nhật các xu hướng mới trong ngành và mở rộng hợp tác khoa học. Hội nghị năm nay sẽ được tổ chức trực tiếp tại Trường Đại học Văn Lang từ ngày 27–29/11/2025.
Link hội nghị: https://thefdse.org/index.html
Tên bài báo: “Evaluating Sampling Strategies and Generative Models for Addressing Class Imbalance in Intrusion Detection Systems”
Nhóm sinh viên thực hiện:
-
22521008 – Võ Thanh Nhàn – HTTT2022.2
-
22521034 – Huỳnh Yến Nhi – HTTT2022.2
Giảng viên hướng dẫn: ThS. Hà Lê Hoài Trung
Abstract: This study investigates methods for addressing class imbal ance in the CICIDS2017 network intrusion detection dataset. The dataset contains 78 traffic features with both benign and multiple attack cate gories. We applied three synthetic data generation approaches—SMOTE, CGAN, and Variational Autoencoder (VAE). SMOTE interpolates mi nority class samples, CGAN generates conditioned synthetic data via adversarial training, and VAE models the latent probability distribution to create realistic samples. We apply two machine learning algorithms to the augmented datasets—Random Forest (RF) and XGBoost (XGB), with training (80%) and testing (20%) subsets. Experimental results showed that SMOTE and CGAN, when combined with RF and XGB, achieved comparable classification performance, achieving accuracies of up to 99% and F1-scores above 0.95 across several minority attack types, while VAE lagged behind with lower predictive performance. These find ings demonstrate the effectiveness of combining synthetic data genera tion with machine learning algorithms for multi-class intrusion detection in imbalanced datasets. However, this study is confined to traditional classifiers; future research will extend the evaluation to deep learning models and federated learning frameworks to achieve greater robustness and scalability in real-world IDS applications.











