Thông tin luận án Tiến sĩ của NCS Lê Việt Hà
Tên đề tài luận án: “Nghiên cứu một số phương pháp học sâu trong phát hiện đoạn mã độc.” (Tên tiếng Anh: Enhancing webshell detection with deep learning-powered methods)
1. Họ và tên nghiên cứu sinh: LÊ VIỆT HÀ 2. Giới tính: Nam
3. Ngày sinh: 03-11-1985 4. Nơi sinh: Hà Nội
5. Quyết định công nhận nghiên cứu sinh số: Quyết định số 1146/QĐ-ĐT, ngày 21 tháng 10 năm 2019 của Hiệu trưởng Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội.
6. Các thay đổi trong quá trình đào tạo: gia hạn học tập tổng cộng 02 năm theo các Quyết định số 980A/QĐ ngày 7/11/2022 và Quyết định số 878A/QĐ ngày 10/5/2024 của Hiệu trưởng Trường Đại học Công nghệ.
7. Tên đề tài luận án: “Nghiên cứu một số phương pháp học sâu trong phát hiện đoạn mã độc.” (Tên tiếng Anh: Enhancing webshell detection with deep learning-powered methods)
8. Ngành đào tạo: Hệ thống thông tin 9. Mã số: 9480104.01
10. Cán bộ hướng dẫn khoa học:
CBHD chính: PGS.TS. Nguyễn Ngọc Hóa, Trường ĐH Công nghệ, ĐHQGHN
CBHD phụ: TS. Phùng Văn Ổn, Văn phòng Chính phủ
Thông tin luận án Tiến sĩ của NCS Lê Việt Hà (tiếng Anh)
11. Tóm tắt các kết quả mới của luận án:
+ Đề xuất khung kiến trúc dựa trên phân tích mã nguồn ứng dụng web bằng cách kết hợp giữa kỹ thuật so khớp mẫu với thuật toán học sâu. Phương pháp kết hợp này cho phép phát hiện nhanh chóng và chính xác cả loại webshell đã biết và chưa biết. Khung kiến trúc là chỉ dẫn để phát triển các mô hình phát hiện tấn công webshell cụ thể phù hợp với các ngôn ngữ lập trình khác nhau. Dựa trên ASAF, xây dựng hai hệ thống phát hiện các cuộc tấn công webshell cho từng ngôn ngữ PHP và ASP.NET. Tiến hành thực nghiệm và so sánh
+ Đề xuất mô hình học sâu thực hiện phân tích chuyên sâu các truy vấn HTTP nhằm phát hiện các tấn công webshell. Để giải quyết vấn đề mất cân bằng của tập dữ liệu huấn luyện, chúng tôi đề xuất một thuật toán đề cải thiện chất lượng của tập dữ liệu huấn luyện mô hình học sâu. Để chứng minh tính hiệu quả của mô hình, chúng tôi thực nghiệm và so sánh mô hình với các nghiên cứu liên quan trên tập dữ liệu CSE-CIC-IDS2018. Giải pháp có khả năng tích hợp vào hệ thống IDS/IPS cho phép tự động chặn các địa chỉ nguồn đáng ngờ trong thời gian thực.
12. Khả năng ứng dụng trong thực tiễn:
+ Khung kiến trúc dựa trên phân tích mã nguồn ứng dụng web bằng cách kết hợp giữa kỹ thuật so khớp mẫu với thuật toán học sâu là chỉ dẫn để phát triển các mô hình phát hiện tấn công webshell cụ thể phù hợp với các ngôn ngữ lập trình khác nhau có khả năng triển khai trong thực tiễn.
+ Mô hình học sâu thực hiện phân tích chuyên sâu các truy vấn HTTP có khả năng tích hợp vào hệ thống IDS/IPS cho phép phát hiện các tấn công webshell và tự động chặn các địa chỉ nguồn đáng ngờ trong thời gian thực.
13. Những hướng nghiên cứu tiếp theo:
+ Tiến hành khảo sát tổng thể các bộ dữ liệu webshell được sử dụng trong nghiên cứu hiện tại, từ đó xây dựng bộ dữ liệu làm chuẩn cho các nghiên cứu sau này liên quan đến webshell.
+ Tiếp tục nghiên cứu và thử nghiệm các mô hình DL/ML đơn lẻ và các mô hình tổng hợp mới nhất để cải thiện khả năng phát hiện chính xác các webshell nâng cao.
+ Nghiên cứu sâu hơn về cơ chế hoạt động và đặc điểm của webshell cho phép xây dựng các bộ công cụ tự động hóa quá trình tạo quy tắc YARA.
+ Mở rộng nghiên cứu về webshell viết bằng các ngôn ngữ khác như JSP, Ruby, Python,… hướng tới xây dựng mô hình tổng quát có thể phát hiện hiệu quả tất cả các loại webshell mà không phụ thuộc vào ngôn ngữ lập trình.
14. Các công trình đã công bố có liên quan đến luận án:
+ Nguyễn, Hoá & Le, Viet-Ha & Phung, Van-On & Du, Phuong-Hanh. (2019). Toward a Deep Learning Approach for Detecting PHP Webshell. SoICT 2019: Proceedings of the Tenth International Symposium on Information and Communication Technology. 514-521. 10.1145/3368926.3369733;
+ Le, Viet Ha and Phung, Van On and Nguyen, Ngoc Hoa (2020) Information Security Risk Management by a Holistic Approach: a Case Study for Vietnamese e-Government. IJCSNS International Journal of Computer Science and Network Security, 20 (6). pp. 72-
82. ISSN 1738-7906;
+ Le, Viet Ha and Nguyen, Ngoc Tu and Nguyen, Ngoc Hoa and Le, Linh (2021) An Efficient Hybrid Webshell Detection Method for Webserver of Marine Transportation Systems. IEEE Transactions on Intelligent Transportation Systems. ISSN 1524-9050;
+ Le, Viet Ha and Du, Phuong Hanh and Nguyen, Ngoc Cuong and Nguyen, Ngoc Hoa and Hoang, Viet Long (2021) A Proactive Method of the Webshell Detection and Prevention based on Deep Traffic Analysis. International Journal of Web and Grid Services. ISSN 1741-1114 (In Press);
+ Ha V. Le, Hoang V. Vo, Tu N. Nguyen, Hoa N. Nguyen, and Hung T. Du (2022) Towards a Webshell Detection Approach Using Rule-Based and Deep HTTP Traffic Analysis. Computational Collective Intelligence: 14th International Conference, ICCCI 2022. vol 13501 pp. 571–584.
+ Ổn, P. V., Hà, L. V., & Hóa, N. N. (2022). Giải pháp đánh giá và quản lý rủi ro an toàn thông tin trong Chính phủ điện tử. Tạp Chí Khoa học – Công nghệ Trong lĩnh vực An toàn thông Tin, 1(13), 35-48.
+ Sáng chế “Phương pháp phát hiện đoạn mã độc trong mã nguồn ứng dụng web sử dụng ngôn ngữ ASP.NET”, được Cục Sở hữu trí tuệ cấp mã số 1-0036538-000 ngày 27/06/2023