Thông tin luận án tiến sĩ của NCS Bùi Thị Hồng Nhung
Tên đề tài luận án: Nghiên cứu kỹ thuật biểu diễn và phân cụm vết trong phát hiện mô hình quy trình.
1. Họ và tên nghiên cứu sinh: Bùi Thị Hồng Nhung 2. Giới tính:Nữ
3. Ngày sinh:25/04/1979 4. Nơi sinh: Hà Nội
5. Quyết định công nhận NCS số 642/QĐ-CTSV ngày 15 tháng 09 năm 2014 của Hiệu trưởng Trường Đại học Công nghệ, Đại học Quốc gia Hà nội.
6. Các thay đổi trong quá trình đào tạo:
7. Tên đề tài luận án: Nghiên cứu kỹ thuật biểu diễn và phân cụm vết trong phát hiện mô hình quy trình.
8. Chuyên ngành: Hệ thống Thông tin 9. Mã số: 9480104.01
10. Cán bộ hướng dẫn khoa học:
Hướng dẫn chính: PGS.TS Nguyễn Trí Thành
Hướng dẫn phụ: PGS.TS Nguyễn Cẩm Tú
Cơ quan công tác: Trường Đại học Công nghệ – ĐH Quốc Gia Hà Nội
Thông tin luận án tiến sĩ của NCS Bùi Thị Hồng Nhung
11. Tóm tắt các kết quả mới của luận án:
Luận án đã đạt được một số kết quả mới như sau:
– Thứ nhất, luận án đề xuất một mô hình biểu diễn vết dựa trên đồ thị khoảng cách Trong đó các hoạt động tương ứng với các đỉnh của đồ thị, các cung là sự kết nối mối quan hệ giữa hai hoạt động. Cách biểu diễn này có thể mô tả thông tin về thứ tự và khoảng cách bậc k giữa các hoạt động trong một vết, làm tăng tính linh hoạt, hiệu quả và cung cấp một giải pháp biểu diễn vết phong phú hơn cho bài toán phân cụm vết.
– Thứ hai, luận án đã đề xuất một độ đo trọng số vết chuẩn hóa NTW cho phép xác định khoảng cách hay mức độ tương tự giữa các vết trong một nhật ký sự kiện sử dụng ý tưởng của độ đo Google. Độ đo NTW cung cấp một phương pháp tính khoảng cách toàn cục giữa các vết trên bối cảnh so sánh chúng với tất cả các vết khác trong nhật ký sự kiện. NTW đã được chứng minh có tính hiệu quả cao hơn, đóng góp một phương pháp đo khoảng cách vết mới nâng cao chất lượng bài toán phân cụm vết trong lĩnh vực khai phá quy trình.
– Thứ ba, luận án đề xuất một thuật toán phân cụm vết mới ContextTracClus dành riêng cho lĩnh vực khai phá quy trình, gồm đề xuất hai khái niệm mới về ngữ cảnh vết và cây ngữ cảnh; đề xuất 3 thuật toán về xây dựng cây ngữ cảnh; xác định ngữ cảnh vết từ cây ngữ cảnh và thuật toán phân cụm vết ContextTracClus cho phép tự động phát hiện số cụm phù hợp và phân cụm các vết thành tập các vết con có sự tương đồng nhau về ngữ cảnh thực hiện. Kết quả thực nghiệm cho thấy các cụm vết được sinh ra từ thuật toán ContextTracClus có hiệu quả cao khi so sánh với thuật toán phân cụm K-means với độ phức tạp và thời gian tính toán cũng được giảm đáng kể.
– Thứ tư luận án đề xuất bốn giải pháp ứng dụng những kết quả nghiên cứu tiên tiến trên thế giới về học sâu vào bài toán biểu diễn vết nhật ký sự kiện, gồm: giải pháp biểu diễn vết cô đọng CompactTrace sử dụng mô hình mạng nơ-ron học sâu DNN; giải pháp biểu diễn vết TraceEmbedding sử dụng mô hình nhúng từ CBOW; giải pháp biểu diễn vết TraceLSTM sử dụng mô hình bộ nhớ dài-ngắn hạn LSTM và giải pháp biểu diễn vết TraceBERTsử dụng mô hình học ngữ cảnh hai chiều BERT. Kết quả đã có những hiệu quả vượt bậc so với các phương pháp biểu diễn vết truyền thống.
12. Khả năng ứng dụng trong thực tiễn
13. Những hướng nghiên cứu tiếp theo:
Trong thời gian tiếp theo, nghiên cứu sinh sẽ tiếp tục nghiên cứu các hướng giải quyết cho các hạn chế còn tồn tại của luận án và tiếp tục triển khai các đề xuất để hoàn thiện hơn các giải pháp biểu diễn và phân cụm vết.
- Một là, cần nghiên cứu và bổ sung ứng dụng những mô hình tiên tiến trên thế giới vào bài toán nâng cao chất lượng mô hình quy trình. Đặc biệt là mô hình mạng nơ-ron đồ thị (Graph neural networks – GNNs) một trong những xu hướng nổi bật hiện nay và tính tương đồng với cấu trúc của mô hình quy trình trong khai phá quy trình. Đồng thời phân tích sâu hơn kết quả các giải pháp đề xuất của luận án với một số các nghiên cứu mới nhất …
- Hai là, mô-đun hóa các nghiên cứu của luận án để có thể ứng dụng các kết quả nghiên cứu vào trong thực tế.
14. Các công trình đã công bố có liên quan đến luận án: …………………………………………….
- [NhungBTH01] Quang-Thuy Ha, Hong-Nhung Bui, and Tri-Thanh Nguyen (2016), “A trace clustering solution based on using the distance graph model”, Proceeding of the 8th International Conference on Computational Collective Intelligence (ICCCI), Lecture Note of Artificial Intelligence (LNAI), Springer, pp. 313-320, (Conference Proceedings Citation Index (CPCI), Scopus, DBLP, Clarivate Analytics’ Web of Science, EI) (có 9 tham chiếu từ các tác giả nước ngoài).
- [NhungBTH02] Hong-Nhung Bui, Quang-Thuy Ha, and Tri-Thanh Nguyen (2018), “A Novel Similarity Measure for Trace Clustering Based on Normalized Google Distance”, JP Journal of Heat and Mass Transfer, Special Volume, Issue III, Advances in Mechanical System and ICT-convergence, Pushpa publishing house, pp. 341-346 (Scopus indexed journal).
- [NhungBTH03] Hong-Nhung Bui, Tri-Thanh Nguyen, Thi-Cham Nguyen, and Quang-Thuy Ha (2018), “A new trace clustering algorithm based on context in process mining”, Proceeding of International Joint Conference on Rough Sets (IJCRS), Lecture Note of Artificial Intelligence (LNAI), Springer, pp. 644-658, (Conference Proceedings Citation Index (CPCI), Scopus, DBLP, Clarivate Analytics’ Web of Science, EI).
- [NhungBTH04] Hong-Nhung Bui, Trong-Sinh Vu, Tri-Thanh Nguyen, Thi-Cham Nguyen, and Quang-Thuy Ha (2019), “A Compact Trace Representation Using Deep Neural Networks for Process Mining”, Proceeding of the 11th IEEE International Conference on Knowledge and Systems Engineering (KSE), pp. 312-316, (DBLP, IEEEXplore) (có 2 tham chiếu từ các tác giả nước ngoài).
- [NhungBTH05] Hong-Nhung Bui, Trong-Sinh Vu, Hien-Hanh Nguyen, Tri-Thanh Nguyen, and Quang-Thuy Ha (2020), “Exploiting CBOW and LSTM Models to Generate Trace Representation for Process Mining”, Proceeding of the 12th Asian Conference on Intelligent Information and Database Systems (ACIIDS), pp. 35-46 (Scopus, DBLP) (có 01 tham chiếu từ các tác giả nước ngoài).