Thông tin luận án tiến sĩ của NCS Giang Thành Trung

Tên đề tài luận án: Nghiên cứu một số phương pháp giảm chiều dữ liệu, ứng dụng trong bài toán phân lớp bệnh nhân.

1. Họ và tên nghiên cứu sinh: Giang Thành Trung                                            2. Giới tính: Nam

3. Ngày sinh: 17/02/1986                                                                                   4. Nơi sinh: Sơn La

       5. Quyết định công nhận nghiên cứu sinh số: Quyết định số 642/QĐ-CTSV ngày 15 tháng 09 năm 2014 của Trường Đại học Công nghệ.

6. Các thay đổi trong quá trình đào tạo:

      Thay đổi vai trò của cán bộ hướng dẫn khoa học được thể hiện trong Quyết định số 1126/QĐ-ĐT ngày 30 tháng 12 năm 2016 của Hiệu trưởng Trường Đại học Công nghệ.

      Quyết định gia hạn thời gian học tập được thể hiện trong Quyết định số 881/QĐ-ĐT ngày 14 tháng 09 năm 2017 của Hiệu trưởng Trường Đại học Công nghệ.

     Quyết định trả nghiên cứu sinh về địa phương được thể hiện trong Quyết định số 1131/QĐ-ĐT ngày 17 tháng 10 năm 2019 của Hiệu trưởng Trường Đại học Công nghệ.

     7. Tên đề tài luận án: Nghiên cứu một số phương pháp giảm chiều dữ liệu, ứng dụng trong bài toán phân lớp bệnh nhân.

     8. Chuyên ngành: Hệ thống thông tin                                                     9. Mã số: 9480104.01

    10. Cán bộ hướng dẫn khoa học:  Hướng dẫn chính: PGS. TS. Trần Đăng Hưng

                                                           Cơ quan công tác: Trường Đại học Sư phạm Hà Nội

                                                           Hướng dẫn phụ: TS. Lê Nguyên Khôi

                                                           Cơ quan công tác: Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội

Thông tin luận án tiến sĩ của NCS Giang Thành Trung (tiếng Anh)

11. Tóm tắt các kết quả mới của luận án:

       Thứ nhất, luận án đã nghiên cứu chi tiết hai phương pháp giảm số chiều hiệu quả là Học đa hàm nhân kết hợp giảm chiều dữ liệu (MKL-DR) và Phân tích thành phần chính tăng cường (RPCA), phân tích những ưu, nhược điểm của hai phương pháp. Nghiên cứu cải tiến MKL-DR bằng cách cải thiện hiệu năng về thời gian tính toán, từ đó đề xuất thuật toán fMKL-DR. Phương pháp được đề xuất đã cải thiện đáng kể thời gian thực hiện phương pháp, fMKL-DR đã tăng tính ứng dụng của phương pháp khi các tập dữ liệu hiện nay ngày càng có xu hướng ngày càng tăng về số lượng mẫu quan sát cũng như số lượng đặc trưng.

      Thứ hai, luận án đã xây dựng được hai mô hình nhằm phân lớp bệnh nhân. Các mô hình này áp dụng các phương pháp fMKL-DR và RPCA nhằm giảm chiều dữ liệu. Không chỉ dừng ở giảm chiều dữ liệu, mô hình phân lớp được đề xuất còn bao gồm cả việc tích hợp dữ liệu từ nhiều nguồn khác nhau nhằm tận dụng thông tin hữu ích trong từng loại dữ liệu riêng rẽ. Mô hình phân lớp bệnh nhân được đề xuất phù hợp khi hiện nay, mỗi đối tượng thường được quan sát ở nhiều khía cạnh, mỗi khía cạnh lại mang những thông tin hữu ích khác nhau, do đó, tích hợp thông tin từ các tập dữ liệu khác nhau đang là xu hướng của các phương pháp phân tích dữ liệu hiện đại.

12. Khả năng ứng dụng trong thực tiễn:

       Từ mô hình phân lớp bệnh nhân được đề xuất trong luận án, có thể dễ dàng xây dựng các bộ công cụ phân lớp bệnh nhân ung thư và bệnh nhân Alzheimer để ứng dụng thực tiễn trong chuẩn đoán và điều trị các loại bệnh trên. Ngoài ra, có thể dễ dàng mở rộng xây dựng bộ công cụ phân lớp bệnh nhân đối với các bệnh khác mà có thể thu thập được các tập dữ liệu phù hợp với mô hình đã đề xuất.

13. Những hướng nghiên cứu tiếp theo:

      Tiếp tục nghiên cứu các phương pháp giảm chiều dữ liệu mới được đề xuất làm cơ sở để đề xuất phương pháp giảm chiều dữ liệu mới cũng như cải tiến các phương pháp giảm chiều dữ liệu đã có, tập trung vào các phương pháp giảm chiều dữ liệu ứng dụng được trong các bài toán y sinh học. Tập trung vào nghiên cứu về phương pháp học sâu, do đây là một phương pháp đã được chứng minh là hiệu quả trong giảm chiều dữ liệu.

      Xây dựng một số bộ công cụ giảm chiều dữ liệu phù hợp để xử lý các tập dữ liệu Sinh học phân tử. Trong đó, cơ sở lý thuyết sẽ dựa vào các phương pháp giảm chiều dữ liệu kết hợp tích hợp dữ liệu từ nhiều loại dữ liệu khác nhau để tạo nên tập dữ liệu thống nhất. Đặc biệt, việc kết hợp giữa dữ liệu ảnh và dữ liệu microarray trong chẩn đoán, điều trị các bệnh là một hướng nghiên cứu tiềm năng do bản chất từng loại dữ liệu đó đã chứa nhiều thông tin hữu ích, nếu kết hợp chúng lại sẽ có khả năng nâng cao chất lượng của các mô hình phân tích dữ liệu.

14. Các công trình đã công bố có liên quan đến luận án:

– “Stratifying cancer patients based on multiple kernel learning and dimensionality reduction”, In 2017 9th International Conference on Knowledge and Systems Engineering (KSE), IEEE, pp. 106-111, IEEE Xplore, (2017). (Scopus, DBLP)

– “fMKL-DR: A Fast Multiple Kernel Learning Framework with Dimensionality Reduction”, In International Symposium on Integrated Uncertainty in Knowledge Modelling and Decision Making, Springer, Cham, pp. 153-165, (2018). (DBLP)

– “Stratifying Patients Using Fast Multiple Kernel Learning Framework: Case studies of Alzheimer’s Disease and Cancers”, BMC Medical Informatics and Decision Making, 108 (2020). (ISI Q1, IF = 2.067)

– “A Combination Model of Robust Principal Component Analysis and Multiple Kernel Learning for Cancer Patient Stratification”, The Second International Conference on Artificial Intelligence and Computational Intelligence (AICI 2021), Springer.

Danh mục này gồm 04 công trình.

Bài viết liên quan