Thứ năm, 10/07/2025 10:19

Trí tuệ nhân tạo hỗ trợ dự đoán biểu hiện gen ung thư niêm mạc miệng

Mới đây, nhóm nhà khoa học tại Đại học Y Dược TP Hồ Chí Minh công bố thành công mô hình học máy giúp đánh giá đặc điểm hóa mô miễn dịch và sinh học phân tử của ung thư biểu mô tế bào gai niêm mạc miệng (OSCC). Đây là bước tiến mới trong chẩn đoán và điều trị tại Việt Nam.

Ung thư, hay còn gọi là bệnh ác tính, xuất phát từ hiện tượng phân chia tế bào mất kiểm soát, có thể dẫn đến di căn qua hệ tuần hoàn máu và bạch huyết. Trong nhóm ung thư đầu - cổ, OSCC là loại phổ biến nhất, chiếm khoảng 90% các ung thư ở miệng, liên quan chặt chẽ tới thói quen hút thuốc, uống rượu và nhai trầu, đặc biệt ở nam giới lớn tuổi tại Việt Nam. Dự án tập trung xây dựng mô hình học máy (SVM và XGBoost) dự đoán phân nhóm bệnh nhân OSCC từ dữ liệu lâm sàng và mô bệnh học, đồng thời triển khai giải trình tự mRNA-seq trên mẫu bệnh phẩm định dạng FFPE parafin. Kết quả là bộ dữ liệu mRNA từ 101 mẫu và dữ liệu mô bệnh học của 206 mẫu được thu thập, trong đó 50 mẫu có thêm dữ liệu hóa mô miễn dịch. Trang web hỗ trợ chẩn đoán đầu tiên tại Việt Nam - https://oscc.vn - đã ra mắt, cho phép truy cập cơ sở dữ liệu, tìm kiếm gen, xem ảnh mô bệnh học, hóa mô miễn dịch, và sử dụng mô hình dự báo biểu hiện gen từ đặc điểm mô học.

Giao diện trang chủ của ossc.vn.

Mô hình học máy đạt độ chính xác khoảng 70,5% (SVM) và 71,4% (XGBoost). 2 phân nhóm OSCC được phân biệt với dấu ấn sinh học khác nhau. Nhóm 1 gồm bệnh nhân lớn tuổi, có tiền sử uống rượu, biểu hiện mô học nặng và phản ứng miễn dịch mạnh (CD8, apoptosis, p53), đồng thời gen SLAIN2+, ADNP+++ và SLK++ cao; nhóm 2 ít uống rượu nhưng có dấu hiệu tăng trưởng tế bào và sửa chữa DNA, tập trung tế bào CD4, biểu hiện SLAIN2-, ADNP++, SLK+, MARCKS+. Các gen như SLAIN2, ADNP, SLK, MARCKS được đề xuất là dấu ấn sinh học phân biệt giữa hai nhóm; nhóm 1 với biểu hiện SLAIN2, ADNP có tiên lượng tốt hơn nhóm 2 biểu hiện MARCKS.

Trong bối cảnh quốc tế, các nghiên cứu trước đây cho thấy ứng dụng học máy (SVM, ANN, LR) và học sâu (deep learning, CNN) trong chẩn đoán, tiên lượng OSCC có độ nhạy và độ đặc hiệu 84-97%, với mô hình CNN đạt AUC khoảng 0,96-0,99. Một số nghiên cứu khác sử dụng mô hình như EfficientNetB3 với phương pháp giải thích LIME, đạt độ chính xác tới 98,3% trong chẩn đoán OSCC từ hình ảnh mô bệnh học. Từ đó, cho thấy tiềm năng kết hợp giữa phân tích gen phân tử và mô học hình ảnh để nâng cao độ tin cậy.

Tại Đại học Y Dược TP Hồ Chí Minh, mô hình hiện tại đã sẵn sàng ứng dụng trong lâm sàng như một công cụ hỗ trợ chẩn đoán, giúp bác sỹ đưa ra gợi ý biểu hiện gen dựa trên đặc điểm mô học. Dữ liệu mRNA và mô học phong phú giảm thiểu chi phí và thời gian cần thiết so với kỹ thuật giải trình tự toàn bộ ngay từ đầu. Đồng thời, cơ sở dữ liệu 15.094 gen từ 101 mẫu giải trình tự và mô học từ 206 mẫu cung cấp nguồn thông tin giá trị phục vụ các nghiên cứu sâu hơn. Mô hình không chỉ giúp phân nhóm bệnh nhân theo cơ chế phân tử, mà còn có thể hỗ trợ thiết kế các xét nghiệm chẩn đoán và liệu pháp trúng đích. Nhóm tác giả cũng kỳ vọng trong tương lai sẽ được hợp tác với các công ty dược phẩm, công nghệ sinh học để phát triển giải pháp xét nghiệm tiên tiến, ít xâm lấn, mang tính cá nhân hóa cao nhằm nâng cao chất lượng sống và tỷ lệ sống sót của bệnh nhân. Tuy nhiên, vẫn còn một số hạn chế trong nghiên cứu như cần tăng cường số lượng để nâng cao độ tin cậy. Ngoài ra, mô hình cần được kiểm định ngoài (external validation) trên bộ dữ liệu độc lập để đảm bảo tính tổng quát. Độ phân giải của công nghệ mRNA-seq từ mẫu FFPE cũng cần được tối ưu hóa để đảm bảo chất lượng đầu vào (như DV200>30%, tỷ lệ aligned trung bình 90%).

NMK (tổng hợp)

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)