VINIF.2025.DA001 – Phát triển nền tảng dữ liệu ADN quy mô lớn nhằm cải thiện việc định danh hài cốt liệt sỹ ở Việt Nam

Chủ nhiệm dự án
TS. Trần Trung Thành
Tổ chức chủ trì
Viện Sinh học, Viện Hàn lâm KHCN Việt Nam

Dự án hướng đến phát triển một nền tảng DNA quy mô lớn và toàn diện nhằm hỗ trợ nâng cao việc xác định danh tính các liệt sĩ (IFS) tại Việt Nam, bằng cách sử dụng các công nghệ giải gen hiệu năng cao, chi phí thấp cùng với các phương pháp phân tích và quản lý dữ liệu tiên tiến.
Dự án bao gồm các mục tiêu sau:

  • Xây dựng một tập hợp toàn diện các biến thể đơn nucleotide (SNP) làm dấu hiệu quả cho việc xác định danh tính các liệt sĩ (IFS).
  • Tạo dữ liệu SNP cho 2.500 mẫu người Việt Nam bằng cách sử dụng vi mảng tùy chỉnh (customized microarrays) bao phủ các SNP đã được chọn cho IFS.
  • Xây dựng nền tảng phân tích và quản lý dữ liệu cho các SNP đã chỉ định nhằm hỗ trợ quá trình xác định danh tính liệt sĩ trong cộng đồng người Việt một cách hiệu quả và chính xác.
Chủ nhiệm dự án
TS. Trần Trung Thành
Tổ chức chủ trì
Viện Sinh học, Viện Hàn lâm KHCN Việt Nam

Tags

Tiến độ dự kiến
19/12/2025
19/08/2026
Giai đoạn 1
  • Thông tin hồ sơ và mẫu sinh phẩm của 1000 mẫu người Việt Nam từ các nhóm dân tộc/địa lý khác nhau.
  • Báo cáo kết quả phân tích kiểu gen của 1000 mẫu bằng microarray tùy chỉnh
    (≥ 99% mẫu được phân tích kiểu gen thành công; tỷ lệ gọi SNP trung bình trên tất cả các mẫu ≥ 95%).
  • Báo cáo kết quả dữ liệu kiểu gen từ 1000 mẫu
    (Áp dụng đầy đủ các chỉ số QC (ví dụ: HWE, tỷ lệ bị thiếu, MAF, v.v.).
19/04/2027
Giai đoạn 2
  • Thông tin hồ sơ và mẫu sinh phẩm của 24 mẫu hài cốt liệt sĩ
  • Kết quả tách chiết, tinh sạch, định tính và định lượng DNA từu mẫu sinh phẩm của 24 hài cốt liệt sĩ
  • Báo cáo quá trình giải trình tự gen 24 mẫu hài cốt
    (Tất cả các mẫu được giải trình tự trên NextSeq1000)
  • Báo cáo kết quả đánh giá số lượng và chất lượng dữ liệu giải trình tự. Xử lý dữ liệu thô
    (≥ 90% các mẫu được giải trình tự thành công)
19/12/2027
Giai đoạn 3
  • Phần mềm phân tích quan hệ huyết thống:
    Chức năng nền tảng của phần mềm, có khả năng phân tích mở rộng và bảo mật, được phát triển để hỗ trợ quy trình phân tích IFS dựa trên SNP; hỗ trợ nhập dữ liệu, QC, phân tích quan hệ họ hàng và đưa ra báo cáo.
  • Báo cáo kết quả nguồn dữ liệu tham chiếu trên quần thể Việt Nam cho mẫu hài cốt:
    Cơ sở dữ liệu tham chiếu được xây dựng bao gồm tần số alen và dữ liệu kiểu gen từ ≥ 2.475 cá thể Việt Nam (99% tổng số mẫu có kiểu gen); bao gồm siêu dữ liệu về dân tộc/địa lý.
  • Báo cáo kết quả tần số alen của các SNP được chỉ định:
    – Tần số alen được tinh chỉnh của ≥ 5.000 SNPs.
    – Độ phù hợp của tần số alen ≥ 0,95 với tập con giải trình tự toàn bộ hệ gen.
    – Độ bao phủ của ≥ 95% SNP được chọn lọc (≥ 5.000 SNP).
  • Báo cáo kết quả nền tảng chia sẻ dữ liệu tham chiếu với cộng đồng khoa học:
    – Thời gian hoạt động của trang web ≥ 99% (thời gian thử nghiệm).
    – Thời gian phản hồi truy vấn trung bình ≤ 5 giây.
    – ≥ 1.000 chỉ thị SNP có sẵn để truy cập công khai.
  • Báo cáo kết quả các thuật toán quan hệ họ hàng áp dụng cho dự án:
    – Triển khai ≥ 3 mô-đun cốt lõi (sàng lọc từng cặp, suy luận IBD, đánh giá LR).
    – Chuẩn hiệu suất tính toán: xử lý 1.000 cặp mẫu trong vòng < 24 giờ trên cụm.
    – Độ chính xác ≥ 95% trong việc phân biệt họ hàng bậc 1, bậc 2, bậc 3 (dựa trên các gia đình tham chiếu).
  • Báo cáo kết quả phân tích quan hệ họ hàng trên các mẫu thu thập được:
    – ≥ 200 mẫu xét nghiệm theo gia đình.
    – Độ nhạy và độ đặc hiệu ≥ 90% đối với quan hệ họ hàng đến đời thứ 3.
    – Tỷ lệ dương tính giả ≤ 5%.
    – Độ phù hợp xác nhận với phả hệ đã biết ≥ 90%.
  • Báo cáo kết quả Nghiên cứu điển hình về xác định danh tính hài cốt liệt sĩ:
    – Thời gian xử lý trung bình cho mỗi trường hợp < 4 tuần.
    – Hồ sơ được ủy ban pháp y IB-VAST phê duyệt.
  • Báo cáo kết quả nền tảng cơ sở dữ liệu tham chiếu thông qua nghiên cứu điển hình:
    – Đường dẫn cho cập nhật cơ sở dữ liệu đang hoạt động (có thể cập nhật hàng quý).
  • Báo cáo đánh giá hiệu suất cuối cùng được nộp cho VINIF.
  • 01 bài báo thuộc danh mục SCIE, hạng Q1 và 01 bài báo tạp chí trong nước uy tín được đăng/ chấp nhận đăng