Dự án đặt vấn đề phát triển giải pháp công nghệ IoTs/5G sử dụng kỹ thuật xử lý dữ liệu lớn và trí tuệ nhân tạo cho đô thị thông minh, nhằm giải quyết các thách thức về tính rộng mở, khả năng tái cấu hình và lập trình từ xa thiết bị và ứng dụng IoTs/5G qua các bộ giao thức mạng IoTs/5G không dây, sử dụng uyển chuyển và tối ưu tài nguyên trên hạ tầng điện toán đám mây, hệ thống mạng thông qua các kỹ thuật ảo hóa, lưu trữ và phân tích, xử lý dữ liệu lớn, ứng dụng trí tuệ nhân tạo trong các ứng dụng IoTs/5G ở lĩnh vực đô thị thông minh.

Trên cơ sở đó, các mục tiêu của dự án bao gồm: i) Phát triển hệ thống mạng thử nghiệm IoTs/5G trên hạ tầng điện toán đám mây; ii) Phát triển các thuật toán mới để giải quyết: phân tải các tác vụ tính toán từ thiết bị đầu cuối IoT lên các máy chủ để xử lý nhằm giúp tiết kiệm năng lượng, học trực tuyến để dự đoán mức độ phổ biến của các nội dung số và tối ưu quá trình lưu trữ dữ liệu nhằm cung cấp các dịch vụ nội dung số một cách hiệu quả cho người dùng của đô thị thông minh; và iii) Phát triển các thuật toán học sâu có ngữ cảnh để dự báo dữ liệu được thu thập bởi các thiết bị IoTs/5G.

Vấn đề thách thức cần giải quyết

Giống cá Ellochelon phân bố ở Ấn Độ-Thái Bình Dương, kể cả nước lợ và ngọt. Đến nay, giống này có một loài là Ellochelon vaigiensis được ghi nhận ở ĐBSCL và đây cũng là loài có giá trị thương phẩm cao. Tuy nhiên, quần thể của loài cá này đang phải đối mặt với tình trạng khai thác quá mức, ô nhiễm môi trường và biến đổi khí hậu. Bên cạnh đó, nhiều thông tin về loài cá này vẫn còn chưa được biết đến như bộ gen ty thể, đặc điểm dinh dưỡng, sinh học sinh sản, di cư và cấu trúc quần thể. Giải quyết được các vấn đề nêu trên sẽ tìm ra được giải pháp tối ưu để khai thác hợp lý và bảo tồn loài cá này ở khu vực nghiên cứu.

Mục tiêu dự án

1. Xây dựng được bản đồ phân bố của loài Ellochelon vaigiensis ở khu vực nghiên cứu.

2. Cung cấp được dẫn liệu về trình tự gen COI và Cytb ty thể của loài Ellochelon vaigiensis để phục vụ việc xác định loài và đánh giá đa dạng di truyền tại khu vực nghiên cứu.

3. Cung cấp được dẫn liệu về đặc điểm dinh dưỡng, sinh sản và quần thể của loài Ellochelon vaigiensis tại khu vực nghiên cứu.

4. Đề xuất được giải pháp khai thác hợp lý và bảo tồn loài Ellochelon vaigiensis ở khu vực nghiên cứu.

Tác động xã hội

Kết quả của dự án nhằm góp phần đề xuất giải pháp bảo tồn và khai thác bền vững nguồn lợi của loài Ellochelon vaigiensis ở khu vực nghiên cứu; đồng thời làm cơ sở nghiên cứu sinh sản và nuôi nhân tạo chúng.

Y học chính xác là sự phát triển tất yếu của nền Y học hiện đại. Sự phát triển này gắn liền với những tiến bộ trong việc giải mã bộ gen người. Tuy nhiên bộ gen người lại khác nhau giữa các cá thể và đặc trưng cho từng quốc gia, từng chủng tộc. Chính vì vậy điều kiện tiên quyết để Việt Nam bước vào kỷ nguyên của Y học chính xác là cần có bộ gen tham chiếu đặc trưng cho người Việt và bộ dữ liệu về các biến đổi gen gây bệnh. Dựa trên dữ liệu từ Dự án 1.000 bộ gen người Việt (1KVG) của Viện Nghiên cứu Dữ liệu lớn, VinBigData, Dự án sẽ đưa ra các giải pháp ứng dụng dữ liệu từ bộ gen người vào các dịch vụ chăm sóc sức khoẻ toàn diện cho người dân.

Mục tiêu của dự án

Tác động xã hội

Vấn đề thách thức cần giải quyết: Thực tế đang diễn ra tại các quốc gia trên toàn thế giới trong thời gian cách ly phòng chống dịch Covid-19 cho thấy các ứng dụng họp trực tuyến như Zoom, Microsoft Team, Skype … đã phát huy được tác dụng. Tuy nhiên, có thể nhận thấy các nền tảng này chưa tạo được cảm giác tương tác thực sự và hiệu quả giữa các thành viên tham dự, đặc biệt là trong việc đồng thiết kế sản phẩm hay thực hiện thực hành thí nghiệm đối với các lớp học và lớp thí nghiệm trực tuyến. Vì vậy, một hệ thống immersive VR hỗ trợ hội nghị trực tuyến là cần thiết để khắc phục được nhược điểm của các hệ thống hiện tại. Với hệ thống VR người tham dự sẽ hoàn toàn được hòa vào môi trường ảo, tương tác với các người dùng khác thuận tiện như trong môi trường vật lý.

Mục tiêu dự án

Tác động xã hội

Biến đổi khí hậu toàn cầu, trong đó có mực nước biển dâng và xâm nhập mặn vào trong nội địa là những vấn đề lớn trên thế giới rất quan tâm, vì chúng ảnh hưởng nghiêm trọng đến hệ sinh thái ven biển cũng như nguồn tài nguyên thực vật trên cát ven biển vừa có khả năng sống, sinh trưởng và phát triển trong điều kiện môi trường khô hạn có nồng độ muối cao. Việt Nam nằm trong vùng nhiệt đới, với bờ biển dài trên 3000 km (gồm các đảo), có mức độ đa dạng sinh học cao về hệ sinh thái cũng như các loài thực vật, đặc biệt là các loài cây có ý nghĩa kinh tế vừa chịu hạn cũng như có khả năng chống chịu mặn trên các vùng cát ven biển. Do đó, việc “Xây dựng cơ sở dữ liệu về tài nguyên di truyền một số loài cây chịu mặn ở vùng cát ven biển và một số đảo ở Việt Nam” là cần thiết nhằm đưa ra các giải pháp để bảo tồn và phát triển một số nguồn gen thực vật có khả năng chống chịu trước khi vùng phân bố của chúng bị mất đi do mực nước biển dâng cao.

Mục tiêu của dự án

Tác động xã hội

Cơ sở dữu liệu nguồn gen các loài cây vừa có giá trị kinh tế vừa có khả năng chống chịu mặn và khô hạn làm cơ sở cho việc bảo tồn và phát triển bền vững cho các hệ sinh thái vùng cát ven biển, vừa để phát triển các thành các loại cây trồng có khả năng chống chịu trong tương lai.

Các gonadotropin tự nhiên đã được sử dụng một thời gian dài trong điều trị vô sinh ở người và động vật như hFSH, hLH, hCG, eCG (PMSG), nhưng hiện nay vì lý do vệ sinh và đạo đức, việc sử dụng các gonadotropin tự nhiên ngày càng trở nên khó khăn hơn trong điều trị vô sinh ở người hoặc kiểm soát sinh sản ở động vật. Các công ty dược phẩm lớn hiện nay trên thế giới đã phát triển việc sản xuất các loại wild-type hFSHs tái tổ hợp đang được sử dụng trong điều trị vô sinh ở người. Tuy nhiên hFSH tái tổ hợp được bán trên thị trường cho đến nay là các wild-type hFSHs tái tổ hợp có cấu trúc heterodimeric với thời gian bán hủy nhanh, ngoại trừ phân tử hFSH (Corifollitropin alfa, Elonva®) có thời gian bán hủy dài do gắn thêm thành phần CTP của hCG-β tại đầu C terminus của tiểu đơn vị b của FSH.

Hormon tự nhiên PMSG (Pregnant Mare Serum Gonadotropin), phần lớn được sử dụng trong chăn nuôi gia súc  nhưng gần đây đã bị tranh cãi vì nó đòi hỏi phải lấy máu động vật liên tục và vi phạm quy định về sức khỏe động vật ở nhiều nước. Các công ty dược phẩm thú y chưa cho ra các gonadotropin tái tổ hợp nên trên thị trường không có sẵn eCGs tái tổ hợp. Do đó, điều quan trọng và rất cần thiết hiện nay là sản xuất eCG tái tổ hợp có sẵn cho thị trường chăn nuôi.

Một đặc tính quan trọng được yêu cầu trong sử dụng lâm sàng của gonadotropin tái tổ hợp là chúng phải có thời gian bán hủy đủ dài để tránh tiêm hàng ngày và thay thế bằng tiêm hàng tuần. Để đạt được mục tiêu này, chúng tôi dự định sẽ điều chỉnh trình tự peptide liên kết để cung cấp các hormone với hoạt động lâu dài trong cơ thểvà đặc biệt là dễ tổng hợp hơn trong điều kiện in vitro so với Corifollitropin alfa (Elonva®).

Mục tiêu dự án

Thiết lập và xây dựng quy trình sản xuất hai loại hormone gonadotropin tái tổ hợp có hoạt động sinh học như hormone kích nang trứng (follicle-stimulating hormone, FSH) dài hạn tại Việt Nam:

1 / eCG để kích thích và kiểm soát sinh sản ở vật nuôi

2 / hFSH dùng trong điều trị vô sinh ở người nhưng ở đây, bước đầu là để siêu lọc hoặc đồng bộ hóa trên vật nuôi.

Mục tiêu: Dự án này đề xuất, thiết kế, đánh giá, thử nghiệm hệ thống quan trắc và dự báo chất lượng không khí di động Fi-Mi. Fi-Mi là một hệ thống quan trắc dựa trên các thiết bị nhỏ gọn đặt trên các xe buýt, và sử dụng trí tuệ nhân tạo dự báo chất lượng không khí trong tương lai, cũng như chất lượng không khí ở các vùng không được quan sát bởi thiết bị đo.

Để tối ưu hoá hoạt động của Fi-Mi, dự án đề xuất kiến trúc gồm ba tầng: tầng cảm biến, tầng thông tin, và tầng ứng dụng. Tầng cảm biến bao gồm các thiết bị quan trắc tự chế tạo chứa các mô-đun cảm biến chất lượng không khí. Bằng việc cài đặt các thiết bị quan trắc trên các xe buýt di động, Fi-Mi có khả năng theo dõi một vùng không gian rộng chỉ với một số lượng nhỏ thiết bị. Tầng thông tin đảm nhận việc truyền các thông tin cảm biến từ các thiết bị đo về hệ thống máy chủ trung tâm. Tầng ứng dụng bao gồm hệ thống máy chủ có nhiệm vụ lưu trữ thông tin, xử lý dữ liệu nhằm dự đoán chất lượng không khí. Dự án tập trung vào hai hướng nghiên cứu chính: Nâng cao độ chính xác của việc quan trắc và dự báo các chỉ số chất lượng không khí, nâng cao hiệu quả việc truyền tin.

Ảnh hưởng: Dự án này có ảnh hưởng lớn ở nhiều khía cạnh, bao gồm lý thuyết, thực tiễn và giáo dục. Dự án sẽ thúc đẩy các nghiên cứu lý thuyết liên quan và đạt được nhiều kết quả có tầm ảnh hưởng lớn trong nhiều lĩnh vực như: tối ưu hoá, học sâu, định vị độ chính xác cao, hiệu chỉnh dữ liệu, truyền tin hiệu quả. Về mặt thực tiễn, dự án sẽ xây dựng hệ thống quan trắc chất lượng không khí di động trên toàn thành phố Hà Nội. Dự án cũng sẽ cung cấp thư viện các API về xử lý dữ liệu chất lượng không khí, nhằm giúp các bên thứ ba có thể phân tích và dự đoán chất lượng không khí của họ. Dự án xây dựng và cung cấp cơ sở dữ liệu mở về chỉ số chất lượng không khí của thành phố Hà Nội thu thập được từ hệ thống. Cơ sở dữ liệu mở sẽ giúp các nhà nghiên cứu tiếp cận thông tin đầy đủ về chất lượng không khí ở Hà Nội, thúc đẩy các nghiên cứu liên quan. Về mặt giáo dục, dự án sẽ góp phần đào tạo một số nghiên cứu sinh và thạc sỹ.

Tính cấp thiết. Ung thư đại trực tràng đứng hàng thứ 5 trong số các bệnh lý ác tính tại Việt Nam và nội soi đại tràng toàn bộ nhằm phát hiện các tổn thương polyp, đặc biệt polyp u tuyến, polyp có nguy cơ cao là phương pháp đóng vai trò cơ bản trong tầm soát bệnh lý này. Tỷ lệ bỏ sót polyp đại tràng theo các nghiên cứu trên thế giới dao động từ 20 – 47% và phụ thuộc vào nhiều yếu tố như kinh nghiệm của bác sĩ, thời gian rút dây soi, chất lượng hệ thống máy móc và việc chuẩn bị nội soi đại tràng. Tại Việt Nam, số lượng bệnh nhân có các bệnh lý tiêu hóa đông cùng mô hình bệnh tật đa dạng tạo áp lực lớn cho các trung tâm nội soi dẫn đến các nguy cơ thời gian rút dây nội soi nhanh, chất lượng hình ảnh nội soi có thể không đảm bảo và sự quá tải cũng như mệt mỏi của các bác sĩ. Trong khi đó các đơn vị y tế hiện không đủ điều kiện trang bị các hệ thống nội soi có công nghệ tiên tiến giúp tăng cường chất lượng hình ảnh hoặc các dụng cụ hỗ trợ phát hiện tổn thương và nhận diện những trường hợp có nguy cơ ác tính. Điều này đặt ra bài toán cần có các giải pháp vừa có thể tăng tỷ lệ phát hiện polyp đại tràng đặc biệt là nhóm nguy cơ ung thư cao vừa đảm bảo được tính hiệu quả về chi phí kinh tế cho cả đơn vị y tế và người bệnh.

Mục tiêu của dự án nhằm phát triển các thuật toán học máy hiệu quả cho phát hiện, khoanh vùng polyp đại tràng và phân loại các tổn thương có nguy cơ ung thư hóa qua ảnh nội soi. Từ đó xây dựng một hệ thống thiết bị tính toán thời gian thực hỗ trợ bác sĩ nội soi phát hiện polyp đại tràng và chẩn đoán các tổn thương có nguy cơ ung thư hóa.

Tác động xã hội. Giải pháp công nghệ hỗ trợ bác sĩ nội soi thông qua hệ thống thiết bị chuyên dụng xử lý ảnh nội soi thời gian thực sẽ được đăng ký bằng độc quyền sáng chế, góp phần khẳng định năng lực và ảnh hưởng ứng dụng công nghệ AI trong chăm sóc y tế. Việc triển khai hệ thống AI thời gian thực hỗ trợ bác sỹ nội soi tại các cơ sở y tế bao gồm cả đơn vị có chức năng đào tạo, bệnh viện tuyến trung ương, tuyến tỉnh sẽ giúp kết nối các bác sĩ nội soi, rút ngắn sự khác biệt về kinh nghiệm tay nghề cũng như hướng đến quyền lợi của người bệnh được thụ hưởng dịch vụ khám chữa bệnh tốt với chi phí không quá cao. Dự án cũng sẽ phát triển nền tảng hỗ trợ đào tạo cho các bác sĩ nội soi dựa trên hình ảnh và ca bệnh lâm sàng thực tế thu thập tại các đơn vị y tế. Điều này sẽ giúp nâng cao toàn diện, cập nhật liên tục và chuẩn hóa kiến thức, các tiêu chí đánh giá, phân loại, nhận định tổn thương đại tràng cho các bác sĩ nội soi ở nhiều cơ sở thuộc nhiều tuyến.

Vấn đề thách thức cần giải quyết 

Thu thập dữ liệu quan trắc trực tuyến về chất lượng nguồn nước bao gồm cả nước thải công nghiệp, nước sinh hoạt, nước sông, hồ, nước biển, là vấn đề có tính cấp thiết về mặt kinh tế và xã hội, nhất là trong bối cảnh biến đổi khí hậu ngày càng gia tăng. Dự án cung cấp giải pháp kỹ thuật khả thi áp dụng được trên diện rộng, sử dụng được đối với cả người dân, hộ gia đình (để quan trắc nguồn nước sinh hoạt hàng ngày), và cả đối với các công ty, cơ quan quản lý để quan trắc dữ liệu môi trường và xâm nhập mặn diện rộng.

Mục tiêu dự án Dự án cung cấp giải pháp kỹ thuật mới, chế tạo thiết bị cho phép quan trắc và thu thập dữ liệu trên diện rộng về chất lượng nguồn nước. Thiết bị dựa trên vật liệu cảm biến thế hệ mới, tích hợp phần mềm, GPS, GSM để đo đạc trực tuyến và trực tiếp độ dẫn điện bề mặt, tự động truyền và xử lý dữ liệu. Thiết bị có thể gắn được trên vật thể mang hoặc thả trôi tự do theo dòng nước. Không có thiết bị tương đương trong nước và trên thế giới.

Dự án đưa ra lời giải cho bài toán phân tích dữ liệu lớn được thu thập từ máy móc và thiết bị của các nhà máy sản xuất thông qua các máy cảm biến. Đây là một bài toán thực tế mà hiện nay tất cả các doanh nghiệp đang hướng tới và là nền tảng cơ sở của việc “khai thác dữ liệu công nghiệp” (Industrial data mining). Nghiên cứu này hoàn toàn phù hợp với xu thế chung của “cách mạng công nghiệp 4.0” đang diễn ra ở Việt Nam.

     Cách mạng Công nghiệp 4.0 đã tạo điều kiện thuận lợi cho các nhà máy thông minh (Smart Factory) ra đời. Nhà máy thông minh là nơi hệ thống không gian mạng thực – ảo (Cyber Physical System-CPS) giao tiếp dựa trên kết nối Internet vạn vật (IoT) để hỗ trợ con người và máy móc trong việc thực hiện công việc. CPS là một hệ thống kết nối và tích hợp cao các công cụ máy móc, nhân sự, hệ thống quản lý và thậm chí cả dịch vụ khách hàng. Sự tích hợp này sẽ tạo nên một môi trường dữ liệu lớn. Làm thế nào để giám sát hiệu quả một lượng lớn dữ liệu truyền phát với tần suất cao và thực hiện phân tích dữ liệu hàng loạt sẽ là một thách thức lớn khi phát triển các nhà máy thông minh. Do đó, nhu cầu cấp thiết của việc phát triển một bộ công cụ phân tích dữ liệu lớn đóng một vai trò quan trọng trong hệ thống CPS cho nhà máy thông minh của Công nghiệp 4.0.

     Lý do tại sao phân tích dữ liệu ngày càng trở nên quan trọng, đặc biệt là trong lĩnh vực Công nghiệp 4.0: 1) một lượng lớn dữ liệu chứa nhiều thông tin có giá trị chưa được sử dụng và khai thác đầy đủ; 2) với sự phát triển của công nghệ cảm biến, chi phí và công nghệ thu thập dữ liệu trở nên dễ dàng hơn; 3) các công nghệ phần mềm và phần cứng như điện toán đám mây đã tăng sức mạnh tính toán của thiết bị và có thể nhanh chóng xử lý lượng lớn dữ liệu; 4) quy trình sản xuất ngày càng phức tạp, không thể dựa vào kinh nghiệm của con người để quản lý toàn bộ hệ thống.

     Dự án này nghiên cứu đề xuất một mô hình phân tích dữ liệu cho chuỗi dữ liệu lớn có tần suất cao trong công nghiệp sản xuất thông minh. Mô hình được đề xuất gồm hai giai đoạn. Giai đoạn 1, chuỗi dữ liệu lớn được dò tìm và lọc để loại bỏ các tính năng bất thường có thể gây ra lỗi trong sản xuất. Trong giai đoạn 2, các dữ liệu bất thường này được phân tích để tìm ra các nhân tố chính từ các máy công cụ gây ảnh hưởng đến chất lượng sản phẩm trong nhà máy sản xuất thông minh.

     Mô hình phân tích dữ liệu lớn đề xuất trong dự án này được kỳ vọng sẽ trở thành thành phần cốt lõi của nền tảng phân tích dữ liệu lớn trong công nghiệp, với các công cụ có thể nhanh chóng tìm kiếm nguyên nhân chính của sự bất thường trong chuỗi dữ liệu lớn có liên quan đến quá trình sản xuất tại các máy công cụ . Bên cạnh đó, mô hình phân tích dữ liệu được đề xuất còn đáp ứng được các mục tiêu sau: 1) cung cấp bộ công cụ để đáp ứng các yêu cầu xử lý nhanh chóng của dữ liệu lớn trong công nghiệp; 2) tăng tốc việc lựa chọn tính năng trong dữ liệu hàng loạt và dữ liệu đa chiều; và 3 ) truyền các quy trình phân tích dữ liệu để phân tích nguyên nhân và nhu cầu xác suất của quá trình chuyển đổi trạng thái sản xuất.