VINIF.2020.DA11 – Big Data Analytics for Vietnamese Overseas (BDAVO)

Chủ nhiệm dự án
TS. Phạm Xuân Lâm
Tổ chức chủ trì
Trường Đại học Kinh tế quốc dân

Hơn 5 triệu người Việt Nam đã và đang sinh sống và làm việc tại nhiều nơi trên thế giới với nhiều trí thức, chuyên gia có trình độ cao và có tầm ảnh hưởng. Đây là nguồn tài nguyên quý giá cho quá trình phát triển và hội nhập của đất nước. BDAVO tập trung vào mảng tổng hợp và xử lý dữ liệu từ nhiều nguồn trong việc khai thác và kết nối tài năng người Việt và gốc Việt ở nước ngoài.  Dự án nghiên cứu và ứng dụng  một số công nghệ Big data, Data mining, Data analytics, Machine learning… để tạo nên một nền tảng góp phần xây dựng nguồn lực cho Hệ sinh thái Đổi mới sáng tạo ở Việc nam.

Một số hướng nghiên cứu và ứng dụng  trong dự án BDAVO:

 • Thu thập từ nhiều nguồn,
 • Bóc tách, xử lý dữ liệu phi cấu trúc
 • Lưu trữ và xử lý song song trên điện toán đám mây.
 • Khai phá dữ liệu lớn, học máy và sắp xếp nhóm
 • Tìm kiếm, gợi ý thông minh
 • Hiển thị thông tin, giao diện thân thiện với người dùng

BDAVO sẽ là “lõi” công nghệ cho ứng dụng VietSearch (www.vietsearch.org) với mục tiêu là máy tìm kiếm dữ liệu Việt bên ngoài Việt Nam (người Việt, công ty Việt, sự kiện Việt) để kết nối hiệu quả giữa người cần và người cung cấp dịch vụ trên thế giới. VietSearch hướng tới là nền tảng “Khai thác tri thức Việt” toàn cầu trong các lĩnh vực khoa học, công nghệ, giáo dục, kinh tế, thiện nguyện, y tế…

Mục tiêu nghiên cứu và ứng dụng của dự án bao gồm:

 • Phát triển một số thuật toán, hệ tri thức, bộ dữ liệu mở trong lĩnh vực phát hiện và tìm kiếm chuyên gia, dịch vụ người Việt toàn cầu;
 • Hợp tác và giới thiệu các chuyên gia người Việt tại nước ngoài cho các sự kiện và các hoạt động nghiên cứu trong nước;
 • Tìm kiếm nhân lực cao cấp cũng như có chuyên môn phù hợp, giúp doanh nghiệp Việt mở rộng thị trường và hợp tác quốc tế;
 • Kết nối, gợi ý và giới thiệu các chuyên gia, dịch vụ của kiều bào cho người Việt du học, làm việc, du lịch… tại nước ngoài;
 • Hỗ trợ chính phủ và cơ quan ngoại giao ở Việt Nam tại nước ngoài trong công tác phát triển cộng đồng và kết nối kiều bào.

Website: https://vietsearch.org/

Chủ nhiệm dự án
TS. Phạm Xuân Lâm
Tổ chức chủ trì
Trường Đại học Kinh tế quốc dân

Tags

Tiến độ dự kiến
01/11/2020
01/07/2021
Giai đoạn 1

– Thu thập dữ liệu về ngành nghề, vị trí, chuyên môn, dịch vụ, các trường Đại học, Viện nghiên cứu, doanh nghiệp hàng đầu thế giới (DataCollection)
– Thu thập dữ liệu của các chuyên gia từ các nguồn dữ liệu công khai (DataCollection)
– Phát triển thuật toán phát hiện chuyên gia người Việt (VietNameDetection), phân loại dữ liệu chuyên gia theo ngành nghề
– Phát triển thuật toán phân thứ hạng chuyên gia (VietExpertRank)
– Phát triển hệ thống xử lý dữ liệu lớn phân tán (DataPipeline)
– Tích hợp vào hệ thống VietSearch
– Nghiên cứu và xây dựng mô hình biểu diễn các tri thức chuyên gia sử dụng ontology. VietExpertOntology
– Hỗ trợ đào tạo 1 nghiên cứu sinh

01/04/2022
Giai đoạn 2

– Cải tiến hệ thống xử lý dữ liệu lớn phân tán (DataPipeline)
– Cải tiến các chức năng bóc tách thông tin và phân loại Chuyên gia (DataCollection)
– Cải tiến VietExpertRank
– Phát triển hệ thống gợi ý chuyên gia theo lĩnh vực, sự kiện VietExpertMatch
– Cải thiện tính năng tìm kiếm, gợi ý chuyên gia sử dụng VietExpertOntology.
– Tích hợp vào hệ thống VietSearch
– Xuất bản báo cáo khoa học

01/10/2022
Giai đoạn 3

– Hoàn thiện các dữ liệu, thí nghiệm và xuất bản báo cáo khoa học
– Hỗ trợ đào tạo 1 Nghiên cứu sinh
– Hoàn thiện các tính năng của VietSearch: quản lý người dùng, chỉnh sửa giao diện, thiết lập các hệ thống monitoring, alert, deployment.
– Xây dựng mô hình kinh doanh cho hệ thống VietSearch