Trở Lại

Nền tảng cho việc xây dựng và gán nhãn dữ liệu thị giác quy mô lớn cho các ứng dụng Trí tuệ Nhân tạo

2 lượt xem

Nền tảng cho việc xây dựng và gán nhãn dữ liệu thị giác quy mô lớn cho các ứng dụng Trí tuệ Nhân tạo

2020-04-06 18:48:53

Tổ chức chủ trì: Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Tp. Hồ Chí Minh
Chủ nhiệm dự án: PGS.TS. Trần Minh Triết

Mục đích của dự án:

  • Xây dựng nền tảng thông minh để tạo và gán nhãn các dữ liệu hình ảnh. Hệ thống hỗ trợ việc gán nhãn bằng cách học từ các dữ liệu có nhãn (AI-in-the-loop), mở rộng tập dữ liệu được gán nhãn với sự hỗ trợ của các thuật toán học thông minh. Hệ thống còn cho phép tổng hợp và phát sinh thêm dữ liệu trên những domain mới còn thiếu hay chưa có dữ liệu.
  • Phát triển các thuật toán mới cho các bài toán quan trọng và phổ biến trong Thị giác Máy tính.
  • Xây dựng các tập dữ liệu lớn và được gán nhãn giàu ngữ nghĩa cho các bài toán ở Việt Nam trong 3 lĩnh vực: (i) phân tích video giao thông; (ii) phân tích và chẩn đoán từ ảnh y khoa; (iii) phát sinh câu mô tả từ ảnh trong ngữ cảnh Việt Nam.
  • Phát triển những giải pháp mới cho các vấn đề thực tiễn ở Vietnam trong 3 lĩnh vực: (i) phân tích dữ liệu giao thông; (ii)  phân tích và chẩn đoán trên ảnh y khoa; (iii) truy vấn dữ liệu lớn từ nhật ký sinh hoạt và các hoạt động thường nhật.

Kết quả đạt được:

Đã thực hiện:

  • Kỳ thi quốc tế:
    • Hạng 5 cuộc thi  AI City Challenge 2020 (track Traffic Anomaly Detection), tổ chức trong hội nghị CVPR 2020
    • Hạng 10 cuộc thi AI City Challenge 2020 (track Vehicle Counts by Class at Multiple Intersections), tổ chức trong hội nghị CVPR 2020
    • Hạng 1 cuộc thi SHREC 2020 (track  Retrieval and Classification of Relief Surface Patches), tổ chức trong hội nghị EuroGraphics 2020
  • Tập dữ liệu:
    • Đã xây dựng tập dữ liệu về các sự kiện bất thường (anomaly events) trong cuộc sống hằng ngày với các sự kiện như: ngập lụt, hỏa hoạn, cây ngã, kẹt xe, tai nạn giao thông… Hiện tập dữ liệu đã có trên 10000 ảnh và tiếp tục được bổ sung, mở rộng.
    • Đã xây dựng tập dữ liệu phát hiện các loại khối u trong ảnh nội soi đường ruột dựa trên tập dữ liệu BioMedia 2019 Development dataset và KVASIR dataset v2 (4470 ảnh với 4944 đối tượng).

Đang thực hiện:

  • Platform phục vụ việc gán nhãn và phát sinh dữ liệu liên quan thị giác
    • Đang xây dựng kiến trúc và các tính năng cơ bản cho platform phục vụ việc gán nhãn và phát sinh dữ liệu liên quan thị giác

Một số kết quả phụ (ngoài danh sách sản phẩm đăng ký):

  • 02 bài báo nhận đăng tại hội nghị ACM International Conference on Multimedia Retrieval ICMR 2020 (Rank A2 theo Qualis)
  • 01 bài báo nhận đăng tại CVPR Workshop 2020
  • Hướng dẫn sinh viên đạt được 1 Giải Nhất, 1 Giải Nhì, 1 Giải Ba sinh viên nghiên cứu khoa học toàn quốc (Eureka 2019) trong lĩnh vực Công nghệ Thông tin

Tiến độ dự kiến


01/09/2019
GIAI ĐOẠN 1 (12 THÁNG)
Sản phẩm giai đoạn 1:
  • 01 Báo cáo tổng hợp theo giai đoạn 1
  • Nộp 01 bài báo quốc tế (Q1) hay hội thảo hàng đầu
  • Phiên bản thử nghiệm thứ nhất của hệ thống gán nhãn và tạo dữ liệu liên quan thị giác.
01/09/2020
GIAI ĐOẠN 2 (12 THÁNG)
Sản phẩm giai đoạn 2:
  • 01 Báo cáo tổng hợp theo giai đoạn 2
  • Nộp 02 bài báo quốc tế (Q1) hay hội thảo hàng đầu
  • Phiên bản thử nghiệm thứ hai của hệ thống gán nhãn và tạo dữ liệu liên quan thị giác, có hỗ trợ thêm tính năng phục vụ mục tiêu (G2) và (G3).
  • gán nhãn trong lĩnh vực giao thông
  • Phiên bản đầu tiên của bộ dữ liệu (dataset) có gán nhãn trong lĩnh vực hỗ trợ chẩn đoán ảnh y tế.
  • Phiên bản đầu tiên của bộ dữ liệu (dataset) có gán nhãn trong trong lĩnh vực hoạt động hàng ngày của cuộc sống
  • 01 chứng nhận top 10 kỳ thi quốc tế uy tín
01/09/2021
GIAI ĐOẠN 3 (12 THÁNG)
Sản phẩm giai đoạn 3:
  • 01 Báo cáo tổng hợp theo giai đoạn 3
  • Nộp 02 bài báo quốc tế (Q1) hay hội thảo hàng đầu
  • Phiên bản thử nghiệm thứ ba của hệ thống gán nhãn và tạo dữ liệu liên quan thị giác, có hỗ trợ thêm tính năng phục vụ mục tiêu (G4).
  • Phiên bản được hiệu chỉnh của bộ dữ liệu (dataset) có gán nhãn trong lĩnh vực giao thông
  • Phiên bản được hiệu chỉnh của bộ dữ liệu (dataset) có gán nhãn trong lĩnh vực hỗ trợ chẩn đoán ảnh y tế.
  • Phiên bản được hiệu chỉnh của bộ dữ liệu (dataset) có gán nhãn trong trong lĩnh vực hoạt động hàng ngày của cuộc sống
  • Chấp nhận đơn Sở hữu trí tuệ: sáng chế hay giải pháp hữu ích
  • 01 chứng nhận top 10 kỳ thi quốc tế uy tín
01/09/2022

Tiến độ thực tế


01/09/2019
GIAI ĐOẠN 1 (12 THÁNG)
3 lần đạt được top 10 kỳ thi quốc tế uy tín:
  • + Hạng 5 cuộc thi AI City Challenge 2020 (track Traffic Anomaly Detection), tổ chức trong hội nghị CVPR 2020
  • + Hạng 10 cuộc thi AI City Challenge 2020 (track Vehicle Counts by Class at Multiple Intersections), tổ chức trong hội nghị CVPR 2020
  • + Hạng 1 cuộc thi SHREC 2020 (track Retrieval and Classification of Relief Surface Patches), tổ chức trong hội nghị EuroGraphics 2020
Tập dữ liệu:
  • Đã xây dựng tập dữ liệu về các sự kiện bất thường (anomaly events) trong cuộc sống hằng ngày với các sự kiện như: ngập lụt, hỏa hoạn, cây ngã, kẹt xe, tai nạn giao thông… Hiện tập dữ liệu đã có trên 10000 ảnh và tiếp tục được bổ sung, mở rộng.
  • Đã xây dựng tập dữ liệu phát hiện các loại khối u trong ảnh nội soi đường ruột dựa trên tập dữ liệu BioMedia 2019 Development dataset và KVASIR dataset v2 (4470 ảnh với 4944 đối tượng).
Hệ thống gán nhãn và tạo dữ liệu liên quan thị giác:
  • Đang xây dựng kiến trúc và các tính năng cơ bản cho platform phục vụ việc gán nhãn và phát sinh dữ liệu liên quan thị giác
Một số kết quả phụ (ngoài danh sách sản phẩm đăng ký):
  • 02 bài báo nhận đăng tại hội nghị ACM International Conference on Multimedia Retrieval ICMR 2020 (Rank A2 theo Qualis)
  • 01 bài báo nhận đăng tại CVPR Workshop 2020
  • Hướng dẫn sinh viên đạt được 1 Giải Nhất, 1 Giải Nhì, 1 Giải Ba sinh viên nghiên cứu khoa học toàn quốc (Eureka 2019) trong lĩnh vực Công nghệ Thông tin
01/09/2020
GIAI ĐOẠN 2 (12 THÁNG)
01/09/2021
GIAI ĐOẠN 3 (12 THÁNG)
01/09/2022
Mã số dự án: VINIF.2019.DA19
tags: VINIF VINBDI