Google đầu tư vào trung tâm nghiên cứu AI ở Việt Nam
Các dự án nghiên cứu tại Saigon AI Hub được quyền truy cập sớm vào các công nghệ mới nhất của Google, được hỗ trợ kỹ thuật bởi chuyên gia DeepMind.
10 nhóm nghiên cứu đầu tiên tại Saigon AI Hub:
| Dự án | Mô tả | |
| 1 | Epistemically Disciplined Reasoning |
Phát triển các mô hình ngôn ngữ lớn với khả năng suy luận có hệ thống, tuân theo các ràng buộc nhận thức luận có thể kiểm chứng, nhằm loại bỏ hiện tượng "ảo giác" và nâng cao độ tin cậy khi lập luận. |
|
2 |
Vietnamese Multimodal Emotion |
Xây dựng hệ thống tác tử AI cho phép tìm kiếm nhanh trong kho video khổng lồ bằng ngôn ngữ tự nhiên, thông qua cả tương tác trực tiếp lẫn xử lý tự động. |
|
3 |
Multimodal Lifelog/Video Retrieval |
Xây dựng hệ thống tác tử AI cho phép tìm kiếm nhanh trong kho video khổng lồ bằng ngôn ngữ tự nhiên, thông qua cả tương tác trực tiếp lẫn xử lý tự động. |
|
4 |
SoccerNet-VQA |
Phát triển mô hình đa phương thức để giải quyết các bài toán suy luận thị giác và hỏi - đáp phức tạp trong phân tích bóng đá chuyên nghiệp. |
|
5 |
Human - Robot Interaction (XR/MR) |
Xây dựng nền tảng ứng dụng mô hình ngôn ngữ lớn hỗ trợ tạo mẫu nhanh và thử nghiệm hành vi robot trong môi trường thực tế ảo và thực tế hỗn hợp có độ chân thực cao. |
|
6 |
Vn-SpeechMix |
Giải quyết bài toán tách riêng từng người nói trong môi trường nhiều người nói cùng lúc, đặc biệt với các giọng vùng miền khác nhau tại Việt Nam, sử dụng học sâu. |
|
7 |
AI for Cancer Detection |
Nâng cao khả năng chẩn đoán sớm ung thư đại trực tràng thông qua các mô hình học sâu tự động phân vùng polyp trong hình ảnh nội soi lâm sàng. |
|
8 |
VR Story Train AI |
Xây dựng quy trình tự động chuyển đổi các câu chuyện và nội dung văn bản thành môi trường thực tế ảo 3D có tính tương tác và nhập vai. |
|
9 |
Deepfake Detection |
Phát triển các mô hình pháp y số có khả năng phát hiện nội dung đa phương tiện bị chỉnh sửa, can thiệp, ngay cả trong điều kiện thực tế như mờ, nhiễu hay nén ảnh. |
|
10 |
Text - Guided Distractor Segmentation |
Định nghĩa một bài toán thị giác-ngôn ngữ mới, tự động nhận diện và phân vùng các đối tượng gây xao nhãng, làm giảm sự tập trung vào chủ thể chính của hình ảnh. |