Những tiến bộ trong học sâu đã mở ra một kỷ nguyên đột phá cho những đổi mới sáng tạo về công nghệ nhờ đó máy móc có thể “học” từ lượng dữ liệu khổng lồ và đạt được độ chính xác đáng kinh ngạc trong các tác vụ như nhận diện hình ảnh, xử lý ngôn ngữ tự nhiên và đưa ra quyết định.
Thành tựu này có được là nhờ những đóng góp mang tính cách mạng cho mạng nơ-ron và các thuật toán học sâu của Giáo sư Geoff E. Hinton, Giáo sư Yann LeCun và Giáo sư Yoshua Bengio. Bên cạnh đó, ông Jen-Hsun Huang đã tiên phong trong việc phát triển các nền tảng điện toán tăng tốc, thúc đẩy sự bùng nổ của kỷ nguyên AI (Trí tuệ nhân tạo) hiện đại. Việc Giáo sư Fei-Fei Li tạo ra tập dữ liệu ImageNet cũng đã thúc đẩy sự tiến bộ trong hệ thống nhận diện hình ảnh, giúp huấn luyện các mô hình học sâu ở quy mô lớn.
Giải thưởng Chính VinFuture 2024 đã được trao cho 5 nhà khoa học: Giáo sư Yoshua Bengio và Giáo sư Geoffrey E. Hinton (Canada), Ông Jen-Hsun Huang, Giáo sư Yann LeCun và Giáo sư Fei-Fei Li (Mỹ).
Từ năm 2012, học sâu đã trở thành công cụ chủ đạo thúc đẩy các bước tiến lớn trong nhiều lĩnh vực như chăm sóc sức khỏe tự động hóa, dịch vụ tài chính, từ đó định hình sự đổi mới, phát triển trong tương lai.
Công trình tiên phong của Giáo sư Yoshua Bengio
Công trình tiên phong của Giáo sư Yoshua Bengio về mạng nơ-ron bao gồm những tiến bộ quan trọng trong học biểu diễn (representation learning) và các mô hình tạo sinh (generative models). Việc mô hình hóa từ ngữ trong không gian đa chiều được ông đề cập trong bài báo nghiên cứu công bố vào năm 2000 với tiêu đề "A Neural Probabilistic Language Model” đóng vai then chốt trong các tác vụ xử lý ngôn ngữ tự nhiên (NLP) ví dụ như dịch ngôn ngữ và trả lời câu hỏi.
Ông cũng có đóng góp nền tảng đối với việc phát triển Mạng đối nghịch tạo sinh (GANs) dẫn tới sự cách mạng hóa trong lĩnh vực thị giác máy tính và học sâu. Nghiên cứu của ông tiếp tục thúc đẩy những tiến bộ cả về lý thuyết và ứng dụng thực tiễn trong nhiều ngành công nghiệp.
Những đóng góp của Giáo sư Bengio đã trở thành một phần thiết yếu trong các hệ thống học sâu hiện đại, đặc biệt là trong xử lý ngôn ngữ tự nhiên (NLP). Công trình của ông đã tạo điều kiện để phát triển các công cụ như trợ lý ảo và công cụ dịch ngôn ngữ, cho phép hàng triệu người trên thế giới được tiếp cận với các công nghệ này. Các nghiên cứu của ông tiếp tục định hình các lĩnh vực liên quan đến học sâu từ việc chế tạo robot đến phát triển y học cá nhân hóa.
Những đổi mới của Bengio đã cho phép các hệ thống “học” và tạo dữ liệu với độ chính xác đáng kinh ngạc. Những đổi mới này đặc biệt quan trọng trong việc tạo ra các giải pháp dựa trên trí tuệ nhân tạo để giải quyết các thách thức toàn cầu, chẳng hạn như cải thiện dịch vụ chăm sóc sức khỏe và thúc đẩy phát triển môi trường bền vững.
Công trình kiến trúc mạng nơ-ron của Giáo sư Geoffrey Hinton
Giáo sư Geoffrey Hinton được ghi nhận bởi vai trò lãnh đạo và công trình nghiên cứu nền tảng của ông về kiến trúc mạng nơ-ron. Bài báo xuất bản năm 1986 của ông cùng với David Rumelhart và Ronald Williams đã cho thấy các biểu diễn phân tán trong mạng nơ-ron được huấn luyện bởi thuật toán lan truyền ngược.
Phương pháp này đã trở thành công cụ tiêu chuẩn trong lĩnh vực trí tuệ nhân tạo và tạo ra các tiến bộ trong nhận diện hình ảnh và giọng nói. Lĩnh vực thị giác máy tính và nhận diện giọng nói đã có những bước tiến dài nhờ các nghiên cứu của ông về Máy Boltzmann, các cải tiến trong mạng nơ-ron tích chập (CNNs) và đặc biệt là với thành công của ông cùng cộng sự tại cuộc thi ImageNet.
Những đổi mới của Giáo sư Hinton đã cách mạng hóa lĩnh vực học sâu và phát triển các mạng nơ-ron điều khiển các công nghệ như nhận diện giọng nói và thị giác máy tính. Những hệ thống này đã được áp dụng rộng rãi và đem lại lợi ích cho hàng tỷ người trên toàn thế giới.
Bằng cách tinh chỉnh kiến trúc của các mạng nơ-ron sâu và sử dụng các tập dữ liệu lớn để huấn luyện chúng, Giáo sư Hinton đã mở ra những hướng đi mới cho nghiên cứu và ứng dụng trí tuệ nhân tạo, từ đó tạo tiền đề cho những tiến bộ trong phát triển các mô hình trí tuệ nhân tạo và các hệ thống tự động.
Công trình của Chủ tịch NVIDIA Jensen Huang
Ông Jensen Huang được ghi nhận vì vai trò lãnh đạo mang tầm nhìn chiến lược trong việc chuyển đổi các bộ xử lý đồ họa (GPUs) thành công cụ mạnh mẽ phục vụ cho học sâu và điện toán tăng tốc. Với vai trò đồng sáng lập NVIDIA, ông Huang đã lãnh đạo việc phát triển nền tảng CUDA (Compute Unified Device Architecture - Kiến trúc thiết bị tính toán hợp nhất) giúp lập trình GPU để xử lý hiệu quả các yêu cầu tính toán khổng lồ của học sâu.
Công trình đoạt giải 3 triệu USD VinFuture 2024: Đỉnh cao Trí tuệ nhân tạo và mạng nơ-ron- Ảnh 2.
Chủ tịch NVIDIA Jensen Huang.
Đột phá này đã cho phép huấn luyện nhanh chóng các mạng nơ-ron và khiến GPU trở thành công cụ thiết yếu trong việc nghiên cứu và phát triển trí tuệ nhân tạo trên toàn thế giới. Sự lãnh đạo của ông đã thúc đẩy hàng loạt đột phá trong các lĩnh vực như nhận diện giọng nói tự động, xử lý ngôn ngữ tự nhiên, thị giác máy tính, robot, và phát triển hệ thống tự động.
Những đóng góp của ông Huang đã thúc đẩy GPU trở thành yếu tố thiết yếu trong nghiên cứu trí tuệ nhân tạo hiện đại, đẩy nhanh sự đổi mới trong các lĩnh vực như nhận diện giọng nói, xe tự lái, xử lý hình ảnh y tế và xử lý ngôn ngữ. Ngày nay, học sâu tăng tốc bằng GPU đang thúc đẩy nhiều tiến bộ như các mô hình trí tuệ nhân tạo phổ biến hiện nay hay các công cụ chẩn đoán và chăm sóc sức khỏe, mang lại lợi ích cho hàng triệu người trên thế giới.
Bằng cách dân chủ hóa khả năng tiếp cận với điện toán tăng tốc, ông Huang đã định hình lại bối cảnh nghiên cứu học sâu và các ứng dụng của nó trong nhiều ngành công nghiệp. Những đổi mới của ông cho phép các nhà nghiên cứu xử lý dữ liệu lớn với hiệu suất chưa từng có và mở rộng giới hạn của trí tuệ nhân tạo, thúc đẩy các giải pháp để đối phó với các thách thức toàn cầu.
Mạng nơ-ron tích chập cho thị giác máy tính của Giáo sư Yann LeCun
Giáo sư Yann LeCun được ghi nhận bởi công trình tiên phong của ông trong việc phát triển các mạng nơ-ron tích chập (CNNs), một mô hình quan trọng trong việc phát triển công nghệ nhận diện hình ảnh và học sâu. Công trình của ông về CNNs vào cuối những năm 1980 đã đặt nền móng cho quá trình học tự động các đặc trưng hình ảnh phân cấp, điều này rất quan trọng trong các tác vụ như phát hiện đối tượng và nhận diện khuôn mặt. Ông còn có nhưng đóng góp quan trọng trong phương pháp học không giám sát, các mô hình năng lượng và các kỹ thuật lan truyền ngược hiệu quả.
Những đổi mới của Giáo sư LeCun đã thúc đẩy sự đột phá trong các ngành công nghiệp sử dụng công nghệ xử lý hình ảnh, từ chẩn đoán y tế đến lái xe tự động. CNNs hiện đã trở thành tiêu chuẩn trong các ứng dụng trí tuệ nhân tạo mà hàng tỷ người sử dụng mỗi ngày, đóng vai trò trung tâm trong sự phát triển của các công nghệ như nhận diện khuôn mặt và xử lý hình ảnh y tế.
Công trình của Giáo sư LeCun đã thay đổi căn bản cách mà máy móc diễn giải dữ liệu hình ảnh, cho phép các hệ thống trở nên thông minh và đáp ứng tốt hơn. Những đóng góp của ông đã giúp các hệ thống trí tuệ nhân tạo làm việc hiệu quả hơn trong các nhiệm vụ như chăm sóc y tế cá nhân hóa, cải thiện an toàn bảo mật, nâng cao hiệu quả tự động hóa, từ đó mang lại lợi ích cho xã hội trên phạm vi toàn cầu.
Công trình thị giác máy tính
Giáo sư Fei-Fei Li được ghi nhận vì những đóng góp tiên phong của bà trong lĩnh vực thị giác máy tính và phát triển bộ dữ liệu ImageNet. Sự lãnh đạo của bà trong dự án ImageNet đã cách mạng hóa việc nhận diện hình ảnh bằng cách tạo ra một bộ dữ liệu lớn, có nhãn, cho phép máy móc nhận diện và phân loại đối tượng một cách chính xác hơn. ImageNet đã đặt nền tảng cho việc huấn luyện các mô hình học sâu và thúc đẩy phát triển các tác vụ như phát hiện đối tượng, nhận diện khuôn mặt, và phân loại hình ảnh. Công trình của Giáo sư Li là một ví dụ điển hình về tầm quan trọng của dữ liệu trong việc huấn luyện các hệ thống trí tuệ nhân tạo, ảnh hưởng đến cách tiếp cận thông qua dữ liệu được sử dụng trong nhiều lĩnh vực.
ImageNet là động lực thúc đẩy sự tiến bộ của thị giác máy tính và học sâu. Việc các nhà nghiên cứu áp dụng nó đã kích thích sự đổi mới trong các ngành công nghiệp phụ thuộc vào dữ liệu hình ảnh. Bộ dữ liệu này đóng vai trò quan trọng trong việc phát triển lĩnh vực thị giác máy tính, giúp lĩnh vực này tiếp cận và ứng dụng học sâu.
Những đóng góp của Giáo sư Li đã thay đổi cách các hệ thống học sâu xử lý và hiểu thông tin hình ảnh, tạo điều kiện cho những tiến bộ trong các lĩnh vực như lái xe tự động, chẩn đoán y tế và hệ thống an ninh thông minh. Bằng cách mở rộng giới hạn mà máy móc có thể quan sát và diễn giải, công trình của bà đã thúc đẩy sự đổi mới trong lĩnh vực thị giác máy tính và mang lại lợi ích cho toàn xã hội.