Google đang thành lập một nhóm mới để xây dựng trí tuệ nhân tạo có thể mô phỏng thế giới vật lý

Google đang thành lập một nhóm mới để làm việc trên các mô hình trí tuệ nhân tạo có thể mô phỏng thế giới vật lý.

Tim Brooks - một trong những người đồng chủ nhiệm dự án tạo video của OpenAI, Sora, đã rời bỏ và gia nhập vào Google DeepMind, phòng nghiên cứu trí tuệ nhân tạo của Google vào tháng 10 - sẽ dẫn dắt nhóm mới này, anh ấy thông báo trong một bài đăng trên X. Đây sẽ là một phần của Google DeepMind.

“DeepMind có kế hoạch tham vọng để tạo ra các mô hình sinh tạo khổng lồ có thể mô phỏng thế giới,” Brooks viết vào sáng thứ Hai. “Tôi đang tuyển dụng cho một nhóm mới với nhiệm vụ này.”

Theo danh sách công việc mà Brooks đã liên kết trong bài đăng của mình, nhóm mô hình hóa mới sẽ hợp tác và xây dựng trên công việc từ các nhóm Gemini, Veo và Genie của Google để giải quyết “những vấn đề mới rất quan trọng” và mở rộng các mô hình “lên mức cao nhất của sự tính toán.” Gemini là loạt mô hình trí tuệ nhân tạo của Google cho các nhiệm vụ như phân tích hình ảnh và tạo văn bản, trong khi Veo là mô hình tạo video của Google.

Về Genie, đó là cách Google tạo ra một mô hình thế giới - trí tuệ nhân tạo có thể mô phỏng trò chơi và môi trường 3D trong thời gian thực. Mô hình Genie mới nhất của Google, được giới thiệu vào tháng 12, có thể tạo ra một loạt các thế giới 3D chơi được.

Một thế giới tương tác giống như trò chơi được tạo ra bởi mô hình Genie 2 của DeepMind. Image Credits:DeepMind

“Chúng tôi tin rằng việc mở rộng [huấn luyện trí tuệ nhân tạo] trên dữ liệu video và đa phương tiện đang trên đường cần thiết đến thông minh nhân tạo tổng quát,” một trong những mô tả công việc nói. Trí tuệ nhân tạo tổng quát, hoặc AGI, thường đề cập đến trí tuệ nhân tạo có thể hoàn thành bất kỳ nhiệm vụ nào mà con người có thể thực hiện. “Các mô hình thế giới sẽ là động lực cho nhiều lĩnh vực, như lập luận hình ảnh và mô phỏng, lập kế hoạch cho các tác nhân có thể di chuyển và giải trí tương tác thời gian thực.”

Theo mô tả, nhóm mới của Brooks sẽ tìm cách phát triển các công cụ “tạo ra tương tác thời gian thực” trên cơ sở các mô hình họ xây dựng, và nghiên cứu cách tích hợp các mô hình của họ với các mô hình đa phương tiện hiện có như Gemini.

Một số công ty mới và công ty công nghệ lớn đang đuổi theo mô hình thế giới, bao gồm World Labs của nhà nghiên cứu trí tuệ nhân tạo có ảnh hưởng Fei-Fei Lee, upstart Decart của Israel và Odyssey. Họ tin rằng mô hình thế giới có thể được sử dụng một ngày nào đó để tạo ra phương tiện tương tác, như trò chơi video và phim ảnh, và chạy các mô phỏng có thể học bằng cách tập trung cho các môi trường huấn luyện cho robot.

Hãy làm việc cùng Tim và nhóm Deepmind trên các mô hình mô phỏng thế giới khổng lồ : )

Trên con đường quan trọng đến AGI. https://t.co/4Zuju5eMHb

— Logan Kilpatrick (@OfficialLoganK) 6 tháng 1, 2025

Nhưng những người sáng tạo có cảm xúc phức tạp với công nghệ này.

Một cuộc điều tra của Wired gần đây đã phát hiện ra rằng các studio game như Activision Blizzard, đã sa thải một số nhân viên, đang sử dụng trí tuệ nhân tạo để cắt giảm chi phí, tăng năng suất và bù đắp cho việc rời bỏ. Và một nghiên cứu năm 2024 được ủy thác bởi Hội đồng Animation, một tổ chức đại diện cho các hoạ sĩ hoạt hình và vẽ tranh Hollywood, ước tính có hơn 100.000 việc làm phim ảnh, truyền hình và hoạt hình tại Mỹ sẽ bị ảnh hưởng bởi trí tuệ nhân tạo vào năm 2026.

Một số công ty khởi nghiệp trong không gian mô hình thế giới mới nổi, như Odyssey, đã cam kết hợp tác với các chuyên gia sáng tạo - không thay thế họ. Chúng ta sẽ đợi xem liệu Google có làm theo hướng đó không.

Cũng còn vấn đề bản quyền chưa được giải quyết. Một số mô hình thế giới dường như được huấn luyện trên các clip video trò chơi, điều này có thể khiến các công ty phát triển các mô hình đó trở thành mục tiêu của các vụ kiện tụng trong những trường hợp video đó không được cấp phép.

Google, chủ sở hữu của YouTube, khẳng định rằng họ có sự cho phép để huấn luyện các mô hình của mình trên video YouTube theo điều khoản dịch vụ của nền tảng. Nhưng công ty chưa nói rõ là họ đã sử dụng video nào cụ thể để huấn luyện.

TechCrunch có một bản tin tập trung vào trí tuệ nhân tạo! Đăng ký tại đây để nhận nó vào hộp thư đến hàng thứ Tư hàng tuần.