Genie 3 là mô hình “world model” thế hệ mới từ DeepMind, cho phép tạo môi trường 3D tương tác thời gian thực chỉ từ một đoạn văn bản. Với độ phân giải 720p và tốc độ 24 fps, Genie 3 giữ được tính nhất quán vật lý và sở hữu dạng “trí nhớ không gian” - mở ra tiềm năng mạnh mẽ cho các embodied agents và tiến gần hơn đến AGI.
Google DeepMind ra mắt Genie 3
Google DeepMind vừa công bố Genie 3, phiên bản mới nhất trong dòng “world model” tiên tiến, mở ra khả năng tạo ra môi trường 3D sống động chỉ từ một đoạn mô tả ngắn. Không giống Genie 1 và Genie 2 vốn chỉ xây dựng đoạn cảnh tĩnh hoặc ngắn, Genie 3 cho phép người dùng khám phá và tương tác trực tiếp với thế giới ảo, giữ được sự nhất quán không gian và vật lý trong suốt vài phút mô phỏng.
Đây là bước tiến quan trọng hướng tới việc xây dựng các môi trường mô phỏng có thể phục vụ huấn luyện robot, phát triển game, làm phim, hoặc hỗ trợ nghiên cứu trí tuệ nhân tạo tổng quát (AGI).
Genie 3: Kỷ nguyên mới cho mô hình thế giới ảo tương tác
Genie 3 có thể biến một đoạn mô tả ngắn “prompt” thành một môi trường 3D hoàn chỉnh, bao gồm cảnh quan, vật thể, nhân vật, ánh sáng và hiệu ứng vật lý.
Genie 3 tạo ra thế giới ảo tương tác thời gian thực chỉ từ văn bản
Khả năng mô phỏng của Genie 3 không chỉ dừng lại ở việc dựng hình ảnh tĩnh mà còn tái tạo hành vi động của môi trường:
Genie 3 mô phỏng hiệu ứng vật lý và hiện tượng tự nhiên
Genie 3 cho phép người dùng hoặc agent AI điều khiển nhân vật để di chuyển, nhảy, leo, hoặc thao tác với vật thể trong cảnh. Không sử dụng engine vật lý cố định như trong phát triển game truyền thống, Genie 3 tự học cách thế giới vận hành thông qua kiến trúc “tự hồi tiếp” (autoregressive). Mô hình ghi nhớ các khung hình trước đó để đảm bảo tính nhất quán.
Genie 3 tương tác thời gian thực với tính nhất quán cao
Người dùng có thể thay đổi nhiều yếu tố trong khi đang tương tác:
Dù ấn tượng, Genie 3 vẫn đang trong giai đoạn nghiên cứu và chỉ được thử nghiệm bởi một nhóm nhỏ nhà nghiên cứu và sáng tạo. Hiện tại, Genie 3 vẫn còn một số giới hạn:
Genie 3 có thể ứng dụng được rất nhiều trong thực tế
Theo DeepMind, mục tiêu cao cả nhất của Genie 3 không chỉ dừng lại ở việc tạo ra các trò chơi hay thế giới ảo. Mô hình này được xem là một nền tảng chiến lược để huấn luyện các "embodied agents" - những AI có khả năng tương tác và học hỏi từ môi trường.
Bằng cách tạo ra các môi trường mô phỏng phong phú và nhất quán, Genie 3 giúp các tác nhân AI rèn luyện khả năng lập kế hoạch, học tập qua thử-sai và thích nghi với nhiều tình huống khác nhau. Đây là một bước tiến quan trọng hướng tới việc phát triển Trí tuệ nhân tạo tổng quát (AGI), một dạng AI có thể học hỏi và thực hiện bất kỳ nhiệm vụ trí tuệ nào giống như con người.
Genie 3 là bước tiến quan trọng của DeepMind trong lĩnh vực mô hình thế giới, mang lại khả năng tạo và tương tác với môi trường ảo một cách sống động và linh hoạt. Khi các hạn chế được khắc phục và công nghệ mở rộng tiếp cận, Genie 3 có thể trở thành nền tảng đột phá trong cả khoa học, giáo dục, giải trí và phát triển AI.
Để sẵn sàng đón đầu xu hướng và trải nghiệm trọn vẹn các ứng dụng AI, bạn nên sở hữu một chiếc điện thoại chính hãng, cấu hình mạnh, màn hình sắc nét. Tại Siêu Thị Điện Máy - Nội Thất Chợ Lớn, bạn có thể dễ dàng tìm thấy nhiều lựa chọn từ các thương hiệu hàng đầu với mức giá ưu đãi cùng nhiều quà tặng giá trị.
Tải app theo dõi thông tin đơn hàng và hàng ngàn voucher giảm giá dành cho bạn.