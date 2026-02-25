Sau khi chương trình Gala Tết Nguyên đán 2026 của CCTV (Trung Quốc) kết thúc, nhiều khoảnh khắc trên sân khẩu được lan truyền nhanh chóng. Trong đó màn trình diễn của một nhóm robot đã thu hút sự chú ý của cộng đồng mạng.

Các robot biểu diễn điệu múa với những động tác đồng bộ. Số khác hóa thân thành "bà cụ giả", lông mày, mắt và biểu cảm khuôn mặt gần như không thể phân biệt được với người thật. Một nhóm lại có thể thực hiện những động tác khó như lộn ngược và bật người sang bên...

Nhưng trong một cuộc phỏng vấn công khai của Weibo Tech, Wang Xingxing đã thẳng thắn tuyên bố: "Trình độ công nghệ tổng thể của tất cả các robot mà chúng ta thấy ngày nay chỉ tương đương với trình độ của một đứa trẻ 10 tuổi."

Wang Xingxing là ai?

Wang Xingxing đến từ Chiết Giang, sinh năm 1990, đã có niềm đam mê với cơ khí từ sớm. Trong những năm đại học, anh đã chế tạo một robot hình người để bàn chỉ với hơn 200 NDT. Trong thời gian học cao học, anh đã tiên phong phát triển robot bốn chân hiệu suất cao, chi phí thấp. Điều này đã giúp anh nổi tiếng chỉ sau một đêm.

Năm 2016, Wang Xingxing rời DJI để bắt đầu công việc kinh doanh riêng, thành lập Unitree Robotics. Chỉ trong vài năm, anh đã dẫn dắt đội ngũ của mình cho ra mắt một số sản phẩm robot hàng đầu thế giới.

Tính đến nay, Unitree Robotics đã nộp đơn xin cấp hơn 180 bằng sáng chế trong và ngoài nước. Năm 2024, doanh thu của công ty đã vượt quá 1 tỷ NDT. Trên thị trường robot hình người toàn cầu, Unitree Robotics đứng thứ hai về số lượng xuất xưởng với thị phần 32%, chỉ sau Logic Robotics.

Có thể nói rằng quan điểm của ông không chỉ thể hiện đánh giá kỹ thuật của Unitree Robotics mà còn phản ánh thực trạng của toàn bộ ngành công nghiệp robot Trung Quốc.

Tất cả trên sân khấu chỉ là… biểu diễn

Vậy câu hỏi đặt ra là: nếu những con robot trong chương trình Gala Tết Nguyên đán tuyệt vời đến vậy, tại sao chúng chỉ có trí thông minh tương đương với một đứa trẻ 10 tuổi? Câu trả lời rất đơn giản: biểu diễn trên sân khấu và đời thực là hai tình huống hoàn toàn khác nhau. Sự xuất sắc của robot trên sân khấu về cơ bản là "diễn theo kịch bản", chứ không phải "đưa ra quyết định tự chủ".

Giống như con robot sinh học "bà ngoại", mặc dù lông mày và mắt của nó trông rất thật và nó có thể giao tiếp với các diễn viên, nhưng mọi biểu cảm, mọi lời nói và mọi chuyển động của nó đều là kết quả của việc các kỹ sư thu thập dữ liệu biểu cảm từ trước, lập trình và sửa lỗi nhiều lần. Ngay cả chuyển động môi cũng được lập trình chính xác để đạt được sự đồng bộ 1:1 với giọng nói.

Để thích ứng, thuật toán ổn định đã được tối ưu hóa nhiều lần, và hiệu ứng sân khấu đã đạt được sau vô số lần điều chỉnh. Nói cách khác, nếu bối cảnh sân khấu thay đổi dù chỉ một chút, chẳng hạn như sàn nhà trở nên trơn trượt hoặc các diễn viên thêm một câu thoại, robot có thể sẽ bị kẹt và không biết phải làm gì.

Nó giống như việc huấn luyện một đứa trẻ 10 tuổi biểu diễn trên sân khấu. Sau nhiều lần tập luyện, cậu bé có thể biểu diễn hoàn hảo. Nhưng nếu bạn đưa cậu bé ra khỏi buổi tập và yêu cầu cậu làm điều gì đó mà trước đó chưa được hướng dẫn, chẳng hạn như "lấy một chai nước cho khách", cậu bé có thể làm điều đó dễ dàng - phân biệt giữa việc uống nước, mở tủ lạnh, tránh chướng ngại vật, và thậm chí hỏi khách xem họ có muốn nước ấm hay không.

Tuy nhiên, nếu bạn yêu cầu bất kỳ robot nào trên sân khấu Gala Tết Nguyên đán làm điều này, rất có thể nó sẽ đứng yên vì nó không hiểu "khách mời" là ai, cách mở tủ lạnh hoặc cách thích ứng với khung cảnh.

Một số người có thể thắc mắc, với trí tuệ nhân tạo tiên tiến như hiện nay, ChatGPT có thể trò chuyện không rào cản với con người, vậy tại sao robot vẫn chưa có trí thông minh tự chủ?

Cần hiểu rằng, khái niệm trí thông minh ngôn ngữ và trí thông minh thể hiện qua hành động khác nhau. Các AI như ChatGPT chủ yếu sở hữu trí thông minh ở cấp độ ngôn ngữ; chúng có thể hiểu ngôn ngữ và tạo ra văn bản, nhưng chúng thiếu các thực thể vật lý và không cần tương tác với thế giới vật lý.

Robot cần một "cơ thể" để cảm nhận môi trường xung quanh, chạm vào vật thể và thực hiện các hành động vật lý. Điều này đòi hỏi trí thông minh thể hiện qua cơ thể, và đây chính là trở ngại khó khăn nhất mà ngành công nghiệp robot hiện nay cần vượt qua.

Cần thời gian để hoàn thiện

Trong cuộc phỏng vấn, Wang Xingxing đề cập rằng trí thông minh thể hiện của robot đòi hỏi nguồn dữ liệu nhiều hơn hàng nghìn lần so với lái xe tự động - nó không chỉ cần nhận diện vật thể thông qua camera, mà còn phải cảm nhận vật liệu và lực.

Những điều mà chúng ta coi là hiển nhiên lại vô cùng phức tạp đối với robot, và công nghệ hiện tại không thể bao quát hết tất cả các tình huống phức tạp trong cuộc sống.

Ứng dụng robot trong gia đình vẫn còn ở giai đoạn sơ khai. Trí thông minh và tính thực tiễn của robot quét nhà và robot hỗ trợ chưa đủ, và khó có khả năng chúng sẽ được sử dụng rộng rãi trong các hộ gia đình thông thường trong thời gian ngắn.

Không thể phủ nhận rằng, công nghệ robot của Trung Quốc đã thuộc hàng đầu thế giới, đặc biệt là trong lĩnh vực robot hình người và robot bốn chân. Wang Xingxing cũng đưa ra một mốc: nếu mọi việc suôn sẻ, robot có thể được ứng dụng rộng rãi trong vòng 3-5 năm; muộn nhất là trong vòng không quá 10 năm, chúng có thể dần dần thâm nhập vào các hộ gia đình bình thường.

Sự phát triển của robot chắc chắn sẽ trải qua một quá trình từ "gây ấn tượng trên sân khấu" đến "ứng dụng thực tiễn", từ "chuyên dụng" đến "đa năng", và từ "trẻ em 10 tuổi" đến "người lớn". Những con robot xuất hiện trong chương trình Gala Tết Nguyên đán là một khởi đầu đầy hứa hẹn nhưng vẫn cần thời gian để đi vào cuộc sống.