Vào ngày thứ 6 cuối tháng 8 vừa rồi, Elon Musk đã trực tiếp cầm lái một chiếc Tesla Model S từ trụ sở Tesla ở Palo Alto, bang California, Mỹ. Ông chọn bừa một vài đích đến trên bản đồ và để chiếc xe tự đưa đi bằng công nghệ hỗ trợ lái tự động Full Self Driving. Trong suốt 45 phút ngồi sau vô lăng, Elon Musk phát sóng trực tiếp (còn gọi là Livestream) hành trình của mình, vừa đi vừa nghe nhạc Mozart.
Khi chiếc xe đưa Elon Musk đi ngang qua nhà riêng của Mark Zuckerberg (CEO Facebook, nay gọi là Meta), cũng là người mà thời gian gần đây ông liên tục đùa về màn đấu võ tay đôi trong lồng bát giác: "Có khi tôi nên xuống gõ cửa và lịch sự hỏi xem liệu anh ta có muốn tham gia vào một cuộc đấu võ tay đôi không" - Elon Musk đùa và cười trước khi để chiếc xe tiếp tục hành trình của mình.
Ảnh cắt từ livestream của Elon Musk.
Trước đây, Elon Musk đã trực tiếp sử dụng công nghệ hỗ trợ lái tự động Full Self Driving cả vài trăm lần, nhưng lần này thì khác rất nhiều - không chỉ vì công nghệ đã hoạt động trơn mượt và đáng tin hơn. Phiên bản mà ông sử dụng là FSD 12, được phát triển dựa trên một triết lý hoàn toàn mới mà Elon Musk tin rằng sẽ không chỉ thay đổi toàn bộ các phương tiện tự lái, mà còn là một bước nhảy vọt về trí tuệ nhân tạo khi áp dụng trong các tình huống thực tế.
Thay vì phát triển dựa trên hàng nghìn dòng lệnh như các phiên bản cũ, phiên bản mới, bằng việc xử lý hàng tỷ khung hình trong nhiều video con người lái xe, đã tự dạy chính nó cách làm giống con người. Cách tạo ra phiên bản mới này tương tự như cách mà nhiều chatbot (máy trả lời tự động) tự dạy chính nó cách để trả lời - để làm được vậy thì họ ứng dụng mô hình ngôn ngữ rộng (Large Language Model) và để máy tính xử lý hàng tỷ từ trong các câu văn do con người viết.
Về cơ bản, Elon Musk đưa ra góc tiếp cận hoàn toàn mới về trí tuệ nhân tạo ứng dụng cho công nghệ hỗ trợ lái tự động của họ, và đáng ngạc nhiên là cách tiếp cận này mới bắt đầu từ 8 tháng trước.
Theo Dhaval Shroff, cách tiếp cận mới giống ChatGPT nhưng dành cho ô tô.
Anh Dhaval Shroff, một thành viên trong nhóm phát triển công nghệ tự lái của Tesla, giải thích cho Elon Musk về công nghệ này trong một buổi họp hồi tháng 12 năm ngoái: "Nó tương tự như ChatGPT, nhưng dành cho ô tô".
ChatGPT là sản phẩm công nghệ do OpenAI phát triển. Elon Musk là đồng sáng lập OpenAI từ năm 2015. Trong buổi họp nói trên, anh Dhaval Shroff so sánh mô hình mà họ đang làm với chatbot ChatGPT vừa được ra mắt thời điểm đó; anh cho biết: "Chúng tôi xử lý một khối lượng dữ liệu khổng lồ về cách các tài xế xử lý tình huống phức tạp trên đường, sau đó huấn luyện cho hệ thần kinh máy tính có thể bắt chước".
Trước khi Elon Musk đưa ra quyết định về góc tiếp cận mới, hệ thống hỗ trợ lái tự động Autopilot vẫn hoạt động dựa trên một loạt các quy tắc được đặt ra. Hệ thống camera trên xe sẽ xác định những điều quan trọng trên đường đi như vạch kẻ đường, người đi bộ, phương tiện cùng tham gia giao thông, tín hiệu, biển báo giao thông. Sau đó, Autopilot sẽ chiếu theo các quy tắc được đặt ra, như: Đèn đỏ thì dừng, đèn xanh thì đi, luôn đi ở giữa 2 vạch kẻ làn. Những quy tắc này đều do các kỹ sư của Tesla tự tay viết và cập nhật, tất nhiên không viết bằng văn bản mà bằng ngôn ngữ C++ với cả trăm nghìn dòng lệnh để xe áp dụng trong các tình huống giao thông phức tạp.
Cách tiếp cận mới mà Dhaval Shroff và đồng nghiệp có điểm khác biệt so với cách tiếp cận trước đây: "Thay vì vạch ra con đường đúng để đi bằng các quy định [thì giờ đây], chúng tôi sẽ dựa vào một hệ nơ-ron nhân tạo đã học từ hàng triệu ví dụ về cách con người thực hiện".
Ảnh cắt từ livestream của Elon Musk.
Nói theo cách khác, cách tiếp cận mới sẽ bắt chước con người. Khi gặp một tình huống giao thông bất kỳ, hệ nơ-ron nhân tạo này sẽ làm theo cách mà nó tham khảo được con người trong hàng nghìn tình huống tương tự. Cách làm này tương tự cách con người học nói, học lái xe, học chơi cờ, học ăn hay gần như tất cả các kỹ năng khác; có thể con người chúng ta cũng sẽ phải bám theo những bước hoặc quy định nhất định, nhưng chủ yếu con người có được các kỹ năng này bằng cách quan sát người khác làm.
Đây cũng là cách tiếp cận với máy học mà Alan Turing đã chỉ ra từ nghiên cứu năm 1950, khoảng 1 năm trở lại đây đã trở nên phổ biến hơn với công chúng khi ChatGPT ra đời.
Đến đầu năm nay, dự án theo cách tiếp cận mới đã phân tích khoảng 10 triệu video mà các xe Tesla ghi lại từ chính người chủ xe của nó. Có một câu hỏi: Khi bắt chước con người như thế, liệu nó sẽ lái tốt như một người bình thường?
Anh Dhaval Shroff giải thích: "Không, vì chúng tôi chỉ đưa vào dữ liệu từ những người xử lý tốt tình huống".
Trên xe Tesla trang bị rất nhiều camera, gửi dữ liệu cho máy tính của xe phân tích theo thời gian thực khi kích hoạt chế độ hỗ trợ lái tự động.
Một trong các công đoạn để giúp máy học được là dán nhãn dữ liệu. Với cách tiếp cận mới này, công ty có một nhóm chuyên dán nhãn dữ liệu, sẽ xử lý và chấm điểm các video đó. Điều mà Elon Musk nói với nhóm này là hãy tìm những điều mà "một người lái Uber 5 sao sẽ làm", và những tình huống đó sẽ được đưa vào kho dữ liệu của hệ thống và đào tạo máy tính.
Elon Musk cũng hay đi tới khu làm việc của nhóm phát triển Autopilot, thường ngồi nói chuyện với các kỹ sư. Khi Elon Musk tìm hiểu về cách tiếp cận mới phỏng theo con người, ông thắc mắc: Cách này có thực sự cần thiết không, liệu nó có thừa không?
Có một câu Elon Musks thường nói, đó là bạn không nên dùng tên lửa đạn đạo chỉ để diệt một con ruồi, dùng cây đập ruồi là quá đủ rồi.
Vậy, nếu dùng hệ nơ-ron nhân tạo có thừa không?
Sau đó, Dhaval Shroff giới thiệu cho Elon Musk các ví dụ mà cách tiếp cận mới (khi hệ thống máy tính có thể tự học từ các ví dụ mà con người đưa vào) làm tốt hơn so với việc đặt ra cả ngàn câu lệnh và quy định. Đoạn video minh họa cho thấy một con đường có nhiều thùng rác, cọc tiêu giao thông bị đổ và nhiều vật ngẫu nhiên khác. Chiếc xe với công nghệ bắt chước con người đã có thể đi vòng qua những chướng ngại này, sẵn sàng đè vạch phân làn và phá một vài quy tắc khi cần thiết. Dhaval Shroff cho biết: "Đây là điều sẽ xảy ra khi ta chuyển từ áp đặt quy tắc sang hệ nơ-ron nhân tạo. Chiếc xe sẽ không bao giờ đâm phải bất cứ thứ gì khi bật chế độ [hỗ trợ lái tự động], kể cả khi di chuyển [trên những cung đường không có trong hệ thống dữ liệu].
Thường, hệ thống máy học sẽ cần những con số cụ thể để tự nó đánh giá và học. Elon Musk cũng sẽ "tính điểm" hệ thống theo cách mới này: Số dặm di chuyển bằng Full Self Driving mà không cần con người không can thiệp. Elon Musk yêu cầu thực hiện điều này giống như chơi điện tử, nhóm phát triển sẽ thấy điểm số của mình hàng ngày. Elon Musk cho rằng: "Chơi điện tử mà không có điểm thì chán chết, nên sẽ rất vui nếu ngày nào cũng có thể thấy số dặm xe tự lái không cần con người can thiệp tăng lên".
Nhóm phát triển đã lắp một tivi 85 inch ở khu làm việc và hiện số dặm theo thời gian thực. Họ cũng đã đặt một cái chiêng ở bên cạnh; mỗi khi giải quyết được một vấn đề khiến con người phải can thiệp thì họ được phép gõ chiêng.
Với dữ liệu từ cả triệu xe trên thế giới gửi về hàng ngày, Tesla có lợi thế lớn khi phát triển công nghệ theo hướng mới.
Tới giữa tháng 4/2023, Elon Musk đã lái thử xe với hệ thống trang bị công nghệ mới. Ông ngồi ở ghế lái, bên cạnh là giám đốc phát triển Autopilot - Ashok Elluswamy. 3 thành viên khác của đội phát triển ngồi ở hàng ghế sau. Elon Musk chọn một địa điểm trên bản đồ rồi bỏ tay khỏi vô lăng để chiếc xe tự làm việc của mình.
Khi chiếc xe đi ra đường lớn, một tình huống tiềm ẩn nguy hiểm đã xảy tới: Một người đi xe đạp đi ngang qua. Nhưng chiếc xe đã tự động nhường đường cho người đi xe đạp - giống cách một con người làm.
Trong suốt 25 phút sau đó, chiếc xe tự di chuyển ở những đoạn đường tốc độ cao, đi qua khu đông dân cư, tự xử lý các đoạn cua phức tạp, tự tránh người đi xe đạp, người đi bộ và thú cưng của họ. Đáng ngạc nhiên là Elon Musk không hề chạm vào vô lăng; chỉ thi thoảng Elon Musk đạp ga để đi nhanh hơn vì chiếc xe có vẻ quá rụt rè, như khi đi qua ngã tư. Có một khúc chiếc xe xử lý tốt tới nỗi Elon Musk đã phải thốt lên ngạc nhiên: "Ôi chà, ngay cả hệ nơ-ron của tôi cũng sẽ lái hỏng ở đoạn này, nhưng chiếc xe đã làm tốt". Theo sau đó là Elon Musk vui vẻ huýt sáo theo một bản nhạc của Mozart.
Sau khi tận tay trải nghiệm công nghệ mới, Elon Musk đã để cho cả nhóm phát triển bằng mọi nguồn lực mà họ có. Elon Musk cũng chỉ ra rằng điều cốt lõi của cách tiếp cận này là chỉ khi có ít nhất 1 triệu video dữ liệu đầu vào thì hệ thống mới hoạt động tốt. Điều này đã giúp Tesla có lợi thế trước tất cả các hãng xe và các hãng công nghệ khác. Hiện nay, Tesla có khoảng 2 triệu xe chạy khắp thế giới, gửi video về hàng ngày.
Sau đó 4 tháng, Tesla đã có hệ thống hoàn chỉnh, sẵn sàng thay thế phiên bản cũ và trở thành FSD 12 mà sẽ phát hành khi được cho phép.
Tuy nhiên, có một vấn đề: Con người, ngay cả một người tài xế cừ khôi nhất, cũng không cứng nhắc theo luật, và hệ thống Full Self Driving kiểu mới học con người. Giả sử, khi đến biển Stop thì có hơn 95% người lái không dừng lại hoàn toàn mà vẫn để xe trôi rất chậm; hay có thể thấy ở ngay Việt Nam, khi dừng chờ đèn đỏ, nhiều tài xế có thể nhấn ga di chuyển ngay khi giây cuối cùng của đèn đỏ vừa hiện ra. Chủ tịch Hội đồng An toàn Cao tốc Quốc gia Mỹ cho biết rằng họ đang nghiên cứu xem liệu có thể cho phép điều này xảy ra với xe tự lái hay không.