Các nhà khoa học Trung Quốc cho biết họ tìm ra cách cải tiến phương pháp huấn luyện máy móc với kiến thức sẵn có (như các định luật vật lý, logic, toán học), nhằm tạo ra “các nhà khoa học AI” có khả năng thí nghiệm và giải quyết các vấn đề khoa học.
Cụ thể, theo bài báo của các nhà nghiên cứu Trung Quốc đăng trên tạp chí Cell Press Nexus , các mô hình học máy sâu (deep learning) đã “cách mạng hóa lĩnh vực nghiên cứu khoa học” nhờ khả năng khám phá mối quan hệ của lượng lớn dữ liệu. Tuy nhiên, mô hình máy không có hiểu biết cơ bản về thế giới, nên sản phẩm tạo ra không có tính chính xác cao.
Để khắc phục điều này, mô hình máy cần sử dụng thêm các kiến thức sẵn có từ con người. Thách thức đặt ra là quá nhiều kiến thức đưa vào cùng một lúc sẽ khiến mô hình gặp trục trặc. Vì vậy, các nhà nghiên cứu Trung Quốc đã phát triển quy tắc đánh giá để máy tự lựa chọn và đưa những kiến thức phù hợp nhất vào kết hợp với dữ liệu.
Một trong những ví dụ được nhắc đến là Sora - mô hình chuyển mô tả văn bản thành video của công ty OpenAI (Mỹ). Các nhà phát triển Sora cho biết nó có thể " hiểu được cách vạn vật tồn tại trong thế giới thực” , và có khả năng mô tả sự vật tiên tiến, chân thực.
Tuy nhiên, công ty thừa nhận rằng Sora vẫn gặp khó khăn trong việc mô phỏng một số khía cạnh của thế giới thực và không thể “mô hình hóa chính xác đặc điểm vật lý của nhiều hiện tượng cơ bản".
Thực tế, công ty chỉ "huấn luyện" Sora bằng cách sử dụng lượng lớn dữ liệu hình ảnh, cho phép trí tuệ nhân tạo này tự chọn từ kho dữ liệu những hình ảnh và video mô phỏng thực tế. Họ chưa thể giúp Sora hiểu về các định luật vật lý như trọng lực.
Chen Yuntian, đồng tác giả nghiên cứu, giáo sư tại Viện Công nghệ Phương Đông (EIT), cho biết: “Nếu không có hiểu biết cơ bản về thế giới, một mô hình máy về cơ bản chỉ là sao chép lại dữ liệu chứ không phải là mô tả”.
Xu Hao, đồng tác giả nghiên cứu tại Đại học Bắc Kinh, bình luận: “Việc đưa kiến thức của con người vào các mô hình AI có khả năng cải thiện hiệu quả và khả năng suy luận của chúng. Câu hỏi đặt ra là làm thế nào để cân bằng giữa ảnh hưởng của dữ liệu và kiến thức”.
Theo bài báo, phương pháp mới giúp tính toán “tầm quan trọng của các quy tắc”, xem xét ảnh hưởng của một quy tắc cụ thể đến dự đoán của một mô hình máy. Sau đó, AI sẽ được dạy các quy tắc phù hợp nhất - ví dụ, các định luật vật lý, đưa ra kết quả "phù hợp với thế giới thực hơn".
Các nhà nghiên cứu đã thử nghiệm bằng cách áp dụng phương pháp này để tối ưu hóa một mô hình giải phương trình toán học đa biến, cùng một mô hình dự đoán kết quả thí nghiệm hóa học.
Chen cho biết rằng trong ngắn hạn, phương pháp này sẽ rất hữu ích đối với các mô hình máy yêu cầu nhất quán với các quy luật vật lý.
Nhóm nghiên cứu cũng phát hiện ra một số vấn đề tồn tại. Ví dụ, sau khi thêm nhiều dữ liệu vào mô hình, các quy tắc chung sẽ được ưu tiên hơn các quy tắc cụ thể. Trong một số lĩnh vực đặc thù đòi hỏi xem xét nhiều yếu tố - như sinh học và hóa học, điều này có thể ảnh hưởng đến kết quả.
Tuy nhiên, nhóm hy vọng rằng phương pháp mới sẽ giúp mô hình học máy phát triển hơn nữa, để dần dần AI tự xác định được những kiến thức và quy tắc riêng, không cần sự can thiệp của con người.
“Chúng tôi muốn biến đây thành một quy trình khép kín, qua đó biến mô hình thành một nhà khoa học AI thực sự”, nhóm cho biết.
Các nhà nghiên cứu cũng đang phát triển công cụ mã nguồn mở dành cho các nhà phát triển AI để họ có thể làm những thử nghiệm tương tự.