Chiến dịch khai thác dữ liệu quy mô công nghiệp

Theo báo cáo từ Anthropic (công ty trí tuệ nhân tạo của Mỹ có trụ sở tại San Francisco), họ đã phát hiện một chiến dịch quy mô lớn nhằm "chưng cất" trí tuệ từ mô hình Claude . Cụ thể, các thực thể liên quan đến Trung Quốc đã sử dụng mạng lưới gồm hơn 24.000 tài khoản để gửi khoảng 16 triệu truy vấn tới hệ thống của Anthropic trong một khoảng thời gian ngắn.

Phương pháp chưng cất là một phương pháp đào tạo phổ biến trong ngành công nghiệp AI, với các phòng thí nghiệm tiên tiến thường chưng cất mô hình của riêng họ để tạo ra các phiên bản rẻ hơn cho khách hàng. Tuy nhiên, hầu hết các nhà cung cấp mô hình AI độc quyền hàng đầu, bao gồm cả Anthropic, đều cấm các hoạt động như vậy.

Mục tiêu của chiến dịch này không phải là sử dụng dịch vụ thông thường, mà là trích xuất các phản hồi chất lượng cao của Claude . Dữ liệu này sau đó được dùng làm "tài liệu học tập" để huấn luyện và nâng cấp các mô hình ngôn ngữ lớn (LLM) của chính họ, giúp các mô hình này đạt được khả năng lập luận và lập trình tương đương với Claude nhưng với chi phí thấp hơn đáng kể.

Những "ông lớn" bị điểm tên

Trong tài liệu công bố, Anthropic đã chỉ đích danh ba startup AI hàng đầu của Trung Quốc bao gồm: DeepSeek, Moonshot AI và MiniMax . Đây là những cái tên đang dẫn đầu làn sóng AI tại quốc gia tỷ dân và thường xuyên tuyên bố có năng lực tiệm cận với các sản phẩm của Thung lũng Silicon.

Anthropic khẳng định họ có bằng chứng cho thấy các công ty này đã vượt qua các giới hạn sử dụng và điều khoản dịch vụ để thu thập dữ liệu trái phép. Việc lạm dụng này không chỉ gây thiệt hại về mặt kinh tế mà còn tạo ra sự cạnh tranh không công bằng, khi các công ty Trung Quốc có thể "đi tắt đón đầu" dựa trên thành quả nghiên cứu hàng tỷ USD của Anthropic.

DeepSeek đã gây chấn động ngành công nghiệp khi ra mắt một mô hình mạnh mẽ gần như sánh ngang với các đối thủ hàng đầu trong ngành như ChatGPT – nhưng lại yêu cầu ít tài nguyên tính toán hơn.

Sự phát triển này đã thách thức quan niệm phổ biến lúc bấy giờ cho rằng việc huấn luyện các mô hình tiên tiến đòi hỏi nhiều sức mạnh xử lý. Đồng thời, nó đặt ra câu hỏi về hiệu quả của các biện pháp kiểm soát công nghệ và xuất khẩu của Mỹ.

Theo CNN, DeepSeek vẫn chưa đưa ra bình luận công khai nào về những cáo buộc của Open AI.

Rủi ro về an toàn

Vấn đề không chỉ nằm ở bản quyền. Anthropic cảnh báo rằng việc "chưng cất" có thể vô hiệu hóa các hàng rào an toàn (safety guardrails) mà họ đã dày công xây dựng. Khi một mô hình AI khác học từ Claude , nó chỉ tiếp thu trí thông minh nhưng thường bỏ qua các bộ lọc đạo đức và kiểm soát rủi ro đi kèm.

Điều này tạo ra những lỗ hổng nguy hiểm, cho phép các mô hình phái sinh bị lợi dụng vào các mục đích xấu như tấn công mạng hoặc tạo thông tin sai lệch. Anthropic nhấn mạnh rằng việc thiếu minh bạch trong quá trình huấn luyện AI của các công ty bị cáo buộc đang đặt ra thách thức lớn cho các cơ quan quản lý toàn cầu.

Cáo buộc của Anthropic đã làm nóng thêm cuộc đối đầu trong lĩnh vực công nghệ giữa Mỹ và Trung Quốc. Trong bối cảnh các quy định về AI còn đang ở giai đoạn sơ khai, vụ việc này được xem là một hồi chuông cảnh báo về việc thiết lập các tiêu chuẩn quốc tế để bảo vệ tài sản trí tuệ và đảm bảo AI được phát triển một cách có trách nhiệm.



