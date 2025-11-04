Nếu dạo gần đây bạn từng cảm thấy rằng tâm trí mình bị xâm chiếm bởi những cụm từ vô nghĩa như "Ballerina Cappuccina" hay "Pedro Pedro", thì bạn không đơn độc. Hàng tỷ người đang lướt xem những đoạn video, bài viết hay bình luận vô thưởng vô phạt trên mạng xã hội mỗi ngày, và điều đó thực sự đang tác động đến não bộ của chúng ta. Nhưng điều đáng ngạc nhiên là hiện tượng này cũng có thể xảy ra với AI.

Một nhóm nghiên cứu đến từ Đại học Texas A&M, Đại học Texas tại Austin và Đại học Purdue đã chứng minh rằng việc cho AI "ăn" quá nhiều dữ liệu mạng xã hội chất lượng thấp có thể khiến nó giảm khả năng lập luận, trí nhớ và thậm chí là hành vi đạo đức.

Junyuan Hong, đồng tác giả nghiên cứu, hiện là phó giáo sư tại Đại học Quốc gia Singapore cho biết trên tạp chí Wired: "Chúng tôi tự hỏi, nếu AI được đào tạo dựa trên cùng loại dữ liệu mà chúng ta đang tiêu thụ hàng ngày, chuyện gì sẽ xảy ra?".

Các nhà nghiên cứu gọi hiện tượng này là "Giả thuyết thoái hóa não của LLM" - viết tắt của Large Language Model Degeneration Hypothesis. Theo họ, "việc đào tạo liên tục trên những văn bản rác tràn lan trên mạng có thể dẫn đến sự suy giảm nhận thức lâu dài ở các mô hình AI ngôn ngữ lớn".

Để kiểm chứng, họ đã huấn luyện bốn mô hình mã nguồn mở, trong đó có Llama 3 của Meta và Qwen 3 của Alibaba, với hơn một triệu bài đăng được trích từ X (Twitter). Dữ liệu được chia thành hai loại: "rác tương tác" - các bài đăng ngắn lan truyền mạnh với nhiều lượt thích và chia sẻ, và "rác ngữ nghĩa" - các bài viết giật gân, dùng ngôn ngữ kích động hoặc nông cạn xoay quanh thuyết âm mưu, tuyên bố vô căn cứ hay các chủ đề hời hợt.

Kết quả thật đáng báo động. Khi tỷ lệ dữ liệu rác trong quá trình huấn luyện tăng dần, khả năng lý luận của các mô hình AI giảm mạnh: từ độ chính xác 74,9% xuống chỉ còn 57,2%. Khả năng hiểu ngữ cảnh dài, vốn là yếu tố quan trọng trong tư duy logic, cũng giảm từ 84,4% xuống còn 52,3%. Không chỉ vậy, AI còn bắt đầu thể hiện "tính cách lệch lạc": kém thân thiện hơn, tăng xu hướng tự luyến và có dấu hiệu rối loạn nhân cách chống đối xã hội, theo mô tả của nhóm nghiên cứu.

Hiện tượng này được xem là một dạng "thối não kỹ thuật số" ở cấp độ máy móc, tương tự như cách não người bị bào mòn khi tiếp xúc liên tục với thông tin độc hại.

Cùng lúc đó, thế giới đang chứng kiến một hiện tượng khác được gọi là "Enshitification" - sự "thối rữa" dần dần của Internet, khi các nền tảng trực tuyến bị chi phối bởi thuật toán tối ưu tương tác và lợi nhuận, thay vì giá trị thật cho người dùng. Giờ đây, theo một số ước tính, khoảng 50% nội dung trực tuyến đã do AI tạo ra, phần lớn trong số đó lại là nội dung chất lượng thấp.

Hệ quả là một vòng lặp độc hại: AI tạo ra nội dung rác, nội dung rác đó lại được dùng để huấn luyện thế hệ AI tiếp theo, khiến chúng ngày càng "ngu" đi và chu trình cứ thế lặp lại. Hong cảnh báo: "Một khi sự thoái hóa này bắt đầu, ngay cả quá trình đào tạo bổ sung về sau cũng khó có thể phục hồi hoàn toàn".

Đây là một cảnh báo nghiêm trọng cho các công ty công nghệ đang vội vã huấn luyện AI trên những tập dữ liệu khổng lồ được thu thập từ Internet mà không qua sàng lọc. Nhóm nghiên cứu kêu gọi các tổ chức này cần quản lý dữ liệu nghiêm ngặt hơn, tránh để "ô nhiễm nội dung" làm suy giảm năng lực nhận thức và đạo đức của các hệ thống trí tuệ nhân tạo.

Nhưng trước khi lo cho AI, có lẽ chúng ta nên lo cho chính mình. Trong hơn một thập kỷ qua, các nghiên cứu thần kinh đã chỉ ra rằng việc tiếp xúc quá mức với nội dung trực tuyến hời hợt, kích thích cảm xúc mạnh (đặc biệt là các nội dung giật gân, gây phẫn nộ) đang làm thay đổi cách não người hoạt động. Các nhà khoa học ghi nhận mối liên hệ rõ ràng giữa việc sử dụng mạng xã hội quá nhiều với giảm khả năng tập trung, suy giảm trí nhớ ngắn hạn và khả năng ra quyết định.

Thuật toán mạng xã hội vốn được thiết kế để giữ người dùng càng lâu càng tốt, bằng cách liên tục cung cấp những luồng thông tin mới lạ, sốc, gây tranh cãi và chính điều này đang "tái lập trình" hệ thống khen thưởng của não bộ, khiến chúng ta quen với việc phản ứng nhanh nhưng ít suy nghĩ sâu. Hiện tượng này, theo các chuyên gia, chính là "thối não kỹ thuật số" ở con người.

"Việc cho AI học từ nội dung lan truyền, gây chú ý có thể trông như cách mở rộng dữ liệu thông minh", Hong nhận định. "Nhưng thực chất, nó có thể âm thầm làm xói mòn khả năng lý luận, đạo đức và sự tập trung dài hạn giống hệt những gì đang xảy ra với chúng ta".

Thật trớ trêu, cả con người lẫn máy móc đều phát triển nhờ vào sự đa dạng, chiều sâu và thử thách trong những gì chúng hấp thụ. Khi bị tước đi những yếu tố đó và chỉ còn lại nội dung "rác", cả trí tuệ sinh học lẫn trí tuệ nhân tạo đều bắt đầu suy thoái.

Trong cả hai trường hợp, bài học vẫn không đổi và nghe có vẻ quen thuộc hơn bao giờ hết: bạn là những gì bạn tiêu thụ, dù bạn là người… hay là máy.