Hôm thứ Tư theo giờ địa phương, Meta công bố dịch vụ sản sinh hình ảnh bằng AI của riêng mình có tên " Imagine with Meta AI " (tạm dịch là "Tưởng tượng với Meta AI"), hoạt động dựa trên mô hình tổng hợp hình ảnh Emu do chính Meta phát triển.
Meta sử dụng 1,1 tỷ tấm ảnh được đăng tải công khai trên Facebook và Instagram để huấn luyện Emu. Và cũng giống phần lớn những hệ thống sản sinh hình ảnh bằng trí tuệ nhân tạo khác, Emu cũng tổng hợp ảnh từ những "prompt", tạm dịch là "đề bài" do người dùng nhập vào.
Nếu như bạn từng sử dụng Facebook và Instagram, và từng công khai đăng ảnh cá nhân, rất có thể ảnh của bạn đã được Meta sử dụng làm dữ liệu huấn luyện Emu.
Tuy nhiên, cũng phải "may mắn" lắm ảnh của bạn mới được chọn, khi dữ liệu công bố năm 2016 cho thấy người dùng Instagram tải lên nền tảng này 95 triệu tấm ảnh/ngày. Con số đồng thời cho thấy Meta mới chỉ dùng một phần rất nhỏ số dữ liệu mình có trong tay.
Tương đồng những dịch vụ sinh ảnh khác như DALL-E hay MidJourney , Imagine with Meta AI tạo ra hình ảnh dựa trên những khái niệm, gắn liền với những hình ảnh có sẵn trong cơ sở dữ liệu.
Dịch vụ của Meta yêu cầu người dùng phải có tài khoản Meta (vốn có thể được tạo lập từ tài khoản Facebook hoặc Instagram); người dùng sẽ gõ các đề bài vào khung soạn thảo văn bản, qua đó yêu cầu Imagine with Meta AI tạo ra hình ảnh.
Với mỗi loạt đề bài, Imagine with Meta AI sẽ tạo ra 4 ảnh 1280×1280, và cho phép người dùng tải về dưới dạng file JPEG. Trên ảnh sẽ có watermark "Imagined with AI", có nghĩa "được tưởng tượng ra bởi trí tuệ nhân tạo".
Hiện Imagine with Meta AI mới chỉ được hoạt động tại một số quốc gia nhất định, trong danh sách này không có Việt Nam.
Những gì chúng ta biết về Emu
Dựa trên tài liệu nghiên cứu được Meta đăng tải hồi tháng 9, khả năng sinh hình ảnh của Emu được đặt tên "quality-tuning", nghĩa là "tinh chỉnh chất lượng". Và cũng theo tài liệu này, Emu khác những mô hình sinh ảnh từ chữ ở chỗ: nó không được huấn luyện bằng các cặp dữ liệu khái niệm-hình ảnh, mà sử dụng một quy trình có tên là "aesthetic alignment", tạm dịch là "gióng hàng mỹ học", sử dụng những bộ hình ảnh hấp dẫn về mặt thị giác.
Tuy nhiên, báo cáo này không cho biết nguồn gốc dữ liệu huấn luyện Imagine with Meta AI. Thông tin "1,1 tỷ tấm ảnh" nêu trên được bật mí tại sự kiện Meta Connect 2023, khi giám đốc cấp cao Nick Clegg xác nhận Meta sử dụng bài đăng mạng xã hội để huấn luyện các mô hình trí tuệ nhân tạo, trong đó bao gồm ảnh dùng trong huấn luyện Emu.
Để phần nào đối phó với tình trạng nội dung giả sinh ra từ AI, Imagine with Meta AI đã đính cả watermark vào ảnh được tạo ra. Trên website chính thức của dự án, Meta khẳng định "Ảnh có thể không chính xác hoặc không phù hợp với người dùng".