[2604.13899] Do We Still Need Humans in the Loop? Comparing Human and LLM Annotation in Active Learning for Hostility Detection

MEASER: Tấn công nhúng phần mềm độc hại vào các mô hình ngôn ngữ lớn mã nguồn mở

MEASER: Tấn công nhúng mã độc vào LLM mã nguồn mở — nghiên cứu cảnh báo mức rủi ro mới

Một nghiên cứu mang tên “MEASER: Malware embedding attacks on open-source LLMs” của Ming Tan và 6 đồng tác giả vừa công bố phiên bản mới, trình bày cách tấn công nhúng mã độc (Malware Embedding Attacks – MEAs) nhắm vào các mô hình ngôn ngữ lớn mã nguồn mở (open-source LLMs). Bài báo có thể xem dưới dạng PDF và HTML (thử nghiệm).

Tóm tắt nội dung chính:
– Các LLM mã nguồn mở đang tỏ ra vượt trội so với LLM sở hữu nhờ tính cộng tác và chia sẻ: truy cập đầy đủ mã nguồn, tham số mô hình và dữ liệu huấn luyện mang lại minh bạch nhưng cũng tiềm ẩn rủi ro.
– Nghiên cứu lập luận rằng cơ chế truy cập đầy đủ này dễ bị tấn công MEA, và tác hại của chúng chưa được hiểu rõ. Từ đó, tác giả hệ thống hóa formalization cho MEA trên LLM mã nguồn mở bằng cách liệt kê tất cả mô hình mối đe dọa khả thi liên quan đến mục tiêu, kiến thức và khả năng của kẻ tấn công.
– Trong số các kịch bản, mối nguy thực tiễn là các kẻ tấn công có kiến thức nội bộ, có thể chèn payload và trigger khi chia sẻ mô hình. Dựa trên điều này, nhóm nghiên cứu đề xuất MEA đầu tiên chống LLM mã nguồn mở, gọi là MEASER.
– MEASER thực hiện tấn công theo các bước: xác định tham số mục tiêu, nhúng payload, chèn trigger và tuần tự thực thi payload. Để tăng độ bền trước các kỹ thuật như lượng tử hóa (quantization) và tinh chỉnh hiệu quả tham số (parameter-efficient fine-tuning, PEFT), MEASER sử dụng cơ chế Magnitude-Adaptive Relative Quantization Index Modulation (MAR-QIM), kết hợp với mã LDPC và điều chế dải trải (spread spectrum).
– Để tăng tính ẩn nấp (stealthiness), MEASER phát triển một chỉ số tầm quan trọng nhận biết hiệu năng (performance-aware importance metric) nhằm chọn tham số mục tiêu sao cho ít làm giảm hiệu năng mô hình nhất.
– Thử nghiệm rộng rãi trên bốn LLM mã nguồn mở phổ biến cho thấy tỉ lệ ẩn nấp của MEASER vượt trội so với các MEA hiện có (đối với DNN nói chung), đồng thời đạt tỉ lệ lỗi bit (bit error rate – BER) bằng 0 ở mọi thiết lập. MEASER cũng duy trì độ ẩn nấp cao đối với mô hình đã được lượng tử hóa.
– Kết luận và kêu gọi: Do hiệu quả tấn công đáng kể, nhóm tác giả kêu gọi nghiên cứu các biện pháp đối phó (countermeasures) chống MEASER.

Thông tin nộp bài:
– [Submitted on 12 Oct 2025 (v1), last revised 25 Apr 2026 (this version, v2)]
– Submission history: From: Qian Chen [v1] Sun, 12 Oct 2025 07:33:56 UTC (1,730 KB); [v2] Sat, 25 Apr 2026 03:41:56 UTC (3,422 KB)

Nghiên cứu này làm nổi bật một lỗ hổng quan trọng trong hệ sinh thái LLM mã nguồn mở và nhắc nhở cộng đồng cần nhanh chóng điều tra và phát triển các biện pháp phòng vệ phù hợp.


Nguồn: arxiv.org

Đăng ngày: 2026-04-28 11:00:00 • Tác giả: Ming Tan, Wei Li, Hu Tao, Hailong Ma, Aodi Liu, Qian Chen, Zilong Wang

Để lại một bình luận

Lên đầu trang