Thế giới rò rỉ tương lai: Tận dụng tiến hóa cho các tác nhân dự đoán tương lai

Tiêu đề: The World Leaks the Future: Tận dụng tiến hóa cho các tác nhân dự đoán tương lai

Tác giả: Chuyang Wei, Maohang Gao, Zhixin Han, Kefei Chen, Yu Zhuang, Haoxiang Guan, Yanzhi Zhang, Yilin Cheng, Jiyan He, Huanhuan Chen, Jian Li, Yu Shi, Yitong Duan, Shuxin Zheng

Tóm tắt: Nhiều quyết định quan trọng phải được đưa ra trước khi kết quả liên quan được biết. Những bài toán này thường được trình bày dưới dạng dự đoán tương lai, trong đó một tác nhân LLM phải đưa ra dự báo cho một câu hỏi chưa được giải quyết chỉ dựa trên thông tin công khai có sẵn tại thời điểm dự đoán. Bối cảnh này khó khăn vì bằng chứng công khai luôn thay đổi trong khi sự giám sát hữu ích chỉ xuất hiện sau khi câu hỏi được giải quyết, nên hầu hết các phương pháp hiện có vẫn chủ yếu cải thiện dựa trên kết quả cuối cùng. Tuy nhiên, kết quả cuối cùng quá thô để hướng dẫn việc theo dõi các yếu tố sớm hơn, thu thập và diễn giải bằng chứng, hoặc xử lý bất định. Khi cùng một câu hỏi chưa được giải quyết được xem xét lại theo thời gian, sự đối chiếu theo thời gian giữa dự đoán trước và sau có thể phơi bày những thiếu sót trong quy trình dự đoán ban đầu; chúng tôi gọi tín hiệu này là phản hồi nội bộ.

Chúng tôi giới thiệu Milkyway, một hệ thống tác nhân tự tiến hóa giữ nguyên mô hình nền và thay vào đó cập nhật một khung làm việc bền vững cho dự đoán tương lai nhằm theo dõi các yếu tố, thu thập và diễn giải bằng chứng, và xử lý bất định. Qua các lần dự đoán lặp lại trên cùng một câu hỏi chưa được giải quyết, Milkyway trích xuất phản hồi nội bộ và ghi lại hướng dẫn có thể tái sử dụng vào khung làm việc, để các dự đoán sau đó cho câu hỏi đó có thể cải thiện ngay cả trước khi kết quả được biết. Sau khi câu hỏi được giải quyết, kết quả cuối cùng cung cấp một kiểm tra hồi cứu trước khi khung làm việc đã cập nhật được đem áp dụng cho các câu hỏi tiếp theo.

Trên bộ dữ liệu FutureX và FutureWorld, Milkyway đạt điểm tổng thể tốt nhất trong các phương pháp so sánh, cải thiện điểm FutureX từ 44.07 lên 60.90 và FutureWorld từ 62.22 lên 77.96.

Lịch sử nộp bài: Gửi lần đầu vào 17 Apr 2026 (v1), lần sửa cuối 20 Apr 2026 (phiên bản này, v2).
Submission history: From: Chuyang Wei [v1] Fri, 17 Apr 2026 05:43:07 UTC (730 KB); [v2] Mon, 20 Apr 2026 05:54:13 UTC (730 KB).

Nguồn: arxiv.org

Đăng ngày: 2026-04-21 11:00:00 • Tác giả: Chuyang Wei, Maohang Gao, Zhixin Han, Kefei Chen, Yu Zhuang, Haoxiang Guan, Yanzhi Zhang, Yilin Cheng, Jiyan He, Huanhuan Chen, Jian Li, Yu Shi, Yitong Duan, Shuxin Zheng

This article is also published as a forum topic here »

Đọc thêm

Để lại một bình luận Huỷ trả lời