
AI dự báo chuỗi thời gian
Miễn phí

Mô hình nền tảng decoder-only của Google cho dự báo chuỗi thời gian đại diện cho một bước ngoặt so với các mô hình RNN và LSTM truyền thống. Bằng cách tận dụng kiến trúc dựa trên transformer—cụ thể là cấu trúc decoder-only tương tự như các LLM—nó xử lý dữ liệu chuỗi thời gian như các chuỗi token. Cách tiếp cận này cho phép mô hình nắm bắt các phụ thuộc thời gian dài hạn và tương quan giữa các biến mà các phương pháp thống kê tiêu chuẩn thường bỏ lỡ. Nó vượt trội trong dự báo zero-shot, cho phép người dùng áp dụng các mô hình đã được huấn luyện sẵn vào các tập dữ liệu mới mà không cần tinh chỉnh chuyên sâu. Kiến trúc này lý tưởng cho các nhà khoa học dữ liệu và chuyên gia phân tích định lượng cần mô hình dự đoán mạnh mẽ, có khả năng mở rộng và độ chính xác cao trên các miền chuỗi thời gian không đồng nhất.
Khác với các mô hình encoder-decoder vốn gặp vấn đề về nút thắt thông tin, cách tiếp cận decoder-only này sử dụng cơ chế causal masking để dự đoán các giá trị tương lai dựa trên các token quá khứ. Điều này phản ánh sự thành công của các kiến trúc kiểu GPT, cho phép mô hình xử lý chuỗi thời gian đa biến như một chuỗi thống nhất, cải thiện đáng kể khả năng nắm bắt các động lực thời gian phi tuyến tính so với các mô hình không gian trạng thái truyền thống.
Mô hình được huấn luyện trước trên các tập dữ liệu chuỗi thời gian khổng lồ và đa dạng, cho phép nó tổng quát hóa sang các miền mới, chưa từng thấy mà không cần huấn luyện lại. Điều này loại bỏ vấn đề 'khởi động lạnh' (cold start) trong dự báo, nơi dữ liệu lịch sử không đủ thường ngăn cản sự hội tụ hiệu quả của mô hình. Nó cung cấp các dự đoán chất lượng cao ngay lập tức cho các sản phẩm hoặc thị trường mới.
Bằng cách chuyển đổi các giá trị chuỗi thời gian liên tục thành các token rời rạc, mô hình tận dụng các lớp embedding để ánh xạ các mẫu phức tạp vào một không gian tiềm ẩn (latent space) có chiều cao. Điều này cho phép transformer chú trọng vào các đặc trưng thời gian và các điểm bất thường cụ thể, xử lý hiệu quả nhiễu và tính mùa vụ vốn thường làm giảm hiệu suất của các mô hình thống kê cổ điển như SARIMA.
Kiến trúc hỗ trợ nguyên bản các đầu vào đa biến, cho phép mô hình tiếp nhận hàng trăm biến chuỗi thời gian liên quan cùng lúc. Bằng cách sử dụng cơ chế self-attention, nó xác định các phụ thuộc chéo giữa các biến—chẳng hạn như cách biến động giá của một tài sản tương quan với thay đổi khối lượng của tài sản khác—cung cấp cái nhìn toàn diện mà các mô hình đơn biến không thể đạt được.
Các mô hình truyền thống thường gặp khó khăn với các phụ thuộc dài hạn do hiện tượng triệt tiêu gradient (vanishing gradients). Mô hình dựa trên transformer này sử dụng cơ chế global self-attention để liên kết bất kỳ hai điểm nào trong chuỗi thời gian bất kể khoảng cách của chúng. Điều này đảm bảo rằng các xu hướng lịch sử từ nhiều tháng trước vẫn có thể ảnh hưởng đến các dự đoán hiện tại, dẫn đến độ chính xác vượt trội trong các tác vụ dự báo tầm xa.
Các nhà quản lý vận hành sử dụng mô hình này để dự đoán nhu cầu hàng tồn kho cho hàng ngàn SKU. Bằng cách phân tích doanh số lịch sử, xu hướng theo mùa và các chỉ số kinh tế bên ngoài, mô hình giúp giảm thiểu tình trạng thiếu hàng và chi phí tồn kho dư thừa bằng cách cung cấp các dự báo nhu cầu dài hạn chính xác hơn so với các phương pháp trung bình trượt truyền thống.
Các chuyên gia phân tích định lượng áp dụng mô hình vào các tập dữ liệu tài chính đa biến để dự đoán biến động giá tài sản. Bằng cách tương quan các token về giá, khối lượng và độ biến động, mô hình xác định các mẫu phi tuyến tính phức tạp, hỗ trợ các chiến lược giao dịch thuật toán và các giao thức quản lý rủi ro.
Các công ty điện lực sử dụng mô hình để dự báo nhu cầu điện dựa trên các kiểu thời tiết và mức tiêu thụ lịch sử. Điều này cho phép tối ưu hóa phân phối năng lượng và ổn định lưới điện, ngăn ngừa mất điện trong các giai đoạn nhu cầu cao điểm bằng cách dự đoán chính xác các đợt tăng tải trước nhiều giờ.
Cần các công cụ dự báo mạnh mẽ, có khả năng mở rộng, giúp giảm thiểu nhu cầu kỹ thuật đặc trưng thủ công và tinh chỉnh siêu tham số trên mỗi tập dữ liệu mới.
Yêu cầu các mô hình có độ chính xác cao, có khả năng xác định các tương quan phi tuyến tính phức tạp trong các tập dữ liệu tài chính hoặc khoa học đa biến quy mô lớn.
Đang tìm kiếm các kiến trúc mô hình nền tảng có thể triển khai như một dịch vụ để cung cấp khả năng dự báo tổng quát trên toàn bộ doanh nghiệp.
Dự án dựa trên nghiên cứu. Mã nguồn mở và các mô hình đã được huấn luyện sẵn có sẵn thông qua GitHub của Google Research theo giấy phép Apache 2.0.