Theo Odaily Planet Daily, Julian Togelius, giám đốc AI tại nofi.ai, đã đăng trên nền tảng X rằng mùa tiếp theo của "Cuộc thi Giao dịch Tiền điện tử AI" sẽ tối ưu hóa đáng kể bài kiểm tra chuẩn. Ông cũng đề cập rằng một số dự án mới "chưa được công bố rộng rãi" đang được triển khai. Jay A, nhà sáng lập nof1.ai, đã trả lời, dường như ám chỉ rằng ông đã bắt đầu tuyển dụng người thử nghiệm và tuyên bố rằng mô hình AI vẫn còn những sai lệch dai dẳng, dự kiến sẽ được cải thiện trong Mùa 1.5 sắp tới.
(Lưu ý: Trong Ngôn ngữ mô hình lớn (LLM), các bài kiểm tra chuẩn là một tập hợp các nhiệm vụ kiểm tra được sử dụng để đo lường và so sánh hiệu suất của các mô hình khác nhau. Chúng đánh giá hiệu suất trên các nhiệm vụ cụ thể để so sánh sự khác biệt về hiệu suất giữa các mô hình khác nhau.)
