Microsoft đã giới thiệu hai tính năng mới, Phê bình và Hội đồng, cho công cụ Nghiên cứu Copilot của mình. Theo NS3.AI, quy trình Phê bình đạt được 57.4 điểm trên tiêu chuẩn DRACO. Phê bình sử dụng GPT để soạn thảo và Claude để xem xét, trong khi Hội đồng vận hành cả hai mô hình đồng thời và sử dụng một mô hình đánh giá để đánh giá các đầu ra.