- Tạo đợt đánh giá (Eval Task) bằng cách chọn khoảng thời gian lấy dữ liệu hội thoại thực tế.
- Cấu hình mô hình AI đánh giá, tiêu chí chất lượng và trọng số điểm.
- Phân công nhân viên QC hậu kiểm lại kết quả AI đã chấm.
- Xem chi tiết kết quả và xuất báo cáo Excel. Cách hoạt động: Hệ thống lấy toàn bộ hội thoại đã kết thúc trong khoảng thời gian được chọn → phân loại từng cặp câu hỏi – câu trả lời theo loại (QnA, Business Process) → AI Judge Model đánh giá từng mẫu theo các tiêu chí đã cấu hình (Độ chính xác, An toàn, Độ trôi chảy) → tổng hợp kết quả Overall → QC hậu kiểm và điều chỉnh nếu cần.
- Đánh giá chất lượng hội thoại thực tế: Sử dụng dữ liệu hội thoại thực thay vì testcase tĩnh, phản ánh đúng chất lượng Agent trong vận hành.
- Kết hợp AI và QC con người: AI chấm điểm nhanh toàn bộ mẫu, QC tập trung review các trường hợp không chắc chắn (độ tin cậy thấp), nâng cao hiệu quả kiểm soát chất lượng.
- Theo dõi và truy vết đầy đủ: Xem chi tiết từng hội thoại, tổng hợp theo đợt đánh giá, xuất báo cáo Excel để phân tích sâu hoặc lưu trữ. Phân quyền truy cập:
- Tenant Admin / Agent Admin / QC Lead: Toàn quyền tạo, cấu hình, phân công và xem kết quả.
- QC Member: Chỉ xem và thực hiện review các mẫu được phân công.