Giới thiệu - AI Agents Docs

Đánh giá hội thoại (Chatlog Evaluation) là tính năng cho phép hệ thống tự động phân tích và đánh giá chất lượng các hội thoại thực tế giữa người dùng và AI Agent theo các tiêu chí đã cấu hình. Người dùng có thể:

Tạo đợt đánh giá (Eval Task) bằng cách chọn khoảng thời gian lấy dữ liệu hội thoại thực tế.
Cấu hình mô hình AI đánh giá, tiêu chí chất lượng và trọng số điểm.
Phân công nhân viên QC hậu kiểm lại kết quả AI đã chấm.
Xem chi tiết kết quả và xuất báo cáo Excel. Cách hoạt động: Hệ thống lấy toàn bộ hội thoại đã kết thúc trong khoảng thời gian được chọn → phân loại từng cặp câu hỏi – câu trả lời theo loại (QnA, Business Process) → AI Judge Model đánh giá từng mẫu theo các tiêu chí đã cấu hình (Độ chính xác, An toàn, Độ trôi chảy) → tổng hợp kết quả Overall → QC hậu kiểm và điều chỉnh nếu cần.

Lợi ích chính:

Đánh giá chất lượng hội thoại thực tế: Sử dụng dữ liệu hội thoại thực thay vì testcase tĩnh, phản ánh đúng chất lượng Agent trong vận hành.
Kết hợp AI và QC con người: AI chấm điểm nhanh toàn bộ mẫu, QC tập trung review các trường hợp không chắc chắn (độ tin cậy thấp), nâng cao hiệu quả kiểm soát chất lượng.
Theo dõi và truy vết đầy đủ: Xem chi tiết từng hội thoại, tổng hợp theo đợt đánh giá, xuất báo cáo Excel để phân tích sâu hoặc lưu trữ. Phân quyền truy cập:
Tenant Admin / Agent Admin / QC Lead: Toàn quyền tạo, cấu hình, phân công và xem kết quả.
QC Member: Chỉ xem và thực hiện review các mẫu được phân công.