Tạo đợt đánh giá hội thoại mới
Người dùng có thể tạo đợt đánh giá bằng cách vào menu Phân tích → tab Đánh giá hội thoại → nhấn nút + Tạo đánh giá. Hệ thống mở popup gồm 2 bước:
Bước 1 – Chọn dữ liệu đánh giá
Điền các thông tin sau tại popup Tạo đánh giá:
- Tên đánh giá (bắt buộc): Tối đa 50 ký tự, không được trùng với tên đánh giá khác đã tạo.
- Thời gian bắt đầu hội thoại (Từ… Đến): Hệ thống lấy toàn bộ hội thoại có thời điểm bắt đầu và kết thúc đều nằm trong khoảng này. Khoảng thời gian tối đa 30 ngày, mặc định là 24 giờ tính từ thời điểm hiện tại.
- Số lượng hội thoại dự kiến được đánh giá: Sau khi chọn khoảng thời gian, hệ thống đếm số hội thoại tìm thấy.
Hệ thống sẽ đánh giá riêng biệt theo từng câu Q&A hoặc từng luồng Quy trình nghiệp vụ (Business Process) được bóc tách từ các cuộc hội thoại dự kiến ở trên.
Nhấn Bước tiếp theo để chuyển sang bước cấu hình.
Bước 2 – Cấu hình quy tắc đánh giá
Cấu hình các thông số đánh giá:
- Mô hình LLM (bắt buộc): Lựa chọn mô hình AI dùng để đánh giá kết quả hội thoại.
- Tiêu chí đánh giá: Mặc định hệ thống đánh giá 3 tiêu chí với trọng số như sau:
- (A) Độ chính xác (Correctness): Kiểm tra câu trả lời có đúng với kết quả mong đợi không. Trọng số mặc định: 80%. Đạt (+80%), Không đạt (+0%).
- (B) An toàn (Safety): Đánh giá câu trả lời có an toàn, không gây hại, thiên vị hoặc nội dung không phù hợp. Trọng số mặc định: 10%. Đạt (+10%), Không đạt (+0%).
- (C) Độ trôi chảy (Fluency): Kiểm tra ngữ pháp, từ vựng và tính tự nhiên của câu trả lời. Trọng số mặc định: 10%. Đạt (+10%), Không đạt (+0%).
- Ngưỡng đạt tổng thể: Mặc định 80%. Tổng điểm trọng số của các tiêu chí Đạt ≥ ngưỡng này thì kết quả Tổng thể là Đạt.
- Ngôn ngữ đánh giá: Ngôn ngữ hiển thị giải thích kết quả đánh giá. Mặc định theo ngôn ngữ giao diện (Tiếng Việt). Hỗ trợ: Tiếng Việt, Anh, Nhật, Indonesia.
| Tiêu chí | Mô tả | Trọng số mặc định | Khi Đạt / Không đạt |
|---|
| (A) Độ chính xác | Câu trả lời có đúng với kết quả mong đợi không | 80% | Đạt (+80%) / Không đạt (+0%) |
| (B) An toàn | Câu trả lời có chứa nội dung gây hại, thiên vị, không phù hợp không | 10% | Đạt (+10%) / Không đạt (+0%) |
| (C) Độ trôi chảy | Ngữ pháp, từ vựng và tính tự nhiên của câu trả lời | 10% | Đạt (+10%) / Không đạt (+0%) |
Ví dụ minh họa cách tính điểm tổng thể (ngưỡng 80%):
| Mẫu đánh giá | Độ chính xác | An toàn | Độ trôi chảy | Tổng điểm | Tổng thể |
|---|
| Mẫu 1 | Đạt | Đạt | Không đạt | 80% + 10% = 90% ≥ 80% | Đạt |
| Mẫu 2 | Không đạt | Đạt | Đạt | 10% + 10% = 20% < 80% | Không đạt |
Bước 3 – Chạy đánh giá
Nhấn nút Chạy đánh giá để khởi chạy. Hệ thống chuyển về màn hình danh sách và hiển thị đợt đánh giá mới với trạng thái đánh giá của AI là Đang xử lý.
Sau khi nhấn Chạy đánh giá, AI sẽ tự động phân loại các mẫu (QnA và Business Process) và đánh giá chất lượng. Quá trình này mất vài phút. Khi hoàn tất, hệ thống thông báo để bắt đầu kiểm duyệt và phân công cho đội ngũ QC.
Danh sách các đợt đánh giá
Màn hình Đánh giá hội thoại hiển thị toàn bộ các đợt đánh giá đã tạo, kèm thông tin trạng thái, thời gian và kết quả. Người dùng có thể tìm kiếm theo tên đánh giá, lọc theo trạng thái AI đánh giá hoặc trạng thái hậu kiểm của QC, và xem chi tiết từng đợt.
Mô tả các cột thông tin trong danh sách:
| Cột | Mô tả |
|---|
| Tên nhiệm vụ đánh giá | Tên đợt đánh giá đã đặt khi tạo |
| Khoảng thời gian bắt đầu hội thoại | Khoảng thời gian (Từ – Đến) được chọn để lấy dữ liệu hội thoại |
| Thời gian đánh giá | Thời điểm tạo đợt đánh giá (hoặc thời điểm chạy lại) |
| Trạng thái đánh giá của AI | Trạng thái hiện tại của quá trình đánh giá tự động (Đang xử lý / Hoàn thành / Đã hủy / Lỗi) |
| Trạng thái hậu kiểm của QC | Trạng thái review của nhân viên QC (Chờ phân công / Đang hậu kiểm / Hoàn tất hậu kiểm) |
| Kết quả đạt tổng thể | Tỷ lệ mẫu đánh giá đạt trên tổng số mẫu (ví dụ: 4/8 – 50%) |
Các trạng thái đánh giá của AI và hành động tương ứng:
| Trạng thái AI | Mô tả | Hành động khả dụng |
|---|
| Đang xử lý | AI đang phân loại và đánh giá từng mẫu hội thoại | - Xem tiến trình: Nhấn vào đợt để xem số lượng mẫu đã đánh giá trên tổng. - Hủy đánh giá: Hủy toàn bộ tiến trình. Kết quả đang chạy dở không được lưu. - Xem lại cấu hình. |
| Hoàn thành | Quá trình đánh giá đã kết thúc. Có thể xem kết quả chi tiết và phân công QC. | - Xem chi tiết kết quả. - Xem lại cấu hình. - Phân công QC review (nếu là QC Lead). - Xóa đợt đánh giá. |
| Đã hủy | Người dùng đã hủy đánh giá giữa chừng | - Chạy lại: Tạo lại đợt đánh giá với cấu hình cũ. - Xem lại cấu hình. - Xóa. |
| Lỗi | Đợt đánh giá gặp lỗi hệ thống | - Chạy lại: Thực hiện lại toàn bộ với cấu hình cũ. - Xem lại cấu hình. - Xóa. |
Các trạng thái hậu kiểm của QC (sau khi AI hoàn thành):
| Trạng thái QC | Mô tả | Kết quả tổng thể hiển thị |
|---|
| Chờ phân công | QC Lead cần vào phân công nhiệm vụ review cho các QC member | Số mẫu AI đánh giá Đạt / Tổng |
| Đang hậu kiểm | Đã phân công xong, QC đang thực hiện review. Hiển thị số mẫu đang chờ / đã review trên tổng | Số mẫu AI đánh giá Đạt / Tổng |
| Hoàn tất hậu kiểm | Toàn bộ mẫu đã được QC review xong | Số mẫu QC đánh giá Đạt / Tổng (bao gồm các mẫu QC chấp nhận kết quả AI) |
Phân công QC hậu kiểm
Sau khi AI đánh giá Hoàn thành, trạng thái QC chuyển sang Chờ phân công. QC Lead nhấn vào đợt đánh giá để vào trang chi tiết, sau đó nhấn nút Phân công thành viên QC để phân chia mẫu review cho các nhân viên QC.
Popup Phân công gồm các phần:
1 – Chọn chế độ hậu kiểm (QC Review Mode)
- Hậu kiểm toàn bộ các mẫu đánh giá: QC review toàn bộ mẫu đã đánh giá.
- Chỉ hậu kiểm các mẫu có độ tin cậy thấp: Chỉ QC review các mẫu AI đánh giá với độ tin cậy thấp do hệ thống tự lọc ra, giúp tập trung vào những trường hợp AI không chắc chắn. Trường hợp không có mẫu nào có độ tin cậy thấp thì hệ thống không cho phép người dùng lựa chọn.
2 – Chọn thành viên QC và phân bổ số lượng mẫu
- Tìm kiếm và chọn các QC member (bao gồm cả Agent Admin, QC Lead, QC). Hệ thống tự động phân bổ đều số mẫu cho các thành viên được chọn. Người dùng có thể chỉnh thủ công.
- Phần Xem trước phân công sẽ hiển thị: chế độ hậu kiểm, số người hậu kiểm, tổng mẫu cần hậu kiểm và tổng mẫu đã phân bổ. Hệ thống cảnh báo nếu tổng mẫu phân bổ chưa bằng tổng mẫu cần review.
3 – Xác nhận phân công
- Nhấn Phân công & Bắt đầu review. Hệ thống gửi thông báo phân công thành công và chuyển trạng thái QC sang Đang hậu kiểm.
Sau khi phân công, QC Lead chỉ có thể xem lại thông tin phân công (chế độ xem, không được cập nhật). QC Lead có quyền review toàn bộ mẫu, kể cả những mẫu đang được phân công cho người khác.
Xem kết quả chi tiết đợt đánh giá
Nhấn vào tên đợt đánh giá ở danh sách để vào trang Kết quả chi tiết. Trang này gồm các phần sau:
(1) Phần tổng quan
Hiển thị tổng hợp kết quả theo từng tiêu chí:
- Tổng thể: Số mẫu Đạt / Tổng số mẫu và tỷ lệ %.
- Độ chính xác: Số mẫu Đạt / Tổng và tỷ lệ %.
- An toàn: Số mẫu Đạt / Tổng và tỷ lệ %.
- Độ trôi chảy: Số mẫu Đạt / Tổng và tỷ lệ %.
Kết quả tổng quan ưu tiên lấy kết quả QC đã review (nếu có), cập nhật thời gian thực khi QC lưu kết quả.
(2) Tìm kiếm và lọc
- Tìm kiếm: Theo câu hỏi, câu trả lời, tên người gửi hoặc Conversation ID.
- Lọc theo loại: Tab Tất cả / QnA / Business Process.
- Lọc theo kết quả theo từng tiêu chí: Đạt / Không đạt của từng tiêu chí và tổng thể.
- Lọc theo trạng thái QC: Chờ kiểm tra / Đã kiểm tra.
(3) Bảng kết quả chi tiết
Hệ thống gom các cặp câu hỏi – câu trả lời hoặc các luồng quy trình nghiệp vụ theo Conversation ID. Thông tin hiển thị gồm:
| Cột | Mô tả |
|---|
| Thời gian yêu cầu | Thời điểm người dùng gửi tin nhắn |
| Tin nhắn | Số lượng tin nhắn của người dùng trong hội thoại |
| Câu hỏi | Câu hỏi của người dùng (nhấn Xem thêm để xem đầy đủ) |
| Câu trả lời | Câu trả lời của Agent (nhấn Xem thêm để xem đầy đủ) |
| Loại chatlog | Phân loại QnA hoặc Business Process |
| Tổng thể / Độ chính xác / An toàn / Độ trôi chảy | Kết quả Đạt / Không đạt của từng tiêu chí và tổng thể |
| Được giao | Tên QC member được phân công review mẫu này |
| Trạng thái QC | Chờ kiểm tra / Đã kiểm tra |
| Được review bởi | Tên tài khoản đã thực hiện kiểm tra |
(4) Xuất dữ liệu
Nhấn biểu tượng tải xuống (góc trên phải bảng kết quả) để xuất toàn bộ kết quả đánh giá ra file Excel về máy, phục vụ phân tích sâu hoặc lưu trữ.
Xem chi tiết và QC hậu kiểm từng mẫu đánh giá
Nhấn đúp (Double click) vào bất kỳ mẫu nào trong bảng kết quả, hệ thống hiển thị popup Chi tiết đánh giá gồm đầy đủ thông tin và cho phép QC điều chỉnh kết quả.
Thông tin hiển thị trong Chi tiết đánh giá:
| Phần | Nội dung |
|---|
| Thông tin chung | Tên người dùng, Thời gian yêu cầu, Conversation ID, Kênh, Loại chatlog, Trạng thái QC, Xem chi tiết lịch sử |
| Chi tiết Q&A / Business Process | Câu hỏi của người dùng và câu trả lời đầy đủ của Agent hoặc cả luồng quy trình nghiệp vụ |
| Giải thích kết quả | AI giải thích chi tiết lý do đánh giá Đạt / Không đạt cho từng tiêu chí: Độ chính xác, An toàn, Độ trôi chảy |
| AI đánh giá | Kết quả Overall và từng tiêu chí do AI chấm, kèm độ tin cậy |
| QC hậu kiểm | Cho phép QC cập nhật kết quả từng tiêu chí, nhập ghi chú (QC Note) và lưu kết quả |