Hướng dẫn sử dụng

Tạo đợt đánh giá hội thoại mới

Người dùng có thể tạo đợt đánh giá bằng cách vào menu Phân tích → tab Đánh giá hội thoại → nhấn nút + Tạo đánh giá. Hệ thống mở popup gồm 2 bước:

Bước 1 – Chọn dữ liệu đánh giá

Điền các thông tin sau tại popup Tạo đánh giá:

Tên đánh giá (bắt buộc): Tối đa 50 ký tự, không được trùng với tên đánh giá khác đã tạo.
Thời gian bắt đầu hội thoại (Từ… Đến): Hệ thống lấy toàn bộ hội thoại có thời điểm bắt đầu và kết thúc đều nằm trong khoảng này. Khoảng thời gian tối đa 30 ngày, mặc định là 24 giờ tính từ thời điểm hiện tại.
Số lượng hội thoại dự kiến được đánh giá: Sau khi chọn khoảng thời gian, hệ thống đếm số hội thoại tìm thấy.

Hệ thống sẽ đánh giá riêng biệt theo từng câu Q&A hoặc từng luồng Quy trình nghiệp vụ (Business Process) được bóc tách từ các cuộc hội thoại dự kiến ở trên.

Nhấn Bước tiếp theo để chuyển sang bước cấu hình.

Bước 2 – Cấu hình quy tắc đánh giá

Cấu hình các thông số đánh giá:

Mô hình LLM (bắt buộc): Lựa chọn mô hình AI dùng để đánh giá kết quả hội thoại.
Tiêu chí đánh giá: Mặc định hệ thống đánh giá 3 tiêu chí với trọng số như sau:
- (A) Độ chính xác (Correctness): Kiểm tra câu trả lời có đúng với kết quả mong đợi không. Trọng số mặc định: 80%. Đạt (+80%), Không đạt (+0%).
- (B) An toàn (Safety): Đánh giá câu trả lời có an toàn, không gây hại, thiên vị hoặc nội dung không phù hợp. Trọng số mặc định: 10%. Đạt (+10%), Không đạt (+0%).
- (C) Độ trôi chảy (Fluency): Kiểm tra ngữ pháp, từ vựng và tính tự nhiên của câu trả lời. Trọng số mặc định: 10%. Đạt (+10%), Không đạt (+0%).
Ngưỡng đạt tổng thể: Mặc định 80%. Tổng điểm trọng số của các tiêu chí Đạt ≥ ngưỡng này thì kết quả Tổng thể là Đạt.
Ngôn ngữ đánh giá: Ngôn ngữ hiển thị giải thích kết quả đánh giá. Mặc định theo ngôn ngữ giao diện (Tiếng Việt). Hỗ trợ: Tiếng Việt, Anh, Nhật, Indonesia.

Tiêu chí	Mô tả	Trọng số mặc định	Khi Đạt / Không đạt
(A) Độ chính xác	Câu trả lời có đúng với kết quả mong đợi không	80%	Đạt (+80%) / Không đạt (+0%)
(B) An toàn	Câu trả lời có chứa nội dung gây hại, thiên vị, không phù hợp không	10%	Đạt (+10%) / Không đạt (+0%)
(C) Độ trôi chảy	Ngữ pháp, từ vựng và tính tự nhiên của câu trả lời	10%	Đạt (+10%) / Không đạt (+0%)

Ví dụ minh họa cách tính điểm tổng thể (ngưỡng 80%):

Mẫu đánh giá	Độ chính xác	An toàn	Độ trôi chảy	Tổng điểm	Tổng thể
Mẫu 1	Đạt	Đạt	Không đạt	80% + 10% = 90% ≥ 80%	Đạt
Mẫu 2	Không đạt	Đạt	Đạt	10% + 10% = 20% < 80%	Không đạt

Bước 3 – Chạy đánh giá

Nhấn nút Chạy đánh giá để khởi chạy. Hệ thống chuyển về màn hình danh sách và hiển thị đợt đánh giá mới với trạng thái đánh giá của AI là Đang xử lý. Sau khi nhấn Chạy đánh giá, AI sẽ tự động phân loại các mẫu (QnA và Business Process) và đánh giá chất lượng. Quá trình này mất vài phút. Khi hoàn tất, hệ thống thông báo để bắt đầu kiểm duyệt và phân công cho đội ngũ QC.

Danh sách các đợt đánh giá

Màn hình Đánh giá hội thoại hiển thị toàn bộ các đợt đánh giá đã tạo, kèm thông tin trạng thái, thời gian và kết quả. Người dùng có thể tìm kiếm theo tên đánh giá, lọc theo trạng thái AI đánh giá hoặc trạng thái hậu kiểm của QC, và xem chi tiết từng đợt.

Mô tả các cột thông tin trong danh sách:

Cột	Mô tả
Tên nhiệm vụ đánh giá	Tên đợt đánh giá đã đặt khi tạo
Khoảng thời gian bắt đầu hội thoại	Khoảng thời gian (Từ – Đến) được chọn để lấy dữ liệu hội thoại
Thời gian đánh giá	Thời điểm tạo đợt đánh giá (hoặc thời điểm chạy lại)
Trạng thái đánh giá của AI	Trạng thái hiện tại của quá trình đánh giá tự động (Đang xử lý / Hoàn thành / Đã hủy / Lỗi)
Trạng thái hậu kiểm của QC	Trạng thái review của nhân viên QC (Chờ phân công / Đang hậu kiểm / Hoàn tất hậu kiểm)
Kết quả đạt tổng thể	Tỷ lệ mẫu đánh giá đạt trên tổng số mẫu (ví dụ: 4/8 – 50%)

Các trạng thái đánh giá của AI và hành động tương ứng:

Trạng thái AI	Mô tả	Hành động khả dụng
Đang xử lý	AI đang phân loại và đánh giá từng mẫu hội thoại	- Xem tiến trình: Nhấn vào đợt để xem số lượng mẫu đã đánh giá trên tổng. - Hủy đánh giá: Hủy toàn bộ tiến trình. Kết quả đang chạy dở không được lưu. - Xem lại cấu hình.
Hoàn thành	Quá trình đánh giá đã kết thúc. Có thể xem kết quả chi tiết và phân công QC.	- Xem chi tiết kết quả. - Xem lại cấu hình. - Phân công QC review (nếu là QC Lead). - Xóa đợt đánh giá.
Đã hủy	Người dùng đã hủy đánh giá giữa chừng	- Chạy lại: Tạo lại đợt đánh giá với cấu hình cũ. - Xem lại cấu hình. - Xóa.
Lỗi	Đợt đánh giá gặp lỗi hệ thống	- Chạy lại: Thực hiện lại toàn bộ với cấu hình cũ. - Xem lại cấu hình. - Xóa.

Các trạng thái hậu kiểm của QC (sau khi AI hoàn thành):

Trạng thái QC	Mô tả	Kết quả tổng thể hiển thị
Chờ phân công	QC Lead cần vào phân công nhiệm vụ review cho các QC member	Số mẫu AI đánh giá Đạt / Tổng
Đang hậu kiểm	Đã phân công xong, QC đang thực hiện review. Hiển thị số mẫu đang chờ / đã review trên tổng	Số mẫu AI đánh giá Đạt / Tổng
Hoàn tất hậu kiểm	Toàn bộ mẫu đã được QC review xong	Số mẫu QC đánh giá Đạt / Tổng (bao gồm các mẫu QC chấp nhận kết quả AI)

Phân công QC hậu kiểm

Sau khi AI đánh giá Hoàn thành, trạng thái QC chuyển sang Chờ phân công. QC Lead nhấn vào đợt đánh giá để vào trang chi tiết, sau đó nhấn nút Phân công thành viên QC để phân chia mẫu review cho các nhân viên QC.

Popup Phân công gồm các phần:

1 – Chọn chế độ hậu kiểm (QC Review Mode)

Hậu kiểm toàn bộ các mẫu đánh giá: QC review toàn bộ mẫu đã đánh giá.
Chỉ hậu kiểm các mẫu có độ tin cậy thấp: Chỉ QC review các mẫu AI đánh giá với độ tin cậy thấp do hệ thống tự lọc ra, giúp tập trung vào những trường hợp AI không chắc chắn. Trường hợp không có mẫu nào có độ tin cậy thấp thì hệ thống không cho phép người dùng lựa chọn.

2 – Chọn thành viên QC và phân bổ số lượng mẫu

Tìm kiếm và chọn các QC member (bao gồm cả Agent Admin, QC Lead, QC). Hệ thống tự động phân bổ đều số mẫu cho các thành viên được chọn. Người dùng có thể chỉnh thủ công.
Phần Xem trước phân công sẽ hiển thị: chế độ hậu kiểm, số người hậu kiểm, tổng mẫu cần hậu kiểm và tổng mẫu đã phân bổ. Hệ thống cảnh báo nếu tổng mẫu phân bổ chưa bằng tổng mẫu cần review.

3 – Xác nhận phân công

Nhấn Phân công & Bắt đầu review. Hệ thống gửi thông báo phân công thành công và chuyển trạng thái QC sang Đang hậu kiểm.

Sau khi phân công, QC Lead chỉ có thể xem lại thông tin phân công (chế độ xem, không được cập nhật). QC Lead có quyền review toàn bộ mẫu, kể cả những mẫu đang được phân công cho người khác.

Xem kết quả chi tiết đợt đánh giá

Nhấn vào tên đợt đánh giá ở danh sách để vào trang Kết quả chi tiết. Trang này gồm các phần sau:

(1) Phần tổng quan

Hiển thị tổng hợp kết quả theo từng tiêu chí:

Tổng thể: Số mẫu Đạt / Tổng số mẫu và tỷ lệ %.
Độ chính xác: Số mẫu Đạt / Tổng và tỷ lệ %.
An toàn: Số mẫu Đạt / Tổng và tỷ lệ %.
Độ trôi chảy: Số mẫu Đạt / Tổng và tỷ lệ %.

Kết quả tổng quan ưu tiên lấy kết quả QC đã review (nếu có), cập nhật thời gian thực khi QC lưu kết quả.

(2) Tìm kiếm và lọc

Tìm kiếm: Theo câu hỏi, câu trả lời, tên người gửi hoặc Conversation ID.
Lọc theo loại: Tab Tất cả / QnA / Business Process.
Lọc theo kết quả theo từng tiêu chí: Đạt / Không đạt của từng tiêu chí và tổng thể.
Lọc theo trạng thái QC: Chờ kiểm tra / Đã kiểm tra.

(3) Bảng kết quả chi tiết

Hệ thống gom các cặp câu hỏi – câu trả lời hoặc các luồng quy trình nghiệp vụ theo Conversation ID. Thông tin hiển thị gồm:

Cột	Mô tả
Thời gian yêu cầu	Thời điểm người dùng gửi tin nhắn
Tin nhắn	Số lượng tin nhắn của người dùng trong hội thoại
Câu hỏi	Câu hỏi của người dùng (nhấn Xem thêm để xem đầy đủ)
Câu trả lời	Câu trả lời của Agent (nhấn Xem thêm để xem đầy đủ)
Loại chatlog	Phân loại QnA hoặc Business Process
Tổng thể / Độ chính xác / An toàn / Độ trôi chảy	Kết quả Đạt / Không đạt của từng tiêu chí và tổng thể
Được giao	Tên QC member được phân công review mẫu này
Trạng thái QC	Chờ kiểm tra / Đã kiểm tra
Được review bởi	Tên tài khoản đã thực hiện kiểm tra

(4) Xuất dữ liệu

Nhấn biểu tượng tải xuống (góc trên phải bảng kết quả) để xuất toàn bộ kết quả đánh giá ra file Excel về máy, phục vụ phân tích sâu hoặc lưu trữ.

Xem chi tiết và QC hậu kiểm từng mẫu đánh giá

Nhấn đúp (Double click) vào bất kỳ mẫu nào trong bảng kết quả, hệ thống hiển thị popup Chi tiết đánh giá gồm đầy đủ thông tin và cho phép QC điều chỉnh kết quả.

Thông tin hiển thị trong Chi tiết đánh giá:

Phần	Nội dung
Thông tin chung	Tên người dùng, Thời gian yêu cầu, Conversation ID, Kênh, Loại chatlog, Trạng thái QC, Xem chi tiết lịch sử
Chi tiết Q&A / Business Process	Câu hỏi của người dùng và câu trả lời đầy đủ của Agent hoặc cả luồng quy trình nghiệp vụ
Giải thích kết quả	AI giải thích chi tiết lý do đánh giá Đạt / Không đạt cho từng tiêu chí: Độ chính xác, An toàn, Độ trôi chảy
AI đánh giá	Kết quả Overall và từng tiêu chí do AI chấm, kèm độ tin cậy
QC hậu kiểm	Cho phép QC cập nhật kết quả từng tiêu chí, nhập ghi chú (QC Note) và lưu kết quả

​Tạo đợt đánh giá hội thoại mới

​Bước 1 – Chọn dữ liệu đánh giá

​Bước 2 – Cấu hình quy tắc đánh giá

​Bước 3 – Chạy đánh giá

​Danh sách các đợt đánh giá

​Phân công QC hậu kiểm

​Xem kết quả chi tiết đợt đánh giá

​(1) Phần tổng quan

​(2) Tìm kiếm và lọc

​(3) Bảng kết quả chi tiết

​(4) Xuất dữ liệu

​Xem chi tiết và QC hậu kiểm từng mẫu đánh giá

Tạo đợt đánh giá hội thoại mới

Bước 1 – Chọn dữ liệu đánh giá

Bước 2 – Cấu hình quy tắc đánh giá

Bước 3 – Chạy đánh giá

Danh sách các đợt đánh giá

Phân công QC hậu kiểm

Xem kết quả chi tiết đợt đánh giá

(1) Phần tổng quan

(2) Tìm kiếm và lọc

(3) Bảng kết quả chi tiết

(4) Xuất dữ liệu

Xem chi tiết và QC hậu kiểm từng mẫu đánh giá