Chuyển đến nội dung chính

Documentation Index

Fetch the complete documentation index at: https://docs-agents.fpt.ai/llms.txt

Use this file to discover all available pages before exploring further.

Giới thiệu

Tính năng Xem bố cục tài liệu (View Document Layout) cho phép người dùng kiểm tra và hiệu chỉnh kết quả của bước Document Layout Analysis (DLA - Phân tích bố cục tài liệu) trong Ingest Pipeline của hệ thống FPT AI Agents. Tính năng này giúp người dùng:
  • Xem chi tiết kết quả xử lý của bước DLA: hiển thị cấu trúc bố cục tài liệu đã được hệ thống phân tích (bao gồm elements và các thông tin đi kèm của elements).
  • Chỉnh sửa thông tin element trong trường hợp hệ thống nhận diện chưa chính xác, bao gồm loại element (element type) và vị trí (location).
  • Thực thi lại các bước xử lý tiếp theo như Extract và Chunking sau khi hiệu chỉnh, nhằm cập nhật và tối ưu kết quả trích xuất dữ liệu.
Khi người dùng tải tài liệu lên làm tri thức cho Agent, hệ thống sẽ chạy Ingest Pipeline gồm các bước:
  1. Document Classification - Phân loại tài liệu
  2. Document Layout Analysis (DLA) - Phân tích bố cục tài liệu
  3. Extraction (Trích xuất): Text / Table / Figure / Slide
  4. Structure Reconstruction (Tái dựng cấu trúc)
  5. Chunking - Chia nhỏ thành các khối tri thức
Image40 DLA là bước phân tích cấu trúc tài liệu nhằm xác định các elements trên từng trang (text, title, table, figure, header, footer, list-item, …). Khi tài liệu được ingest vào hệ thống, DLA chạy tự động và trả về danh sách các elements cùng vị trí tương ứng của chúng trên tài liệu. Cấu trúc phân cấp của một văn bản thông thường:
Tiêu đề / main-title
  Đề mục cấp 1 (section-title lv 1)
    Đề mục cấp 2
      Đoạn văn
    Đề mục cấp 2
      Đoạn văn
      Bảng biểu
      Đoạn văn
      Hình ảnh
      Đề mục cấp 3
Danh sách và định nghĩa các elements hệ thống đang hỗ trợ:
STTLoại elementĐịnh nghĩa
1textĐoạn văn bản thông thường
2titlemain-title: Tiêu đề chính của văn bản; section-title: Đề mục phân cấp
3list-itemMột phần tử (thông thường là 1–3 dòng) của danh sách các phần tử trong một mục nào đó
4tableThông tin được biểu diễn dưới dạng ô lưới theo hàng cột phân chia bởi các đường kẻ, kể cả không có border
5header (page-header)Các đoạn text lặp đi lặp lại ở đầu trang, nằm bên ngoài luồng text thông thường (ví dụ: số trang ở trên đầu của trang)
6footer (page-footer)Các đoạn text lặp đi lặp lại ở chân trang, nằm bên ngoài luồng text thông thường (ví dụ: số trang ở chân của trang)
7figureBiểu đồ, logo, ảnh minh họa… Có thể bao gồm text đi kèm, tuy nhiên text này nếu không gắn với figure thì sẽ không có ý nghĩa
8formCác biểu mẫu điền thông tin
9footnoteGhi chú nhỏ cuối trang
10uselessNội dung không phục vụ tri thức (ví dụ: khẩu hiệu, tiêu ngữ…)
Việc gán đúng element type giúp hệ thống tái dựng cấu trúc và chunking chính xác hơn.
Image41

Giao diện tính năng

Giao diện gồm 3 khu vực chính: 1. Khu vực xem trước tài liệu (Document Preview)
  • Hiển thị từng trang của tài liệu dưới dạng hình ảnh.
  • Từng element được đánh bằng bounding box với màu sắc tương ứng.
  • Click vào element để xem chi tiết hoặc chỉnh sửa.
2. Bảng danh sách element (Element Panel)
  • Liệt kê toàn bộ element trên trang hiện tại.
  • Hiển thị thông tin element bao gồm: Loại element – Vị trí element.
  • Cho phép chọn element để chỉnh sửa.
3. Thanh tác vụ (Action Toolbar)
  • Đổi loại element
  • Phóng to, thu nhỏ kích thước hiển thị của văn bản
  • Điều chỉnh bounding box (khung bao bên ngoài element)
  • Xoá element
  • Chạy lại các bước sau DLA với kết quả vừa cập nhật

Hướng dẫn thao tác chi tiết

1. Mở và xem bố cục tài liệu
  1. Truy cập tab Kho tri thức → Chọn Danh sách tài liệu.
  2. Tại danh sách tài liệu, chọn tài liệu cần xem bố cục.
  3. Chọn nút tại tài liệu muốn xem DLA, chọn “Xem bố cục tài liệu”.
  4. Hệ thống hiển thị màn hình Xem bố cục tài liệu.
Image42 Image43 2. Xem chi tiết một element
  1. Chọn element từ trang hiển thị hoặc chọn element trong bảng danh sách.
  2. Hệ thống hiển thị: Loại element, Bounding box, Vị trí của element trên trang.
Image44 3. Chỉnh sửa loại element
  1. Chọn element cần chỉnh sửa.
  2. Hệ thống hiển thị dropdown list gồm danh sách các loại elements đang hỗ trợ.
  3. Chọn Element Type tương ứng từ dropdown.
  4. Hệ thống tự động lưu loại element mới và hiển thị thông tin loại element đã được cập nhật tại mục chi tiết element.
Image45 4. Chỉnh sửa vị trí element
  1. Chọn element cần chỉnh sửa vị trí.
  2. Kéo các cạnh của bounding box để điều chỉnh vùng.
  3. Hệ thống tự động lưu các thay đổi về vị trí và hiển thị tọa độ mới tại chi tiết element.
Image46
Image47
5. Xóa element
  1. Chọn element muốn xóa.
  2. Tại mục Chi tiết lựa chọn ở phía phải màn hình, chọn icon Xóa.
  3. Hệ thống tự động xóa element đã chọn khỏi danh sách và không hiển thị bounding box của element vừa bị xóa trên tài liệu.
Image49
Image50
6. Thực thi lại các bước xử lý (Re-run Processing)
  1. Tại thanh tác vụ (Action Toolbar), chọn nút Xử lý.
  2. Hệ thống tự động xử lý chạy lại các bước tiếp theo với các thông tin đã được cập nhật, kèm thông báo:
    • “Các thay đổi của bạn đang được xử lý. Vui lòng chờ trong giây lát.” — khi hệ thống đang xử lý.
    • “Các thay đổi của bạn đã được lưu và gửi đi xử lý thành công.” — khi xử lý thành công.
Image51

Hướng dẫn cách gán các loại element

1. Text text là nhãn cơ bản được sử dụng cho những đoạn văn thông thường — cho các văn bản không thuộc loại nhãn khác. Các thông tin lặp đi lặp lại như header, footer, page number sẽ không được gán nhãn này.
Image52
  • Đoạn văn bắt đầu với câu bôi đậm vẫn tính là text.
Image53
  • Đoạn trích dẫn trong quote " " được tính là text.
Image54
  • Nhiều dòng ngắn được tính là cùng một khối.
Image55
  • Khi có công thức mà xuống dòng, phải tách công thức đó thành từng khối riêng.
Image56 2. Title Tiêu đề của tài liệu được tính là title. Image57 Image58 Các section-header tính là title: chương, điều, mục, phụ lục, 'A.', 'I.', '1.1.1.' Image59 Image60 3. Figure figure bao gồm biểu đồ, logo, ảnh minh họa — có thể bao gồm text (text này phải có điều kiện là nếu không đi kèm figure thì không có ý nghĩa). Thực tế hầu hết các figure khi xử lý đều chưa được gán hoặc bị gán nhầm thành table, hoặc các text bên trong biểu đồ bị lẫn vào với các khối text. Image62 Image63 Image64 Logo nằm ở header, footer cũng được coi là figure element. Image65 Image66 Image67 Logo quá nhỏ không mang giá trị về mặt ngữ nghĩa hoặc các icon trang trí không tính là figure. Image68 4. List-item Mỗi mục nhỏ cùng bullet a), b), -, +, * được tính là 1 list-item. Image69 Với list-item nhiều cấp: gán mỗi khối là 1 list-item. Image70 Mỗi mục nhỏ trong mục lục tính là 1 list-item. Image71 5. Table Thông tin biểu diễn dưới dạng các ô được coi là table (kể cả không có border). Image72 Image73
Image74
6. Form Các biểu mẫu điền thông tin được tính là nhãn form. Image75
Image76
Mỗi form được tính là một block. Image77
Image78
Form có thể bị tách giữa hai trang — gán mỗi phần của form đó là một block ở mỗi trang. 7. Footnote Mỗi footnote-item là một khối riêng.
Chỉ gán footnote cho page. Các thông tin lặp như page number, footer không phải footnote.
Image79 8. Page-header & Page-footer page-header / page-footer là text ở đầu/cuối trang không thuộc luồng văn bản chính. Thông thường thành phần này lặp lại với sự thay đổi nhỏ trên hầu hết các trang của tài liệu. Ví dụ: số trang, ngày tháng, sự lặp lại của tiêu đề tài liệu hoặc tiêu đề phần hoặc ghi chú bảo mật. Dạng thông thường (Normal): Thông thường một page-header ở dạng font chữ nhỏ hơn hoặc được phân chia với text chính bởi đường ngang. Image80
  • Nếu khoảng cách giữa các cụm text nhỏ thì từng phần là một element.
  • Chỉ có đánh số trang thôi cũng được coi là element dạng này.
Dạng bất thường (Abnormal): Image81 Image82 9. Useless useless là các thông tin Agent không dùng để làm tri thức.
Đoạn text “V/v Triển khai…” không phải useless.
Image83