Thứ Tư, 29 tháng 3, 2017

Công nghệ OCR tiếng Việt, bước phát triển mới cho quản lý hành chính

Công nghệ OCR tiếng Việt, bước phát triển mới cho quản lý hành chính

Bạn đang là chuyên viên soạn thảo hợp đồng, nhân viên văn thư, muốn lưu trữ các bản hợp đồng, sách báo, các loại công văn tiếng việt… thành dạng văn bản lưu trên máy tính, có thể chỉnh sửa, tìm kiếm theo nội dung. Hoặc bạn là sinh viên đang làm luận văn tốt nghiệp, hiện giữ nhiều tài liệu quý trên bản in và bạn muốn bổ sung vào bài làm của mình để thêm phần phong phú… Nếu dùng máy quét, máy ảnh số để sao chụp, bạn chỉ có thể đọc mà không thể chỉnh sửa. Vậy hãy đến với công nghệ nhận dạng ký tự OCR tiếng Việt!

Công nghệ nhận dạng tiếng Việt OCR
Với sự phổ biến của máy tính, mạng Internet, dữ liệu ngày nay hầu hết được lưu trữ trên máy tính để phục vụ việc tìm kiếm, sao lưu, biên tập. Nhưng việc chuyển sách báo, văn bản, biểu mẫu tiếng Việt in trên giấy thành tài liệu lưu trữ trên máy tính gây cho bạn nhiều khó khăn.

Được biết đến là công nghệ giúp nâng cao khả năng nhận dạng văn bản tiếng Việt với độ chính xác tới 99%, công nghệ nhận dạng ký tự quang học hay nhận dạng chữ in, chữ đánh máy (OCR - Optical Character Recognition) - cho phép trích xuất và chuyển đổi tài liệu dạng ảnh (ảnh từ máy quét, máy ảnh, tập tin PDF dạng ảnh…) thành các tài liệu có thể biên tập (dạng tập tin text, Word…) - hỗ trợ việc số hóa tài liệu tiếngViệt (nhận dạng văn bản tiếng Việt). 

Tùy vào độ phức tạp của văn bản: định dạng chữ hoa, chữ thường, chữ in nghiêng, khung bảng, biểu mẫu…, chất lượng ảnh, và tùy vào công nghệ nhận dạng riêng biệt của mỗi nhà phát triển sẽ có mức độ nhận dạng văn bản chính xác khác nhau.

Mô hình nhận dạng và bóc tách thông tin tài liệu

Nhờ có công nghệ nhận dạng Tiếng Việt mà việc quản lý hành chính sẽ trở nên dễ dàng hơn. Bạn sẽ không mất công khi đánh máy toàn bộ những tài liệu bản chụp cũng như có thể chỉnh sửa lại các tài liệu theo ý muốn của mình và sẽ rút ngắn thời gian làm việc hơn. Chúc các bạn thành công!
Blogger Comments
Facebook Comments