(Canhsatbien.vn) - Từ lâu, việc trích xuất thông tin từ hình ảnh văn bản, đặc biệt là tài liệu có bảng biểu không phân tách, chữ viết tay, định dạng phi chuẩn…, vẫn là một bài toán nan giải trong giới công nghệ. Các tập đoàn công nghệ lớn như Google, Microsoft, Amazon đã phát triển nhiều hệ thống nhận diện ký tự quang học và xử lý ngôn ngữ tự nhiên mạnh mẽ nhưng phần lớn chỉ tối ưu cho tiếng Anh và một số ngôn ngữ phổ biến. Với tiếng Việt, một ngôn ngữ có hệ thống dấu phong phú, cấu trúc ngữ âm đa tầng, các hệ thống quốc tế thường cho kết quả với độ chính xác chưa cao, đặc biệt trong xử lý chữ viết tay.