Tải bản đầy đủ
Hình 3.4: Sơ đồ phân bố histogram chu vi sau khi gom

Hình 3.4: Sơ đồ phân bố histogram chu vi sau khi gom

Tải bản đầy đủ

62

Như vậy, sau khi loại bỏ các đối tượng từ hàm xác định chu tuyến và
dùng ngưỡng kích thước thì số đối tượng được lựa chọn để áp dụng biến đổi
Hough sẽ còn lại rất ít. Nếu chúng ta vẫn tiếp tục các bước tiếp theo và đưa ra
kết luận về góc nghiêng cho văn bản thì rõ ràng độ chính xác không được đảm
bảo. Lý do đơn giản vì những đối tượng được lựa chọn chưa chắc đã là những
ký tự. Chúng có thể là những đối tượng phi ký tự nhưng được lựa chọn vì kích
thước của chúng thoả mãn ngưỡng. Việc xác định những đối tượng chủ đạo
luôn mang tính tương đối và càng chính xác khi số đối tượng ký tự trong ảnh
càng nhiều, khi trong ảnh có ít ký tự thì càng không thể chắc chắn được rằng
các đối tượng được chọn là ký tự.
Vì vậy, ta chỉ đưa ra kết luận về góc nghiêng cho văn bản trong trường
hợp số lượng các đối tượng này phải lớn hơn một ngưỡng nào đó. Trong
chương trình số lượng này được chọn bằng 70 đối tượng.
Các đối tượng bao nhau.
Trường hợp ngoại lệ khác là các đối tượng bao nhau. Đây là một cản trở
đối với những thuật toán xác định góc nghiêng khác đặc biệt là những thuật
toán theo phương pháp phân tích láng giềng thân cận như đã được đề cập ở
trên. Mặc dù số ký tự trong văn bản có thể rất nhiều nhưng các ký tự hầu hết
bị chứa trong các đối tượng khác lớn hơn nhiều chẳng hạn như picture hay
bảng biểu . Hình vẽ dưới đây minh họa cho cho trường hợp các ký tự bị bao
bởi đối tượng ảnh.

Hình 3.6 : Ví dụ về văn bản nghiêng có các đối tượng bao nhau

63

Khi đó, nhiệm vụ của chúng ta là phải nhận ra được sự bao hàm giữa
các đối tượng và tách, lấy được các đối tượng ký tự bị bao bởi các đối tượng
lớn hơn. Ở đây, ta dùng một kỹ thuật bóc dần những đối tượng lớn ngoại cỡ
để xác định những ký tự trong đó. Một đối tượng được gọi là có kích thước
ngoại cỡ được quy ước là đối tượng có chiều rộng và chiều cao lớn hơn 200
pixel. Nếu trong quá trình dò biên ta gặp một đối tượng như vậy, ta sẽ cách li
nó ra ra khỏi tập đối tượng đang xét. Các đối tượng này sẽ được dùng đến nếu
cuối cùng số đối tượng được chọn để áp dụng biến đổi Hough bé hơn 70. Ta
xem như đối tượng này là một ảnh và tiếp tục duyệt các đối tượng bên trong
nó để lấy ra những đối tượng ký tự.
Trong cài đặt, ta dùng một kỹ thuật gọi là bóc dần. Bình thường, sau khi
xác định được chu tuyến ngoài cho một đối tượng ta sẽ không duyệt những
điểm ảnh bên trong đối tượng này bằng cách đánh dấu lại đối tượng đó.
Nhưng nếu đối tượng có kích thước rất lớn, ta sẽ lờ đi không đánh dấu nó nữa.
Thay bằng đánh dấu đối tượng ta thay đổi màu cho các điểm biên thành màu
nền, xem như chưa xét đối tượng này và tiếp tục xét các đối tượng bên trong
nó. Kỹ thuật này gọi là bóc dần vì mỗi lần xác định được biên của một đối
tượng lớn ta thay đổi màu của các điểm biên thành màu nền tương tự như bóc
dần đối tượng để trật ra các ký tự bên trong nó.
Để đánh dấu các đối tượng, ta dùng phương pháp gán nhãn cho các đối
tượng. Mỗi một đối tượng nếu không phải là một điểm cô lập sẽ mang một
nhãn là một số nguyên dương. Các đối tượng khác nhau mang các nhãn khác
nhau. Những phần tử thuộc biên của một đối tượng sẽ được gán nhãn bằng
nhau và bằng nhãn của đối tượng này

64

CHƯƠNG 4
CÀI ĐẶT THỬ NGHIỆM
Thuật toán được cài đặt bằng ngôn ngữ C ++ trên Windows trong môi
trường visual C ++ của Microsoft.
4.1 Sơ đồ chức năng của chương trình
Ảnh gốc
Dò biên
Hệ thống

Chỉnh văn bản

Mở tệp

Quay ngược kim
đồng hồ

Đóng tệp

Quay cùng chiều
kim đồng hồ
Phóng to ảnh

Thoát

Thu nhỏ ảnh
Làm béo
Làm gầy
Tăng ảnh
Giảm ảnh

65

4.2. Thiết kế Menu
Menu chính của chương trình

Menu chi tiết chương trình