Cách tính lọc trung vị

Bộ lọc trung vị là một trong những bộ lọc thống kê nổi tiếng do nó có hiệu suất tốt đối với một số loại nhiễu cụ thể như nhiễu muối tiêu [salt-pepper noise], nhiều đốm [speckle noise]. Theo bộ lọc trung vị thì pixel trung tâm của vùng lân cận MxM được thay thế bằng giá trị trung vị của cửa sổ tương ứng. Lưu ý rằng điểm ảnh nhiễu được coi là rất khác với điểm trung vị.

lượt quét qua từng điểm ảnh của ảnh ban đầu chưa nhiễu. Sau khi áp mặt nạ này vào tại vị trí của mỗi điểm ảnh thì các giá trị pixel trong vùng của mặt nạ sẽ được sắp xếp tăng

dân hoặc giảm dần về giá trị cường độ. Cuối cúng, gán điểm ảnh nằm ở vị trí chính giữa của các giá trị vừa được sắp xếp, gán cho giá trị điểm ảnh đang xét. Hình 35 mô tả quá trình hoạt động của bộ lọc trung vị.

Hình 35 Ví dụ về hoạt động của bộ lọc trung vị

Hình 36 Ảnh gốc

XÂY DỰNG MÔ HÌNH 3D VẬT THỂ

Để xây dựng được mô hình 3D của vật thể, nhóm phải cần nhiều bước và nhiều công đoạn như lấy dữ liệu ảnh, xử lí dữ liệu ảnh, tạo bản đồ độ sâu dựa vào màu sắc, tạo đám mây điểm ảnh và hiển thị chúng. Do đó để cụ thể hơn về mô hình, trong chương này nhóm sẽ tạo ra từng khối với chức năng nhiệm vụ riêng biệt. Ta có sơ đồ khối:

Hình 38 Sơ đồ khối của quá trình xây dựng mô hình 3D

- Khối thu thập dữ liệu ảnh từ cặp camera stereo:

Khối này có nhiệm vụ lấy dữ liệu ảnh bao gồm 2 ảnh màu từ 2 camera, đồng thời chụp 20 tấm ảnh chessboard cho mỗi camera. Với điều kiện cùng không gian như nhau và sẽ chụp nhiều đối tượng để so sánh kết quả. Ở đây khối này sẽ cho ta kết được ma trận bên trong và bên ngoài của mỗi camera từ đó tạo dữ liệu cho khối hiệu chỉnh.

- Khối hiệu chỉnh:

Điều chỉnh các thông số ma trận bên trong và bên ngoài camera kết hợp so sánh đối chiếu đặc trưng của chúng và dùng các phương pháp xử lí ảnh để điều chỉnh ánh sáng, màu sắc, kích thước để cho hai bức ảnh khớp nhau.

- Khối tính toán độ sâu ảnh

Khối này lấy ý tưởng từ hai mắt của con người, nếu ta che một mắt và nhìn một mắt cho một đối tượng thì khi làm ngược lại thì ta sẽ thấy đối tượng dịch chuyển một đoạn, nếu khoảng cách dịch chuyển này lớn thì vật đó là ở gần chúng ta hơn và nếu khoảng cách dịch chuyển nhỏ thì vật ở xa hơn. Từ đó, ta có thể tính toán được độ sâu của đối tượng so với các vật xung quanh.

- Khối hiển thị mô hình 3D

Sau khi tạo ra được bản đồ độ sâu, ta tiến hành xử lí giữa bức ảnh RGB và độ sâu của từng khung hình để tìm kết nối tương đồng 2D giữa 2 ảnh liên tiếp. Mỗi vị trí toạ độ pixel ta sẽ có được giá trị độ sâu tương đương. Nhờ vậy ta thu được đám mây sau

hiệu chỉnh. Khi thu được đám mây điểm ảnh ta tiếng hành hiển thị lên để quan sát, kiểm tra thực nghiệm so với kết quả nghiên cứu.

Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản

• Bộ lọc trung vị được dùng phổ biến, bởi vì một số loại nhiễu nhất định,

nó có thể lọc nhiễu rất tốt với độ mờ thấp so với bộ lọc tuyến tính cùng

kích thước.

Ý tưởng: Ý tưởng chính của thuật toán lọc trung vị như sau: Sử dụng

một cửa dổ lọc [ma trận 3 x 3] quét qua lần lượt từng điểm ảnh của ảnh

đầu vào input. Tại vị trí mỗi điểm ảnh lấy giá trị của các điểm ảnh tương

ứng trong vùng 3 x 3 của ảnh gốc “lấp” vào ma trận lọc. Sau đó sắp xếp

điểm ảnh nằm chính giữa [trung vị] của dãy giá trị điểm ảnh đã được sắp

xếp ở trên cho giá trị điểm ảnh đang xét của ảnh đầu ra input.

Các bước thực hiện:

• Trung vị E của một tập hợp là giá trị mà một nữa các giá trị trong tập

hợp nhỏ hơn hoặc bằng E, một nửa các giá trị trong tập hợp lớn hơn

hoặc bằng E.

• Chức năng cơ bản của bộ lọc trung vị là thiết lập trị của các điểm với

các mức xám khác nhau thành giá trị có ve như gần giống với giá trị của

điểm lân cận.

• Khi áp dụng bộ lọc trung vị có kích thước mxn, các điểm ảnh à có số

lượng các điểm lân cận cùng mức xám với nó nhỏ hơn m*n/2 sẽ không

bị ảnh hưởng, điều này khắc phục được nhược điểm làm mờ ảnh khi áp

dụng bộ lọc trung bình.

VD:

Có ma trận 3x3 như sau:

50

65

52

63

255

58

61

60

57

Các giá trị sau khi sắp xếp

50

52

57

58

60

61

63

65

255

20

Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản

Kết quả là giá trị 255 sẽ được thay thế bằng giá trị 60.

• Hạn chế của lọc trung vị là chậm do mỗi lần tính giá trị mói phải thực hiện sắp

xếp lại nxn lần.

• Tính chất của lọc trung vị:

- Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn đảm bảo

an toàn độ phân giải

- Hiệu quả giảm khi số điểm trong ma trận lớn hay bằng một nửa số

điểm trong ma trận. Điều này dễ giải thích vì trung vị là [N w + 1]/2

giá trị lớn nhất nếu Nw lẻ. Lọc trung vị trường hợp hai chiều coi như

lọc trung vị tách được theo từng chiều.

• Một số bộ lọc thường dùng:

[1,

1,

1]

[1,

[1,

8,

1]

[2,

[1,

1,

1]

[1,

Kích thước của bộ lọc [2N – 1, 2M - 1], ví dụ 3x3, 5x5…

2,

4,

2,

1]

2]

1]

Đặt tâm của bộ lọc lên điểm ảnh cần xét, không xét những điểm nằm

trên biên vùng ảnh.

2.2.

Quá trình xử lý ảnh văn bản

2.2.1. Nhị phân hóa ảnh văn bản

Trong thực tế, ảnh văn bản mà chúng ta nhận vào ban đầu để xử lý là ảnh màu.

Vì vậy để có thể thực hiện được quá trình phân tích và nhận dạng, chúng ta cần phải

chuyển chúng thành ảnh nhị phân trong đó mỗi điểm ảnh [pixel] được biểu diễn bởi

một trong 2 giá trị là 0 hoặc 255. Đầu tiên, ảnh màu nhận vào sẽ được chuyển thành

ảnh xám với các mức xám có giá trị từ 0 đến 255 dựa trên ba giá trị RED, GREEN,

BLUE của ảnh đầu vào. Từ ảnh xám này, chúng ta sẽ so sánh mức xám của từng điểm

với một ngưỡng cho trước để quyết định điểm đó sẽ là 0 hoặc 255, giá trị 0 biểu diễn

cho màu đen và 255 biểu diễn cho màu trắng.

21

Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản

Giới thiệu phương pháp OTSU:

Otsu là tên một nhà nghiên cứu người Nhật đã nghĩ ra ý tưởng cho việc tính

ngưỡng T một cách tự động [adaptive] dựa vào giá trị điểm ảnh của ảnh đầu vào

nhằm thay thế cho việc sử dụng ngưỡng cố định [fixed hay const]. Phương pháp này

cho kết quả là mỗi ảnh khác nhau có một ngưỡng tương ứng khác nhau bằng các bước

xử lý như sau:

Bước 1: Chọn một giá trị khởi tạo cho T [nên chọn giá trị mang tính công thức,

ví dụ T = [min + max] / 2, T = giá trị trung bình, ... tránh dùng các giá trị mang tính

định lượng thiết lập cứng].

Bước 2: Phân hoạch ảnh sử dụng T. kết quả của bước này sẽ tạo ra 2 nhóm điểm

ảnh: G1 chứa tất cả các điểm ảnh với giá trị [intensity] > T và G2 chứa các điểm ảnh

với giá trị [intensity]

Chủ Đề