Tải bản đầy đủ
3 Tính gần đúng đạo hàm bằng đa thức nội suy

3 Tính gần đúng đạo hàm bằng đa thức nội suy

Tải bản đầy đủ

y’(x0) = (y1-y0)/h
y’(xn) = (yn-yn-1)/h
Vì yn = yn-1 + y’(xn) h + 0(h2) nên sai số của ước lượng O(h2).
Đạo hàm tại các điểm trong.
Khi x=xi là các điểm trong (i=1,2,..,n-1) ta dùng công thức nội suy bậc 2 có xi là
điểm giữa

với x = xi-1 +ht
Đạo hàm theo x ta được:

thay x=xi hay t=1 vào công thức trên ta được:

hay

với ∀i=1,2,…,n-1.
Để tính ước lượng sai số ta có các công thức:

14

hay công thức có sai số là O(h2).
Đạo hàm cấp 2.
Để tính đạo hàm cấp 2 ta dùng công thức nội suy cấp 2 để tính y’’(x i). Đạo
hàm hai lần liên tiếp biểu thức ta có:

ta có các công thức sau:

Vậy sai số có bậc O(h2).
Chúng ta đã có công thức tính đạo hàm cấp 1 và cấp 2 tại các mốc nội suy.
Để tính đạo hàm tại các điểm không là mốc ta lại áp dụng phương pháp nội suy
Lagrange.
Sai số khi tính đạo hàm ngoài sai số của công thức còn phải tính đến sai số
làm tròn, và các bước nội suy h phải đủ nhỏ.
Ví dụ: Hàm y=f(x) được cho tại các mốc sẽ có đạo hàm cấp 1 và cấp 2 tại
các mốc này được tính và cho trong bảng sau:

15

1.4. HÀM CƠ SỞ BÁN KÍNH VÀ CÁC TÍNH CHẤT
1.4.1 Hàm hàm cơ sở bán kính (Radial Basis Function networks)
Hàm phân lớp tuyến tính đơn thuần (Perceptron) không thể phân lớp trong
một số trường hợp. Ví dụ như hàm XOR: {(0,0),{1,1)} Є ω1. {(1,0),(0,1)} Є ω2
Khả năng nhớ các mẫu học: nếu đầu vào của hàm phân lớp “gần giống”
với một mẫu học đã biết trước đó thì kết quả phân lớp cũng phải “gần giống” kết
quả phân lớp đã được học.
Ý tưởng phân lớp trên không gian có nhiều chiều hơn: có nhiều ví dụ cho
thấy, khi được ánh xạ lên không gian nhiều chiều hơn lúc đầu, bài toán phân lớp
trở nên dễ dàng hơn.
1.4.2 Tính chất hàm bán kính (radial function): Hàm bán kính là hàm chỉ
phụ thuộc vào khoảng cách từ đối số x đến một điểm c (gọi là tâm) cho trước.
W ( x) = W ( x − A ) = W ( r )

với r = x − A

(1)

 − x2 
2
W ( r ) = exp 
 = exp − β r
 2σ 

{

Hàm Gaussian:

}

(2)

Hàm đa thức:

W ( x ) = r 2 k +1

(3)

Hàm spline:

W ( x ) = x 2 ln x

(4)

Khoảng cách:

W ( r) = r2 + β 2

(5)

Trong đó:
A – Véc tơ chứa các tâm RBF.
W – Hàm cơ sở hoặc hàm kích hoạt của hàm.
r – Bán kính.
σ, β – Các thông số tỷ lệ.
|| . || - Chuẩn euclidean, tức là nếu x chứa n phần tử thì:
x =

n

∑x
i =1

2
i

(6)
16

1.4.3 hàm cơ sở bán kính (RBF):
Giả sử ta có D tâm c 1…cD, khi đó hàm hàm cơ sở bán kính là tổ hợp tuyến
tính của các hàm bán kính tại các tâm này

Như vậy
1. Hàm hàm cơ sở bán kính đã tạo ra ánh xạ

với

.

2. Kết quả của hàm là

vì vậy, đây là hàm tuyến tính phân lớp dữ liệu trên không gian

.

3. Hàm RBF còn có thể dùng để xấp xỉ hàm số nếu ta trực tiếp dùng đầu ra
.
Hàm RBF: Với tập mẫu học D= {(xi, yi)}N với i = 1..N
ta phải tìm các tham số của hàm bao gồm: trọng số W = ( ω1 ……., ωD)T
tâm của các hàm bán kính C= C1. ….CD, tham số của các hàm bán kính
B= {β1 … βD} .
Hàm sai số (error function): Để xác định các tham số của hàm, ta phải đưa
ra một tiêu chí đánh giá các tham số này khi áp dụng hàm RBF trên tập mẫu học
. Một tiêu chí đánh giá hay dùng là hàm tổng bình phương sai số

17

Hàm tổng bình phương sai số hay được sử dụng vì thuận tiện trong tính
toán đạo hàm. Gần đây, người ta nhận ra một số nhược điểm của loại hàm sai số
này và có xu hướng chuyển sang các hàm sai số khác. Ví dụ, hàm tổng sai số
tuyệt đối

hoặc hàm sai số tuyệt đối lớn nhất

Trường hợp B, C cố định: giải bài toán tối ưu

Nếu ta đặt

thì bài toán trên tương đương với

Đây là bài toán tối thiểu bình phương sai số kinh điển. Trường hợp
hạng đầy đủ (full rank), giá trị tối ưu của

trong đó





gọi là ma trận giả nghịch đảo.Trong thực hành,

người ta không dùng ma trận giả nghịch đảo mà sử dụng biến đổi Gauss để giải
(giống như giải hệ phương trình tuyến tính). Một đặc điểm nữa của

theo công

thức trên là

nghĩa là

là vectơ có độ dài nhỏ nhất trong các véctơ

tối thiểu hóa

. Đặc điểm này có ý nghĩa lớn vì nó làm tăng tính ổn định của hệ thống
(không làm f(x) quá lớn).

18

Trường hợp C= {x1……xN}: Nghĩa là tâm của các hàm bán kính chính là
các mẫu học. Khi đó, ma trận

là ma trận vuông, ta có giá trị tối ưu của trọng số

Tất nhiên, trong thực hành, người ta không tính nghịch đảo của
biến đổi Gauss để giải phương trình

mà dùng

.

Trường hợp B, C cũng là tham số cần tìm: Ta cần giải bài toán tối ưu

Do hàm sai số này không còn là hàm lồi, cách giải quyết thường dùng là sử
dụng phương pháp xuống đồi theo véctơ đạo hàm. Khi đó, người ta lấy đạo hàm
của e2(W, B, C) theo các biến W, B, C rồi chỉnh lại các tham số này. Một cách
tối ưu hóa khác là:
1. Cố định B, C, tính
2. Cố định

theo phương pháp trên.

, chỉnh sửa B,C theo phương pháp đạo hàm.

3. Lặp bước 1,2.
Trong thực hành, người ta thấy việc tìm B,C rất mất thời gian. Do đó, các tâm
C thường được chọn là chính các mẫu học. Còn đặt giá trị
sau đó chọn thử một vài giá trị β đến khi đạt được kết quả như ý.
Ví dụ 1: Hàm XOR
Giả sử ta chọn
trận

, các tâm chính là các mẫu học, khi đó ma



Thế W mới tìm được vào hàm f(x):

ta có thể tính được f(x) như trong hình sau
19

Xấp xỉ hàm XOR bằng hàm RBF
Để ý rằng tại các mẫu học, hàm RBF cho kết quả chính xác:
f(xi)= yi, i= 1,2, 3, 4
Ví dụ 2: Vẫn xấp xỉ hàm XOR nhưng ta dùng ít tâm hơn
c1= (0,0)
c1= (1,0)
c1= (0.5,0)
Với trọng số

này, đồ thị của hàm f(x) = {W, Φ (x)} như sau

20

Xấp xỉ hàm XOR bằng hàm RBF với 3 tâm
Như vậy, nếu số tâm ít hơn số mẫu học, hàm có thể không học được toàn bộ
tập mẫu học. Tuy nhiên, ở những vị trí mẫu học gần tâm, kết quả phân lớp vẫn
chính xác.
Xác định số tâm của hàm: Ta thấy ở ví dụ trên, số tâm của hàm ảnh hưởng
đến chất lượng xấp xỉ hàm số. Để xác định số tâm người ta thường làm như sau:
1. Bắt đầu với số tâm bằng D= 0 hay f(x)= 0 ∀x
2. Tính sai số

và chọn i max = arg max e(xi)

3. Thêm một tâm
4. Tính trọng số

5. Dừng nếu

của hàm mới và giá trị hàm sai số

cho trước, ngược lại, quay về bước 2.

Như vậy mỗi lần thêm 1 tâm tức là ta thêm 1 cột mới vào ma trận .
Dùng biến đổi QR (Gram-Schmidt QR decomposition) để trực giao hóa cột
mới thêm vào
Lợi dụng tính trực giao của các cột để tính sai số e (xi).
1.4.4 Quá trình học của hàm:
Việc luyện hàm RBF phụ thuộc vào việc chọn tâm như thế nào. Có 2 kỹ
thuật luyện hàm RBF:
-

Chọn các giá trị của tâm cố định. Sau đó sử dụng kỹ thuật thích

nghi để luyện hàm tìm ra các trọng số Bi tối ưu.
-

Giá trị của tâm không được chọn cố định mà được chọn trong quá

trình luyện. Như vậy cả Ai và Bi được tìm trên cơ sở sử dụng các phương trình
giảm gradient.

21

Kỹ thuật sau chậm hơn kỹ thuật trước, nhưng nếu tập dữ liệu bị giới hạn
thì kỹ thuật sau sẽ cho kết quả tốt hơn.
Với tập mẫu học D = { x i , yi } i =1 ta phải tìm các tham số của hàm bao gồm:
N

T
trọng số B = ( B1 ,..., BM ) , tâm của các hàm bán kính A = { A1 ,..., A M } , tham số của

các hàm bán kính β = { β1 ,..., βM } .
Ví dụ với kỹ thuật thứ nhất:
Sau khi có được hàm kích hoạt ở trên ta xác định được ma trận trọng số B
từ công thức:
Y = W.B  B = W-1Y

(7)

(Vậy ta cần phải xác định được ma trận nghịch đảo của W).
Nếu ma trận W không vuông nhưng có hạng đầy đủ ta có thể tính W-1 theo
công thức sau:
B = (WTW)-1WTY

(8)

Đối với mỗi hàm, việc xấp xỉ được lưu giữ trong các trọng số và tâm của
RBF. Tuy nhiên các trọng số này không phải là duy nhất. Giả sử ta có M tâm
A1…AM, khi đó hàm hàm cơ sở bán kính RBF là tổ hợp tuyến tính của các hàm
bán kính tại các tâm này và có biểu diễn toán học như sau:
M

(

f ( x ) = ∑ BijWj x j − Ai
j =0

)

(9)

Trong đó:
f(x) – Hàm nhận được từ đầu ra của hàm.
B – Véc tơ chứa các trọng số RBF.
Mỗi tâm Ai có cùng số chiều với vécto đầu vào x. Các tâm cũng là các
điểm bên trong không gian dữ liệu đầu vào và được chọn sao cho chúng thể hiện
dữ liệu đầu vào. Khi RBF tính toán quá trình xấp xỉ đối với một số điểm dữ liệu
đầu vào thì khoảng cách giữa các điểm đầu vào và mỗi tâm được tính theo
khoảng cách euclidean. Những khoảng cách này được chuyển qua W sau đó
được trọng số hóa bằng Bi và được tổng hợp lại để sinh ra toàn bộ RBF.
22

Hàm Gaussian thể hiện hình ảnh mỗi đầu ra của hàm cơ sở sẽ xa hơn
hoặc gần hơn so với các điểm dữ liệu x = A i – tâm hàm cơ sở. Mặt khác dạng
Gauss của RBF cung cấp các ghép nối qua logic mờ và mỗi vị trí tâm hàm cơ sở
có ý nghĩa vật lý nhất định. Xa hơn nữa mỗi tâm có thể được xem như một dạng
hành vi hoặc phản ứng không chỉ của RBF mà còn là của hệ thống mà RBF thực
hiện nhận dạng. Ngoài ra có thể có các lựa chọn khác đối với hàm cơ sở như
hàm spline làm việc rất hiệu quả trong bài toán nhận dạng mô hình.
Nhận xét:
• Hàm hàm cơ sở bán kính có hàm kích hoạt dạng:
W ( x ) =  W ( x − A1 ) ...W ( x − A M ) 

T

• Kết quả của hàm là:
f ( x ) = { B, W ( x ) }

vì vậy, đây là hàm tuyến tính phân lớp dữ liệu trên không gian RM.
• Hàm RBF còn có thể dùng để xấp xỉ hàm số nếu ta trực tiếp dùng đầu ra
y( x) .

Khi sử dụng hàm RBF trong bài toán nhận dạng cần chú ý một vài điểm
sau:
- Dạng W nào cần chọn? (Thường chọn Hàm Gaussian)
- Bao nhiêu tâm sẽ cho kết quả tốt nhất và tâm cần đặt ở đâu?
- Bao nhiêu dữ liệu cần thiết đủ để luyện hàm?
Nhưng chưa có thuật nào chọn trọng số ban đầu mà thường chỉ là cho trước
ngẫu nhiên. Muốn tìm mô hình tốt nhất cho đối tượng điều khiển thì cần thiết
phải tìm số lượng tâm tối ưu. Có quá nhiều tâm hoặc quá ít tâm sẽ cho kết quả
không tốt. Nhiều tâm quá sẽ không đủ dữ liệu luyện hàm, nhưng ít tâm quá sẽ
cho mô hình sai lệch. Thuật bình phương tối thiểu trong trường hợp có nhiều
tâm sẽ tạo ra trọng số liên kết wi lớn.
23

CHƯƠNG 2: PHƯƠNG TRÌNH KHUẾCH TÁN TRUYỀN TẢI
2.1 Giới thiệu bài toán
Hiện nay có rất nhiều thuật toán với các sơ đồ sai phân khác nhau để giải
bài toán truyền tải khuếch tán vật chất một, hai và ba chiều
∂c
∂c
∂c
∂c
∂2 c ∂2 c
∂ ∂c
+u
+v
+w
−v ( 2 + 2 ) −
µ
= f (1)
∂t
∂x
∂y
∂z
∂x
∂y
∂z ∂z
∂C
+ ΩC = f (2)
∂t

(1+ τθΩ)Ck+1=τ f k+1 + [1- τ (1- θ)Ω]Ck (3)
(1+ τθΩ1)(1+ τθΩ2)(1+ τθΩ3) + O(τ 2) (4)
τ f k+1 + [1- τ (1- θ)Ω]Ck + O(τ 2) (5)
(1 + τθΩ1) C k+1/3= τ f k+1+ [1- τ (1- θ)Ω]Ck (6)
(1 + τθΩ2) C k+2/3= C k + 1/3 (7)
(1 + τθΩ3) C k+2= C k + 2/3 (8)
Về mặt lý thuyết người ta thường cố gắng xây dựng các thuật toán ổn định
với bậc xấp xỉ càng cao càng tốt. Tuy nhiên trong thực tiễn tính toán không phải
bao giờ bậc xấp xỉ cao cũng tốt hơn bậc xấp xỉ thấp. Điều đó cụ thể do Δt và h
= max{Δx, Δy, Δz} không thể lấy quá nhỏ, hoặc thuật toán có bậc xấp xỉ cao
phức tạp hơn nên sai số tính toán, làm tròn của máy tính lớn hơn, hoặc do điều
kiện ràng buộc của Δt và h, hoặc do điều kiện địa hình quá phức tạp ...
Thực tiễn tính toán trên máy cho thấy: Đối với nhiều bài toán thực tiễn
hoặc các bài toán có nghiệm giải tích, khi lấy φ = 0.6, nghĩa là bậc xấp xỉ O(τ
+ h) hoặc O(τ + h2) thì kết quả tính toán ổn định nhanh hơn và phù hợp
với các số liệu đo đạc thực tiễn hơn, hoặc gần với giá trị nghiệm giải tích hơn là
khi lấy φ = 0.5, nghĩa là bậc xấp xỉ O(τ2+ h) hoặc O(τ2+ h2).
2.2 Mô hình toán học
Mô hình toán học mô tả quá trình truyền tải và khuếch tán vật chất
24