Tải bản đầy đủ - 0 (trang)
Hình 2-1: Đồ thị miêu tả khoảng cách Komogorov – Smirnov

Hình 2-1: Đồ thị miêu tả khoảng cách Komogorov – Smirnov

Tải bản đầy đủ - 0trang

Trường Đại học Kinh tế Quốc dân – Khoa Toán Kinh tế



Trong xếp hạng tín dụng, hàm phân phối xác suất của điểm cho nhóm

khách hàng tốt và xấu lần lượt là F(s|G) và F(s|B). Nếu mức điểm tối đa và tối

thiểu có thể xảy ra trong quá chấm điểm các doanh nghiệp là s max và smin thì thơng

thường F(smin|G) = F(smin|B) = 0 và F(smax|G) = F(smax|B) = 0, vì vậy các hàm phân

phối xác suất sẽ phù hợp với các mức điểm cực trị. Thế nhưng tại các mức điểm

khác nhau thì giá trị hàm phân phối nhận được cũng khác nhau, các thẻ điểm có

sự phân biệt rất rõ ràng. Thống kê Komogorov – Smirnov được xác định bởi

cơng thức:

Theo hình 2-1, thống kê Komogorov – Smirnov được thể hiện bằng độ dài

của đường kẻ đứt quãng – đó cũng là khoảng cách tối đa giữa hai đồ thị hàm

phân phối F(s|B) và F(s|G) ở điểm s nào đó. Đồng thời, dựa vào đồ thị của cả hai

hàm mật độ điểm số của nhóm khách hàng tốt và xấu, có thể thấy hai đồ thị này

cắt nhau tại điểm số tối đa, tức là giá trị tối đa của hàm mà đạo ở đó bằng 0. Hệ

quả



với s* là điểm số lớn nhất, f(s|G) và f(s|B) là hàm



mật độ có điều kiện tương ứng.

2.2.3. Kiểm định Hosmer – Lemeshow

Một cách đánh giá khả năng dự báo của một thẻ điểm là sử dụng kiểm

định mức độ phù hợp Khi bình phương được đề xuất trong thống kê bởi Karl

Pearson. Đây là một kiểm định tổng quát đánh giá mức độ phù hợp của dữ liệu

đối với một mơ hình thống kê xác định bằng cách so sánh kết quả thực tế với

nhưng gì mơ hình đã dự đốn. Phương pháp này dùng tổng bình phương sai số

trong kết quả dự báo với trọng số là số nghịch đảo của phương sai dự báo để

kiểm định khả năng hiệu chỉnh của hệ thống chấm điểm.

Một mơ hình được coi là thành công hay không phụ thuộc chủ yếu vào

tính chính xác của kết quả dự báo thu được từ mơ hình đó. Do biến Y chỉ có thể

nhận 2 giá trị là 0 hoặc 1, do vậy người ta đưa vào 1 ngưỡng xác suất để xếp đối

tượng vay nợ vào mức 0 hoặc 1 (tương ứng với không vỡ nợ - vỡ nợ). Ngưỡng

xác suất ở đây thường được lấy là 0,5; tức là, nếu xác suất vỡ nợ từ 0,5 trở

xuống, khi đó xếp đối tượng vào nhóm trả được nợ đúng hạn. Nếu xác suất vỡ nợ

lớn hơn 0,5 thì khi đó xếp khách hàng vào nhóm khơng trả được nợ đúng hạn.

Sau đó so sánh việc xếp loại khách hàng này với thực tế trả nợ của họ xem tỷ lệ

đúng là bao nhiêu, đó chính là độ chính xác của kết quả dự báo.

Giả thiết thẻ điểm được chia làm N khoảng điểm hoặc mức hạng đánh giá

với pi là giá trị xác suất dự báo hạng mục điểm loại “tốt” trong khoảng I (i=1, 2,



Nguyễn Nhật Linh - 11132244



22



Trường Đại học Kinh tế Quốc dân – Khoa Toán Kinh tế



…, N) và 1 – pi = PDi giá trị dự báo xác suất hạng mục điểm loại “xấu”. Nếu có

ni đối tượng vay nợ trong khoảng i và có g i đối tượng được xếp vào loại “tốt”, b i

đối tượng được xếp vào loại “xấu”, thì thống kê Hosmer - Lemeshow có cơng

thức như sau:



Người ta sử dụng phương pháp này để kiểm định giả thuyết khả năng dự

báo xác suất của hệ thống đánh giá tín dụng như sau:

H0: Mơ hình phù hợp để dự báo

H1: Mơ hình khơng phù hợp để dự báo

Giả thuyết H0 bị bác bỏ khi thống kê Hosmer – Lemeshow có giá trị lớn

hơn



với khoảng tin cậy 1-α và N-2 bậc tự do.



2.2.4. Đường cong ROC và hệ số Gini

2.2.4.1. Đường cong ROC

Phương pháp đo lường được sử dụng nhiều nhất trong xếp hạng tín dụng

là đường cong đặc trưng hoạt động thu nhận tín hiệu (ROC). Các vùng nằm phía

dưới đường cong này là hệ số GINI.

Đường cong ROC được sử dụng để ước lượng sai lệch trong gửi và nhận

các tín hiệu tới thị trường. Trong xếp hạng tín dụng đây là một trong những

phương pháp thể hiện mối quan hệ giữa hàm phân phối điểm tích lũy tốt và xấu,

F(s|G) và F(s|B). Đường cong ROC được xây dựng bằng cách xây dựng đồ thị

hàm tích lũy có điều kiện của các điểm số loại tốt và loại xấu:

tương



ứng



với



trục



hoành







tương ứng với trục tung trên đồ thị.



Nguyễn Nhật Linh - 11132244



23



Trường Đại học Kinh tế Quốc dân – Khoa Tốn Kinh tế



Hình 2-2: Đường cong ROC



Theo hình 2-2, nếu hệ thống chấm điểm có khả năng phân biệt các điểm

loại tốt và xấu chính xác tuyệt đối thì tồn tại mức điểm s B sao cho tất cả các điểm

loại xấu nhỏ hơn sB và tất cả các điểm loại tốt lớn hơn s B. Trong trường hợp này,

đồ thị ROC sẽ đi qua điểm B(0,1) tương đương với số điểm s B với các đặc tính

F(s|B) = 1 và F(s|G) = 0. Khi đó đồ thị sẽ chỉ bao gồm các đoạn thẳng AB và BC.

Mặt khác, nếu thẻ điểm chỉ phân biệt các loại điểm một cách ngẫu nhiên, tức là

điểm tốt và xấu được sắp xếp trộn lẫn với nhau và bằng nhau) thì đồ thị ROC sẽ

chỉ là đoạn thẳng nối từ điểm A tới điểm C và F(s|G) = F(s|B) với mọi s. Vì vậy,

đồ thị ROC càng tới gần điểm (0,1) thì khả năng phân biệt của thẻ điểm càng tốt.



Nguyễn Nhật Linh - 11132244



24



Trường Đại học Kinh tế Quốc dân – Khoa Tốn Kinh tế



Hình 2-3: Hai đường cong ROC khơng giao nhau



Hình 2-4: Hai đường cong ROC giao nhau



Nguyễn Nhật Linh - 11132244



25



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Hình 2-1: Đồ thị miêu tả khoảng cách Komogorov – Smirnov

Tải bản đầy đủ ngay(0 tr)

×