Tải bản đầy đủ - 0 (trang)
CHƯƠNG 2: ỨNG DỤNG CỦA MÔ HÌNH LOGIT TRONG XẾP HẠNG TÍN DỤNG

CHƯƠNG 2: ỨNG DỤNG CỦA MÔ HÌNH LOGIT TRONG XẾP HẠNG TÍN DỤNG

Tải bản đầy đủ - 0trang

Trường Đại học Kinh tế Quốc dân – Khoa Toán Kinh tế



2.1. Mơ hình Logistic

2.1.1. Mơ hình

Mơ hình Logistic là mơ hình hồi quy trong đó biến phụ thuộc là biến giả.

Có rất nhiều hiện tượng, nhiều q trình mà khi mơ tả bằng mơ hình kinh tế

lượng, biến phụ thuộc lại là biến chất, do đó cần phải dùng biến giả (biến giả là

biến rời rạc, nó có thể nhận một trong hai giá trị 0 và 1)

2.1.1. Phương pháp ước lượng

Mơ hình Logistic (Maddala, 1984) pi được xác định bằng:



X = (1, X1); X1 = (1, X1i); β’ = (β0, β1)

Phương trình trên được gọi là hàm phân bố logistic. Trong hàm này khi

Xiβ nhận các giá trị từ -∞ đến ∞, thì p nhận giá trị từ 0 đến 1. Trong mơ hình trên

pi khơng phải là hàm tuyến tính của các biến độc lập, tức phi tuyến với X và các

tham số β. Điều này có nghĩa là không thể sử dụng trực tiếp OLS để ước lượng.

Người ta dùng phương pháp ước lượng hợp lý tối đa để ước lượng β.

Sau khi ước lượng được



, ta có thể tính được ước lượng xác suất p i =



P(Y=1|Xi):



Như vậy trong mơ hình Logistic khơng nghiên cứu ảnh hưởng trực tiếp

của biến độc lập Xk đối với Y mà xem xét ảnh hưởng của X k đến xác suất để Y

nhận giá trị bằng 1 hay kỳ vọng của Y.

Ảnh hưởng của Xk đến pi được tính như sau:



Từ



; 1-p = P(Y=0|X), lập tỷ số



, người ta gọi



tỉ số này là tỷ số OR (Odds ratio),

Vì p là xác suất để Y = 1 với điều kiện các biến độc lập có trị số được xác

định bằng véc tơ X. Do vậy OR cho biết khả năng sự kiện Y = 1 (hay Y xảy ra)

bằng bao nhiêu lần so với khả năng Y = 0 (không xảy ra).



Nguyễn Nhật Linh - 11132244



17



Trường Đại học Kinh tế Quốc dân – Khoa Tốn Kinh tế



Trong xếp hạng tín dụng, theo Hiệp ước vốn Basel II năm 2007, từ các thẻ

điểm các nhà phân tích có thể đưa ra dự báo hạng mục cho khả năng trả nợ của

doanh nghiệp với các mức điểm “tốt” (Good) và “xấu” (Bad) (được kí hiệu là s).

Thẻ điểm của đối tượng vay nợ về thực chất là để phỏng đoán khả năng vỡ nợ,

được kí hiệu là PD.



Khi đó xác suất vỡ nợ của doanh nghiệp sẽ phụ thuộc vào các chỉ số tài

chính X và các hệ số β của các chỉ số này

Nếu doanh nghiệp trả được khoản nợ từ ngân hàng, thì sẽ được chấm điểm

“tốt” với xác suất là:

Nếu doanh nghiệp khơng trả được nợ ngân hàng thì sẽ được chấm điểm

“xấu” với xác suất là:

Cơng thức tính điểm s trong đánh giá tín nhiệm là:



2.2. Một số chỉ tiêu đánh giá

2.2.1. Tính phân kì và IV

Giả sử F(s|G) và F(s|B) là hàm phân phối điểm cho nhóm khách hàng tốt

và xấu, f(s|G) và f(s|B) là hàm mật độ tương ứng. Khi đó tính phân kì được định

nghĩa như sau:



Trong đó w(s) là trọng số của loại tốt trong mức điểm s.

Tính phân kì được biểu diễn dưới dạng một mơ hình liên tục đối với giá trị

của thơng tin (kí hiệu là IV) và đo lường khả năng phân biệt của thẻ điểm, được

đề xuất bởi Kullback và Leibler (1951) như một cách để đo lường khoảng cách

tương đối giữa hàm phân phối xác suất đúng với thực tế và hàm phân phối xác

suất có được từ mơ hình. Nếu p(x) là hàm mật độ của phân phối đúng với thực tế

và q(x) là hàm mật độ còn lại thì cơng thức tính độ phân kì Kullback – Leibler

như sau:



Nguyễn Nhật Linh - 11132244



18



Trường Đại học Kinh tế Quốc dân – Khoa Toán Kinh tế



Nếu cả hai hàm giống nhau thì



với mọi x và độ phân



kì bằng 0. Tính phân kì sẽ lớn khi p(x) >> q(x) hoặc p(x) << q(x) với một vài giá

trị của x, dù khi cả tích phân của p(x) và q(x) là 1, điều này chỉ có thể xảy ra đối

với những khoảng giá trị cụ thể. Độ đo DK-L(q|p) không đối xứng với p và q vậy

nên giá trị của nó phụ thuộc vào xác suất đúng với thực tế. Tính phân kì trong

trường hợp xếp hạng tín dụng khách hàng được tính tốn như sau:



Vì vậy độ phân kì chính là “khoảng cách” giữa các hàm phân phối điểm

loại xấu và điểm loại tốt nếu hàm phân phối điểm tốt là hàm phân phối đúng với

thực tế, và ngược lại nó chính là “khoảng cách” giữa các hàm phân phối điểm tốt

và điểm xấu nếu hàm phân phối điểm xấu là hàm phân phối đúng với thực tế.

Nếu tổng của cả hai “khoảng cách” này càng lớn thì cả hai hàm phân phối điểm

ước lượng từ mơ hình và hàm phân phối điểm thực tế càng có sự khác biệt. Vì

vậy nên độ phân kì được sử dụng để đo lường khả năng phân biệt của hệ thống

chấm điểm tín dụng.

Nếu hàm phân phối xác suất của điểm số được diễn giải bởi hàm liên tục

thì có thể tính tốn độ phân kì bằng tích phân như cơng thức đã nêu ở trên. Tuy

nhiên, các hàm phân phối thường được tính với một tập hợp hữu hạn, tức mẫu số

liệu dựa trên khác khách hàng vay mượn trong quá khứ mà thẻ điểm đã tạo ra.

Trong trường hợp này, có thể ước lượng hàm mật độ bởi một đường cong liên

tục, sau đó dùng phép lấy tích phân hàm số đó. Khi đó cơng thức tính giá trị của

thơng tin, kí hiệu IV, sẽ là:



Hoặc cũng có thể dùng phép xấp xỉ rời rạc đối với hàm mật độ đó bằng

cách chia nhỏ các mức điểm thành từng khoảng một và dùng phép lấy tổng của

các khoảng đó. Giả sử có I khoảng điểm i = 1, 2,…, I, sau đó có thể sử dụng f(s i|

G) và f(si|B) cho bởi thẻ điểm gốc hoặc đếm số lượng điểm số thuộc loại tốt và

loại xấu gi và bi trong khoảng i, rút ra được







. Khi đó



cơng thức tính IV là:



Nguyễn Nhật Linh - 11132244



19



Trường Đại học Kinh tế Quốc dân – Khoa Toán Kinh tế



Trong trường hợp điểm số của khách hàng loại tốt và loại xấu có phân

phối chuẩn, độ phân kì sẽ là:



Khi phương sai của điểm số loại tốt và loại xấu bằng nhau thì cơng thức

trên sẽ được rút gọn như sau:



Lúc này DM được gọi là khoảng cách Mahalanobis, đây là trường hợp một

chiều của một thước đo khoảng cách n chiều được đề xuất bởi P. C. Mahalanobis

vào năm 1936 để đo “khoảng cách” của một điểm dữ liệu so với một tập hợp dữ

liệu. Về bản chất, khoảng cách Mahalanobis tương đương với thống kê kiểm định

dùng trong kiểm định t.

Dù giả thiết phân phối chuẩn cho hàm phân phối điểm cho nhóm khách

hàng loại tốt và xấu không thực sự phổ biến và giả thiết phương sai bằng nhau

không đáng tin cậy, khoảng cách Mahalanobis vẫn có những ưu điểm nhất định.

Các nhà phân tích sẽ chỉ cần tính tốn trung bình và phương sai của các loại điểm

số trong mẫu số liệu nên có thể sử dụng phương pháp này trong những bộ dữ liệu

lớn, đồng thời sẽ dễ hình dung sự khác biệt giữa các thẻ điểm tốt và thẻ điểm xấu

trên đồ thị điểm và mật độ xác suất.

2.2.2. Khoảng cách Komogorov – Smirnov

Tiêu chuẩn Komogorov được áp dụng với mọi phân phối liên tục với các

tham số của quy luật phân phối lí thuyết trong tổng thể giả định đã biết trước. Giả

sử biến ngẫu nhiên X trong tổng thể giả thiết phân phối theo một quy luật lí

thuyết liên tục nào đó với hàm phân bố xác suất F(x). Từ tổng thể lập mẫu kích

thước n và tím được hàm phân bố thực nghiệm F *(xi) tại mỗi giá trị xi của mẫu

với



. Lúc đó tiêu chuẩn kiểm định giả thuyết được chọn là thống kê:



Khi n  ∞ thì khơng tùy thuộc vào dạng của F(x) biến ngẫu nhiên

luôn luôn hội tụ về phân phối Komogorov có hàm phân phối xác suất

như sau:



Nguyễn Nhật Linh - 11132244



20



Trường Đại học Kinh tế Quốc dân – Khoa Toán Kinh tế



Do đó với mức ý nghĩa α cho trước có thể tìm được giá trị tới hạn thỏa

mãn điều kiện:

Miền bác bỏ giả thuyết được xác định bằng biểu thức:



Một biến tướng của tiêu chuẩn kiểm định trên là tiêu chuẩn Komogorov –

Smirnov. Tiêu chuẩn này được sử dụng để kiểm định xem hai mẫu kích thước n 1

và n2 có cùng được rút ra từ một thống kê nghiên cứu hay khơng. Để kiểm định

điều đó người ta sử dụng thống kê:

Trong đó: F1*(x) và F2*(x) là các hàm phân bố thực nghiệm của hai mẫu

tương ứng. Từ đó tiêu chuẩn kiểm định được chọn là:



Với mức ý nghĩa α miền bác bỏ giả thuyết được xác định bằng biểu thức:



Hình 2-1: Đồ thị miêu tả khoảng cách Komogorov – Smirnov



Nguyễn Nhật Linh - 11132244



21



Trường Đại học Kinh tế Quốc dân – Khoa Toán Kinh tế



Trong xếp hạng tín dụng, hàm phân phối xác suất của điểm cho nhóm

khách hàng tốt và xấu lần lượt là F(s|G) và F(s|B). Nếu mức điểm tối đa và tối

thiểu có thể xảy ra trong quá chấm điểm các doanh nghiệp là s max và smin thì thơng

thường F(smin|G) = F(smin|B) = 0 và F(smax|G) = F(smax|B) = 0, vì vậy các hàm phân

phối xác suất sẽ phù hợp với các mức điểm cực trị. Thế nhưng tại các mức điểm

khác nhau thì giá trị hàm phân phối nhận được cũng khác nhau, các thẻ điểm có

sự phân biệt rất rõ ràng. Thống kê Komogorov – Smirnov được xác định bởi

công thức:

Theo hình 2-1, thống kê Komogorov – Smirnov được thể hiện bằng độ dài

của đường kẻ đứt quãng – đó cũng là khoảng cách tối đa giữa hai đồ thị hàm

phân phối F(s|B) và F(s|G) ở điểm s nào đó. Đồng thời, dựa vào đồ thị của cả hai

hàm mật độ điểm số của nhóm khách hàng tốt và xấu, có thể thấy hai đồ thị này

cắt nhau tại điểm số tối đa, tức là giá trị tối đa của hàm mà đạo ở đó bằng 0. Hệ

quả



với s* là điểm số lớn nhất, f(s|G) và f(s|B) là hàm



mật độ có điều kiện tương ứng.

2.2.3. Kiểm định Hosmer – Lemeshow

Một cách đánh giá khả năng dự báo của một thẻ điểm là sử dụng kiểm

định mức độ phù hợp Khi bình phương được đề xuất trong thống kê bởi Karl

Pearson. Đây là một kiểm định tổng quát đánh giá mức độ phù hợp của dữ liệu

đối với một mơ hình thống kê xác định bằng cách so sánh kết quả thực tế với

nhưng gì mơ hình đã dự đốn. Phương pháp này dùng tổng bình phương sai số

trong kết quả dự báo với trọng số là số nghịch đảo của phương sai dự báo để

kiểm định khả năng hiệu chỉnh của hệ thống chấm điểm.

Một mơ hình được coi là thành cơng hay khơng phụ thuộc chủ yếu vào

tính chính xác của kết quả dự báo thu được từ mơ hình đó. Do biến Y chỉ có thể

nhận 2 giá trị là 0 hoặc 1, do vậy người ta đưa vào 1 ngưỡng xác suất để xếp đối

tượng vay nợ vào mức 0 hoặc 1 (tương ứng với không vỡ nợ - vỡ nợ). Ngưỡng

xác suất ở đây thường được lấy là 0,5; tức là, nếu xác suất vỡ nợ từ 0,5 trở

xuống, khi đó xếp đối tượng vào nhóm trả được nợ đúng hạn. Nếu xác suất vỡ nợ

lớn hơn 0,5 thì khi đó xếp khách hàng vào nhóm khơng trả được nợ đúng hạn.

Sau đó so sánh việc xếp loại khách hàng này với thực tế trả nợ của họ xem tỷ lệ

đúng là bao nhiêu, đó chính là độ chính xác của kết quả dự báo.

Giả thiết thẻ điểm được chia làm N khoảng điểm hoặc mức hạng đánh giá

với pi là giá trị xác suất dự báo hạng mục điểm loại “tốt” trong khoảng I (i=1, 2,



Nguyễn Nhật Linh - 11132244



22



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

CHƯƠNG 2: ỨNG DỤNG CỦA MÔ HÌNH LOGIT TRONG XẾP HẠNG TÍN DỤNG

Tải bản đầy đủ ngay(0 tr)

×