Tải bản đầy đủ
CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU VÀ MÔ TẢ DỮ LIỆU

CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU VÀ MÔ TẢ DỮ LIỆU

Tải bản đầy đủ

30

CAARi,t = α + β1GEAR + β2 SIZE + β3 MTB + β4 PE + β5 INTEREST +
β6

RISK

+

β7

INDUSTRY_GEAR

+

β8

HI

εt

(3)
CAARi,t = α + β1GEAR + β2 SIZE + β3 MTB + β4 PE + β5 INTEREST +
β6 RISK + β7 INDUSTRY_GEAR + β8 REGULATION + εt

(4)
3.2 MÔ TẢ CÁC BIẾN
3.2.1 Biến tỷ suất sinh lợi bất thường (CAAR)
Biến TSSL bất thường tích lũy (Cumulative average abnormal Return – CAAR) của
cổ phiếu được tính như sau:
ARi,t =Ri. t – E(R)i, t

Trong đó Ri,t là TSSL hàng năm của cổ phiếu i vào năm t ; và E (Ri,t) là tỷ suất kỳ
vọng trên cổ phiếu i trong năm t, được đại diện bởi TSSL chỉ số VNINDEX. Biến
TSSL bất thường cũng được sử dụng trong nghiên cứu của Brown & Warner (1985)
Campbell và cộng sự (1997).
Để đo lường thành quả công ty trước đó có nhiều tác giả sử dụng các phép đo lường
khác nhau. Hamada (1972) sử dụng phương pháp TSSL trên sổ sách kế toán, TSSL
trên sổ sách không chính xác so với TSSL cổ phiếu có bao hàm kỳ vọng của các nhà
đầu tư về giá trị của các công ty trong tương lai. Bhandari (1988) sử dụng TSSL có
điều chỉnh lạm phát tạo nên một cải tiến so với thước đo TSSL trên sổ sách kế toán

31

được sử dụng bởi Hamada (1972), tuy nhiên vẫn còn hạn chế như trên. Các nghiên
cứu của Dimitrov và Jain (2008) và Korteweg (2010) sử dụng TSSL được điều chỉnh
cho những thay đổi của thị trường. Vì trong TSSL cổ phiếu chịu ảnh hưởng bởi xu
hướng thị trường nên nhà đầu tư đo lường hoạt động của công ty bằng cách loại bỏ
tác động của những thay đổi cổ phiếu thị trường trong một thời gian nắm giữ và do
đó sử dụng TSSL tích lũy bất thường (Campbell, Lo, MacKinley, 1997).
3.2.2 Biến đòn bẩy tài chính (GEAR)
Trong bài nghiên cứu này, biến đòn bẩy tài chính được tính toán dựa trên giá trị sổ
sách của công ty:
GEAR (Đòn bẩy) =

Tổng nợ
Tổng Tài sản

Các nghiên cứu trước đây đã sử dụng giá trị sổ sách (ví dụ, Muradoglu & Sivaprasad,
trên báo chí) và giá trị thị trường (ví dụ, Gomes & Schmid, 2010) để ước lượng đòn
bẩy của công ty. Bài nghiên cứu này sử dụng đòn bẩy tính theo giá trị sổ sách vì
theo Schwartz (1959) lập luận rằng đòn bẩy sổ sách thể hiện những tài sản thực có
của công ty, khác với đòn bẩy tính trên giá thị trường có bao hàm cả những “kỳ
vọng” về sự tăng trưởng trong tương lai, điều gần như không thể chắc chắn ở hiện
tại. (Myers, 1977).
3.2.3 Biến quy mô công ty (SIZE)
Biến quy mô công ty được thể hiện bằng giá trị vốn hóa thị trường của công ty. Giá
trị vốn hóa thị trường được định nghĩa là giá cổ phiếu đóng cửa nhân với số lượng
cổ phiếu phổ thông đang lưu hành.
Dễ dàng nhìn thấy rằng các doanh nghiệp lớn thường có dòng tiền ổn định hơn nên
rủi ro phá sản thấp vì thế nhà đầu tư sẽ yêu cầu TSSL thấp hơn so với các công ty
khác. Vì vậy tác giả kỳ vọng rằng mối quan hệ giữa SIZE và AR là âm.

32

3.2.4 Biến giá thị trường trên giá trị sổ sách (MTB)
Biến giá trị thị trường trên sổ sách (Market-to-Book ratios) cho thấy tỷ lệ giữa giá
trị cổ phiếu trên thị trường và giá trị được tính bằng cách lấy giá cổ phiếu đóng cửa
chia cho giá trị sổ sách của vốn cổ phần. Theo nghiên cứu của Stephen và cộng sự
(2005) thì MTB có mối tương quan nghịch với TSSL của cổ phiếu. Điều này cho
thấy rằng trong dài hạn thì trường sẽ điều chỉnh giá cổ phiếu về giá trị nội tại. Tác
giả cũng kỳ vọng rằng mối quan hệ này là âm trong bài nghiên cứu của mình.
3.2.5 Biến chỉ số Giá trên thu nhập (PE)
P/E (Price/Earnings Ratio) là hệ số giữa thị giá một cổ phiếu và thu nhập mà nó
mang lại. Đây là một trong những chỉ số phổ biến được niêm yết trên thị trường
chứng khoán, trước hết biểu hiện mức giá nhà đầu tư sẵn sàng bỏ ra cho một đồng
lời thu được từ cổ phiếu đó.
Một công ty có chỉ số P/E càng cao thì kỳ vọng của thị trường vào lợi nhuận của
công ty càng cao, do đó thu hút được càng nhiều các nhà đầu tư. Còn ngược lại khi
họ ít hoặc không kỳ vọng vào khả năng sinh lời lớn của công ty thì mức giá họ sẵn
sàng bỏ ra khi mua cổ phiếu thấp, dẫn đến chỉ số P/E thấp, biểu hiện giá cổ phiếu
này đang trên xu hướng giảm.
Khi chỉ số P/E ở mức cao chứng tỏ thị trường đang định giá cao cổ phiếu, như vậy
có xu hướng trong dài hạn thì TSSL của cổ phiếu sẽ thấp và ngược lại. Vì thế tác
giả kỳ vọng mối quan hệ giữa P/E và TSSL có mối quan hệ âm.
3.2.6 Biến hệ số rủi ro thị trường (RISK)
Biến rủi ro thị trường của cổ phiếu được đo lường bằng hệ số beta (  ) theo mô hình
CAPM, được ước tính mỗi năm sử dụng dữ liệu hàng tháng của cổ phiếu trên sàn
HSX. Theo lý thuyết CAPM thì nhà đầu tư cổ phiếu có hệ số beta cao được kỳ vọng
nhận được TSSL cao tương ứng.

33

Vì vậy tác giả kỳ vọng rằng giữa AR và biến rủi ro thị trường sẽ có tương quan
dương.
3.2.7 Biến lãi suất thị trường (INTEREST)
Nghiên cứu cũng xem xét tác động biến vĩ mô lên TSSL cổ phiếu. Ở đây, tác giả sử
dụng biến lãi suất vì đây là biến vĩ mô thích hợp nhất để kiểm soát tác động của tình
hình nền kinh tế mà cụ thể là môi trường chính sách tiền tệ lên mối quan hệ của đòn
bẩy tài chính lên TSSL. Lãi suất lấy lãi suất cho vay trên thị trường tín dụng được
tổng hợp bởi IMF trong công bố IFS.
Khi lãi suất cho vay toàn thị trường cao đều này tương ứng với việc chi phí tài trợ
của doanh nghiệp sẽ tăng lên tương ứng và thông thường thì trong môi trường lãi
suất cao hiệu quả kinh doanh của doanh nghiệp sẽ giảm.
Vì vậy tác giả kỳ vọng rằng giữa lãi suất và CAAR của cổ phiếu có tương quan âm.
3.2.8 Biến đòn bẩy trung bình ngành (INDUSTRY GEARING)
Biến đòn bẩy ngành được ước tính bằng trung bình đòn bẩy của các công ty trong
mỗi ngành công nghiệp theo từng năm. Mỗi ngành khác nhau sẽ có cấu trúc vốn
khác thể hiện đặc tính kinh doanh riêng của từng ngành, vì vậy sử dụng đòn bẩy
ngành để kiểm soát hiệu ứng từ ngành nghề tác động đến TSSL của doanh nghiệp
là điều đáng quan tâm. Hiện nay có rất ít các nghiên cứu tách biệt ảnh hưởng của
ngành lên TSSL của cổ phiếu. Bài nghiên cứu này kỳ vọng tìm ra bằng chứng về
mối quan hệ giữa ngành nghề và TSSL của cổ phiếu.
3.2.9 Biến chỉ số cạnh tranh của ngành (HI)
Mức độ cạnh tranh của ngành được đo lường bằng chỉ số Herfindahl (HI), được định
nghĩa là:

34

Herfindahl Index j =

I

2

i 1

IJ

S

Trong đó, Sij là thị phần của công ty i trong ngành j. Tính toán trên được thực hiện
cho mỗi ngành công nghiệp. Chỉ số này cũng được sử dụng trong nghiên cứu của
Hou và Robinson (2006). Chỉ số Herfindahl được sử dụng rất phổ biến, chỉ số này
lấy tỷ trọng doanh thu thuần của một công ty để tính toán thị phần. Giá trị nhỏ của
chỉ số Herfindahl từ (0-1800) có nghĩa là thị trường được chia sẻ bởi nhiều công ty
cạnh tranh, trong khi giá trị lớn (1800-10,000) cho thấy thị phần tập trung trong tay
một vài công ty lớn. Các công ty được sắp xếp vào nhóm vào chỉ số
Herfindahl. Nhóm 1 tương ứng với các công ty có chỉ số HI thấp, và nhóm 5 là
nhóm công ty có chỉ số HI cao nhất.
3.2.10 Biến kiểm soát của chính phủ (REGULATION)
Một biến giả được sử dụng để xác định công ty có hoạt động trong ngành bị chính
phủ kiểm soát và quản lý hay không. Trong mẫu nghiên cứu này, ngành bị kiểm soát
là Năng lượng và Khai khoáng. Nếu công ty thuộc ngành bị kiểm soát thì biến giả
bằng 1, còn ngược lại thì biến giả bằng 0.
Ngành nghề nếu bị chính phủ kiểm soát thông thường mức độ cạnh tranh thấp, các
công ty khác khó lòng tham gia vào thị trường. Vì vậy chúng ta kỳ vọng rằng, nếu
một công ty hoạt động trong ngành bị kiểm soát thì sẽ đạt được tỷ suất sinh lợi cao
hơn do tính độc quyền cao, và rủi ro phá sản do cạnh tranh sẽ rất thấp.
3.3 MÔ TẢ MẪU DỮ LIỆU
Bài nghiên cứu sử dụng mẫu dữ liệu của 74 công ty trên sàn chứng khoán TPHCM
từ năm 2007 đến năm 2012, mẫu dữ liệu có tất cả 444 quan sát. Đây là mẫu dữ liệu
bảng không cân xứng (Unbalanced Panel) do có một số công ty không có dữ liệu
đầy đủ từ năm 2007 đến 2012. Trong mẫu nghiên cứu không bao gồm các công ty
tài chính, ngân hàng và các dịch vụ liên quan. Các dữ liệu về giá chứng khoán được

35

thu thập từ Sở Giao Dịch Chứng Khoán TPHCM (HSX) và website tài chính có uy
tín GOLDEN BRIDGE INVESTMENT CONSULTANT (www.cophieu68.com ).
Số liệu lãi suất cho vay lấy từ thông tin báo cáo tài chính quốc tế (IFS) của IMF.
Các công ty trong mẫu được phân nhóm ngành theo HSX. Các công ty trong mẫu
được chia thành 8 nhóm ngành chính theo phân loại ngành của HSX năm 2012 bao
gồm (xem phụ lục 1): Nông nghiệp, khai khoáng, sản xuất chế biến, năng lượng,
xây dựng, vận tải, bất động sản, bán buôn-bán lẻ. Một số ngành bị loại ra khỏi mẫu
vì có số công ty ít và không có đủ dữ liệu tài chính. Cụ thể:

Ngành

Số công ty

Nông nghiệp

7

Khai khoáng

10

Sản xuất chế biến

10

Năng lượng

9

Xây dựng

10

Bán buôn – bán lẻ

10

Vận tải

10

Bất động sản

8

36

3.4 PHƯƠNG PHÁP ƯỚC LƯỢNG
3.1.1 Kỹ thuật panel data
Để thực hiện việc đo lường ảnh hưởng của cấu trúc vốn lên TSSL bất thường của
công ty tác giả lựa chọn kỹ thuật phân tích dữ liệu bảng hay còn gọi là kỹ thuật phân
tích panel data. Phương pháp panel data được định nghĩa là cách thức phân tích mối
quan hệ kinh tế trong dữ liêu chéo (cross-section) theo thời gian (time-demension)
(Greene, 2003). Đặc trưng quan trọng nhất của phương pháp panel data là nó bao
quát cả những ảnh hưởng của thời gian, và sự khác biệt trong các chủ thể chéo
(Wooldridge,2002). Một trong những lý do chính để tác giả chọn phương pháp panel
data mà không phải là các phương pháp khác là vì phương pháp này có thể giúp
kiểm soát những ảnh hưởng riêng từ các yếu tố khác không có trong mô hình nghiên
cứu. Hơn nữa, việc thu thập dữ liệu tài chính trên sàn chứng khoán thông thường là
dữ liệu chéo theo thời gian, có nghĩa là ta quan sát một công ty qua nhiều năm, như
vậy có thể quan sát được sự thay đổi từ một chủ thể nhất định theo thời gian và
phương pháp panel data có thể phục vụ cho mục đích đó phù hợp hơn so với mô
hình khác.
Trong nghiên cứu tài chính, phương pháp panel data được đánh giá cao hơn phương
pháp dữ liệu chéo hoặc chuỗi thời gian vì nhiều lý do. Thứ nhất, trong phân tích
panel data chúng ta khắc phục được hiện tượng thiếu quan sát, một điều rất thường
gặp trong nghiên cứu dữ liệu chéo hoặc chuỗi thời gian. Một chủ thể được quan sát
qua nhiều thời điểm tạo ra nhiều quan sát hơn để kiểm định mô hình (Sun và Parikh,
2001). Thứ hai, vì kỹ thuật panel data làm giảm bớt sự tương tác giữa các biến nên
tham số hồi quy sẽ đáng tin cậy hơn (Hsiao, 1999). Điều này cho phép mô hình có
thể khai thác được nhiều thông tin hơn so với các mô hình khác. Thứ ba, phương
pháp phân tích panel data trong một số trường hợp đặc biệt khi mô hình trở nên
phức tạp thì phương pháp cho thấy kết quả tốt hơn so với dữ liệu chéo hoặc chuỗi
thời gian (Gujarati, 2003). Và một số ưu điểm khác của panel data có thể kể ra như:

37

giảm bớt việc thất thoát dữ liệu, giảm hiện tượng đa cộng tuyến, tăng mức độ ý
nghĩa thống kê của mô hình (Baltagi,2001 ; Balestra,1992).
Sự hiệu dụng của phương pháp panel data được kể ra như trên phần lớn xuất phát
từ những giả định của sai số hồi quy và tính bất ổn của các hệ số trong mô hình hồi
quy. Giả sử ta có mô hình hồi quy tổng quát của biến phụ thuộc Y và biến độc lập
X như sau:
Yit = αit + βit Xit + eit (i)
Trong đó, ký hiệu i đại diện cho chủ thể quan sát thứ i, và t đại diện cho thời điểm
t. Như vậy trong mô hình trên ta cho phép những ảnh hưởng từ biến độc lập trong
mô hình có thể thay đổi theo thời gian và theo chủ thể nghiên cứu. Để làm được
điều này trong thực tế thường rất phức tạp, để đơn giản hóa người ta thường tập
trung vào 3 mô hình con của phương pháp này.
Thứ nhất là mô hình hỗn hợp (Pooled model) có thể diễn tả như sau:
Yit = α + β Xit + eita (ii)
Mô hình pool là mô hình đơn giản nhất với giả định rằng ảnh hưởng từ các yếu tố
trong mô hình sẽ cố định theo không gian và thời gian – các chỉ số i và t trên các hệ
số đã được lược bỏ. Sai số trong mô hình sẽ không có hiện tượng tương quan theo
không gian và thời gian. Mô hình pool được ưa thích sử dụng bằng cách đơn giản
là trộn lẫn tất cả quan sát theo không gian và thời gian để tạo nên mẫu lớn. Ví dụ ta
có 10 chủ thể quan sát trong 10 năm nghĩa là mô hình pool sẽ hồi quy trên
10x10=100 quan sát. Tuy nhiên, giả định của mô hình Pool thường không tồn tại
trong thực tế, một cách để phát hiện là chúng ta dùng kiểm định phương sai thay đổi
của White hoặc Glejser. Nếu tồn tại phương sai thay đổi thì chúng ta phải thay thể
bằng 2 mô hình khác được trình bày dưới đây.
Mô hình thứ hai là mô hình hiệu ứng cố định (Fixed effect), được mô tả như sau:

38

Yit = αi + βXit + eit (iii)
Trong mô hình này, các ảnh hưởng từ biến quan sát được giả định là thay đổi theo
từng chủ thể nghiên cứu và được thể hiện trên sự thay đổi của hệ số chặn α. Hệ số
chặn trong trường hợp này đại diện cho tất cả những yếu tố không quan sát được
ảnh hưởng lên biến Y, tuy nhiên trong mô hình này ảnh hưởng từ các yếu tố theo
thời gian được giả định là không đổi ở từng chủ thể nghiên cứu vì vậy được gọi là
hiệu ứng cố định (fixed effect). (Green, 2003)
Mô hình thứ ba là mô hình hiệu ứng ngẫu nhiên (Random effect) được mô tả như
sau:
Yit = (α + ui ) + β Xit + eit
Trong mô hình này, ảnh hưởng từ các đặc điểm riêng có của chủ thể nghiên cứu
không còn cố định nữa mà sẽ mang tính chất ngẫu nhiên (random) được thể hiện
qua hệ số ui ~ (0, σu2). Khi số chủ thể nghiên cứu tăng lên thì mô hình hiệu ứng cố
định sẽ bị giảm đi mức ý nghĩa thống kê do số lượng tham số lớn, mô hình random
effect sẽ khắc phục được hiện tượng này. Mô hình này giả định rằng, ảnh hưởng của
các đặc điểm riêng có sẽ tác động ngẫu nhiên lên biến nghiên cứu ở từng chủ thể.
(Tunay, 2009)
3.4.2 Kiểm định đa cộng tuyến
Khi sử dụng hồi quy OLS đa biến, phương sai của các tham số ước lượng βj được
tính theo công thức sau:
Var (βj) =

𝜎2
𝑆𝑆𝑇𝑗 (1− 𝑅𝑗2 )

Trong đó SSTj là tổng phương sai của biến quan sát xj, Rj2 là hệ số phù hợp khi hồi
quy biến xj theo tất cả các biến độc lập xk còn lại trong mô hình. Như vậy khi giữa
các biến độc lập x có tương quan với nhau thì hệ số Rj2 lớn và phương sai của các βj

39

sẽ tăng lên rất cao và khi đó ước lượng OLS không còn là ước lượng hiệu quả nữa.
Khi các biến X có tương quan cao ta gọi đây là hiện tượng đa cộng tuyến trong mô
hình. (Wooldridge, 2003)
Như vậy đa cộng tuyến là vấn đề khá quan trọng của hồi quy đa biến khi nó ảnh
hưởng trực tiếp lên tính hiệu quả của các ước lượng. Vì vậy trước khi kiểm định mô
hình chúng ta cần kiểm tra mối tương quan giữa các biến. Trong nghiên cứu thực
nghiệm, khi hệ số tương quan giữa 2 hoăc nhiều biến tăng lên bao nhiêu thì ảnh
hưởng đến tính hiệu quả của ước lượng vẫn còn nhiều tranh cãi. Tuy nhiên theo
Wooldridge (2003) thì các nhà kinh tế lượng cho rằng khi hệ số tương quan giữa 2
biến lớn hơn 0.9 thì vấn đề “đa cộng tuyến” mới thực sự tác động mạnh đến tính
hiệu quả của ước lượng, nếu nhỏ hơn thì ta có thể bỏ qua vấn đề này.
3.4.3 Kiểm định phương sai thay đổi
Trong 3 mô hình panel data tác giả đề cập gồm: Pool, Fixed effect và Random effect
thì mô hình Pool trong thực tế khó áp dụng nhất vì có hiện tượng phương sai thay
đổi (Heteroskedasticity). Phương sai thay đổi là việc sai số mô hình hồi quy có
phương sai không đồng nhất giữa các chủ thể nghiên cứu (công ty), hay nói cách
khác còn tồn tại nhiều yếu tố khác tác động đến biến phụ thuộc nhưng chúng ta chưa
tìm được.
Khi trong mô hình nghiên cứu tồn tại hiện tượng phương sai thay đổi sẽ làm phương
sai của hệ số ước lượng, Var(βj), không còn là ước lượng đúng (unbiased) nữa. Vì
tất cả thống kê t trong mô hình đều dựa trên phương sai của βj nên các thống kê t
sẽ không còn hiệu lực cho việc thực hiện kiểm định thống kê. Vì thế không thể
khẳng định rằng các ước lượng OLS của mô hình Pool là ước lượng bình phương
bé nhất tốt nhất (BLUE) nữa. (Wooldridge,2003).

40

3.4.4 Kiểm định Hausman test (FE hay RE)
Trong mô hình FE, hệ số ảnh hưởng riêng αi có thể có tương quan với biến giải thích
Xi, còn mô hình RE thì không có tương quan. Mô hình FE được áp dụng khá nhiều
trong nghiên cứu thực nghiệm, tuy nhiên một trong những khuyết điểm lớn của FE
đó là khi panel data có số chủ thể chéo (N) lớn và thời gian (T) quan sát nhỏ. Khi
đó người ta sẽ dùng phương pháp de-meaning data để bỏ qua việc phải đưa thêm
nhiều biến giả vào mô hình. Mà điều này thì không thể áp dụng nếu trong mô hình
có biến không đổi theo thời gian, vì khi lấy giá trị biến trừ cho trung bình của nó thì
giá trị luôn bằng 0. Trong những trường hợp như vậy thì mô hình RE tỏ ra có ưu thế
hơn. Mặc dù vậy để sử dụng mô hình RE thì ta cần có giả định quan trọng là hệ số
riêng có của từng chủ thể αi độc lập với các biến giải thích xi. Về lý thuyết khi so
sánh thì mô hình RE gần với mô hình Pool hơn, tuy nhiên mô hình RE thì mang tính
tổng quát hơn so với Pool.