Tải bản đầy đủ
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU

Tải bản đầy đủ

22

Sau khi loại bỏ các quan sát không phù hợp, chỉ lựa chọn những quan sát được trả
tiền lương và có đầy đủ giá trị của các biến độc lập để tiến hành hồi quy thì còn lại
6.420 quan sát.
3.2 Quy trình trích lọc số liệu
3.2.1 Giới thiệu bộ dữ liệu
Cuộc điều tra về mức sống hộ gia đình (VHLSS) năm 2012 được triển khai trên
cả nước. Nội dung phản ảnh mức sống dân cư: đặc điểm nhân khẩu học, trình độ học
vấn, trình độ chuyên môn kỹ thuật, thu nhập, chi tiêu, sử dụng dịch vụ y tế, tình trạng
việc làm, nhà ở, tài sản, đồ dùng, điện, nước, điều kiện vệ sinh, về đất nông, lâm
nghiệp, thuỷ sản và các ngành nghề phi nông, lâm nghiệp, thuỷ sản nhằm làm căn cứ
để đánh giá mức sống, đánh giá tình trạng nghèo đói, phân hóa giàu nghèo. Quy mô
mẫu là tổng cộng có 36.656 thành viên hộ ở 3.133 xã/phường/thị trấn đại diện cho các
vùng kinh tế, khu vực nông thôn, thành thị ở 63 tỉnh thành của cả nước.
3.2.2 Phần mềm sử dụng
Phần mềm Stata là một bộ chương trình được sử dụng phổ biến trong kinh tế
lượng và thống kê. Stata cho phép thực hiện nhiều lệnh cho một nhiệm vụ và thực hiện
cùng một lúc. Stata dễ dàng quản lý dữ liệu cũng như phân tích hồi quy. Nghiên cứu
này sử dụng phần mềm Stata phiên bản 12 của Stata Corporation.
3.2.3 Mô tả các biến trong dữ liệu
Dữ liệu được sử dụng trong nghiên cứu này được trích từ mục 1A, 2A, 3A, 4A
và mục thông tin chung từ bộ dữ liệu VHLSS năm 2012, được mô tả như bảng 3.1

23

Bảng 3.1 Các biến từ bộ dữ liệu VHLSS
Nguồn

Tên trường

Ý nghĩa

m1ac4b

Năm sinh

m1ac6

Tình trạng hôn nhân

m1ac2

Giới tính

m2c1

Học hết lớp

m2c2a

Bằng cấp cao nhất

m2c2b

Có bằng nghề

m4ac4

Mã ngành làm việc

Mục

m4ac8a

Theo loại hình kinh tế

3A.dta

m4ac3

Mã nghề làm việc

Mục
1A.dta

Mục
2A.dta

tinh

Tỉnh, thành phố nơi làm việc

m4ac11

Tiền lương, tiền công được nhận 12 tháng

Mục

m4ac12a

Tiền lễ, tết được nhận 12 tháng

4A.dta

m4ac7

Số giờ làm việc trong một ngày

m4ac3a

Số ngày làm việc trong 12 tháng

ttchung.dta

ttnt

Thành thị, nông thôn

3.2.4 Trích lọc số liệu
3.2.4.1 Dữ liệu thiếu hoặc bị lỗi:
Các dữ liệu trong quan sát hộ gia đình thường gặp vấn đề sai sót hoặc thiếu.
Trong nghiên cứu này gặp phải vấn đề dữ liệu thiếu hoặc có lỗi, để khắc phục tình
trạng trên trong nghiên cứu này tác giả bỏ những quan sát bị thiếu hoặc lỗi hoặc không
thu thập được.

24

3.2.4.2 Lọc số liệu:
Bước 1: Từ các biến trong mô hình, đọc các câu hỏi trong bộ số liệu VHLSS
2012 để tìm biến thích hợp với mục tiêu nghiên cứu của đề tài, tên biến là gì, nằm ở
bảng nào trong bộ dữ liệu. Từ đó chọn lọc các biến để xây dựng mô hình.
Bước 2: Liên kết các biến nằm rải rác ở các bảng trong bộ dữ liệu. Vì mỗi cá
nhân đã được mã hóa, nên dựa vào mã tỉnh, huyện, xã, địa bàn, hộ số và mã thành viên
để tạo liên kết giá trị các biến của mỗi quan sát.
Bước 3: Tính toán giá trị của một số biến: Dựa vào năm sinh tính tuổi và tính
toán số năm kinh nghiệm, số năm đi học, thu nhập bình quân theo giờ của mỗi cá nhân.
3.2.5 Cách thức ước lượng:
Hàm thu nhập Mincer được hồi quy bằng phương pháp hồi quy bình phương tối
thiểu thông thường (OLS – Ordinary Least Squares) với biến phụ thuộc là logarithm tự
nhiên của hàm tiền lương bằng lệnh regress trong phần mềm Stata. Hiện tượng phương
sai thay đổi được khắc phục bằng kỹ thuật Robust. Hiện tượng tự tương quan giữa các
biến giải thích được kiểm định bằng ma trận hiệp phương sai giữa các biến này.
3.3 Cách tính và quy đổi một số biến trong mô hình
3.3.1 Tiền lương bình quân giờ:
Tiền lương, tiền công trong năm và số giờ làm việc được xác định trực tiếp theo
số liệu khảo sát. Tiền lương trong năm là tiền lương, tiền công mà người lao động được
nhận trong 12 tháng trước cuộc điều tra cộng với tiền thưởng dịp lễ, tết trong 12 tháng
trước cuộc điều tra. Số giờ làm việc được tính bằng số giờ làm việc trong một ngày
nhân cho số ngày làm việc trong 12 tháng. Tiền lương bình quân giờ được tính bằng:
Tiền lương trong năm chia (/) cho số giờ làm việc trong năm.
3.3.2 Số năm đi học:
Số năm đi học được xác định từ VHLSS 2012, căn cứ vào:
Hệ thống giáo dục Việt Nam.
Năm sinh, học hết lớp và bằng cấp giáo dục đào tạo.

25

Các giả thiết: Năm đi học là từ 6 tuổi, thời gian theo học là liên tục, lên lớp mỗi
năm và số năm đi học của một cá nhân được xác định bằng tổng số năm đi học ở cả
ba bậc theo hệ thống giáo dục Việt Nam: Giáo dục phổ thông, giáo dục đại học và
giáo dục dạy nghề. Không có sự thay đổi về nơi cư trú.
Bảng 3.2 Số năm đi học quy đổi cho bậc giáo dục đại học
Bậc giáo dục

Cao đẳng

Đại học

Thạc sĩ

Tiến sĩ

3

4

2

4

Số năm đi học quy đổi

Bảng 3.3 Số năm đi học quy đổi cho bậc dạy nghề
Loại hình đào tạo
Sơ cấp nghề

Thời gian đi học khi có bằng
Tiểu học

THCS

THPT

3 tháng đến <1

3 tháng đến <1

3 tháng đến <1

năm

năm

năm

3-4 năm

1-2 năm

Trung cấp nghề
Cao đẳng nghề
Trung học chuyên
nghiệp

2-3 năm
3-4 năm

2 năm

3.3.3 Biến kinh nghiệm:
Hàm thu nhập Mincer giả định rằng: Khả năng học tập của mọi người là như
nhau và thời gian đi học là liên tục, chấm dứt khi bắt đầu làm việc. Thời điểm kể từ khi
thôi học ở các cơ sở giáo dục đến tuổi nghỉ hưu được xem là số năm kinh nghiệm tiềm
năng trong quá trình làm việc của mỗi cá nhân.
Biến kinh nghiệm tiềm năng trong hàm thu nhập Mincer của nghiên cứu này
được tính bằng: số tuổi (xác định theo năm sinh cho đến năm khảo sát 2012) trừ đi số
năm đi học (được tính ở biến giáo dục) và trừ cho 5 (ở Việt Nam, tuổi bắt đầu đi học là
sáu tuổi).

26

3.3.4 Quy đổi một số biến định tính
3.3.4.1 Biến tình trạng hôn nhân:
Tình trạng hôn nhân của mỗi cá nhân được chia thành hai nhóm: Nhóm thứ nhất
là nhóm đang có vợ hoặc có chồng; nhóm thứ hai là những người đang sống độc thân:
Chưa có vợ hoặc chưa có chồng, đã ly hôn, góa, ly thân. Biến tình trạng hôn nhân là
biến giả, nhận giá trị là 1 nếu cá nhân đó đang có vợ hoặc đang có chồng và nhóm độc
thân nhận giá trị 0.
3.3.4.2 Biến bằng cấp cao nhất đạt được:
Biến này được chia thành các nhóm: không bằng cấp, tốt nghiệp tiểu học, trung
học cơ sở, trung học phổ thông, trình độ cao đẳng – đại học và sau đại học (gồm thạc sĩ
và tiến sĩ). Bằng cấp của cá nhân được mã hóa thành năm biến giả. Không bằng cấp sẽ
là biến tham chiếu. Biến tốt nghiệp tiểu học, trung học cơ sở, trung học phổ thông, cao
đẳng – đại học, sau đại học là năm biến giả, các biến đó sẽ nhận giá trị 1 nếu cá nhân
có đặc tính của trình độ đó và sẽ nhận giá trị 0 nếu cá nhân không có đặc tính của trình
độ đó.
3.3.4.3 Biến bằng dạy nghề:
Bằng dạy nghề là biến nhị phân, sẽ nhận giá trị 1 nếu cá nhân đó có bằng đào
tạo nghề nghiệp (sơ cấp nghề, trung cấp nghề, trung cấp chuyên nghiệp, cao đẳng
nghề) và sẽ nhận giá trị 0 nếu không có bằng đào tạo nghề nghiệp.
3.3.4.4 Biến chuyên môn kỹ thuật:
Trình độ chuyên môn của một cá nhân được chia thành ba nhóm: Lao động có
trình độ kỹ thuật trung và cao cấp, lao động có chuyên môn kỹ thuật thấp và lao động
giản đơn. Biến lao động có kỹ thuật thấp, lao động chuyên môn kỹ thuật trung và cao
cấp là hai biến giả. Hai biến này sẽ nhận giá trị 1 nếu cá nhân có đặc tính của chuyên
môn đó đó và sẽ nhận giá trị 0 nếu cá nhân không có đặc tính của chuyên môn tương
ứng.

27

3.3.4.5 Biến ngành kinh tế:
Biến này là biến nhị phân, sẽ nhận giá trị 1 nếu cá nhân đó làm trong lĩnh vực
bán hàng, dịch vụ và nhận giá trị 0 nếu cá nhân đó làm trong các lĩnh vực còn lại.
3.3.4.6 Biến khu vực kinh tế:
Loại hình tổ chức mà người lao động đang làm việc. Được chia làm năm nhóm:
Nông, lâm, thủy sản; Hộ sản xuất kinh doanh cá thể; Tập thể; Tư nhân; Khu vực có vốn
đầu tư nước ngoài và Nhà nước. Biến Hộ sản xuất kinh doanh cá thể, tập thể, tư nhân,
khu vực có vốn đầu tư nước ngoài, nhà nước là các biến giả. Các biến này sẽ nhận giá
trị 1 nếu cá nhân đó làm trong khu vực tương ứng và nhận giá trị 0 nếu cá nhân đó
không tương ứng.
3.3.4.7 Biến thành thị/nông thôn:
Biến này là biến nhị phân, nhận giá trị là 1 nếu cá nhân đó ở thành thị và nhận
giá trị là 0 nếu cá nhân đó ở khu vực nông thôn.
3.3.4.8 Biến thành phố lớn
Biến vùng là biến nhị phân sẽ nhận giá trị là 1 nếu cá nhân đó ở thành phố Hồ
Chí Minh hoặc Hà Nội và nhận giá trị là 0 nếu cá nhân đó ở các tỉnh khác.
3.4 Phương pháp phân tích và đánh giá về bất bình đẳng giới trong tiền lương
3.4.1 Hàm thu nhập Mincer
Bằng cách phân tích các yếu tố cấu thành tiền lương lao động như năng lực, kỹ
năng và sự phân biệt đối xử. Hầu hết các công trình nghiên cứu thực nghiệm về mức
lương đều dựa vào hàm thu nhập của Mincer.
Mincer, J. (1974) trình bày mối quan hệ giữa thu nhập với giáo dục thông qua mô
hình học vấn với đường tiền lương theo học vấn cho thấy mối quan hệ giữa tiền lương
và số năm được giáo dục, đào tạo của người lao động làm thuê.
Độ dốc của đường tiền lương theo học vấn cho thấy mức tăng tiền lương khi
người lao động có thêm một năm học vấn. Người lao động sẽ quyết định chọn trình độ

28

học vấn tối ưu, quyết định dừng việc học khi mức lợi tức biên bằng với suất chiết khấu
kỳ vọng của họ. Đây là qui tắc dừng nhằm tối đa hóa giá trị hiện tại của tiền lương.
Mô hình học vấn với giả thiết bỏ qua yếu tố kinh nghiệm, được Mincer diễn dịch
toán học cho thấy logarithm của mức lương là hàm tỷ lệ thuận với số năm đi học:
ln {Y_S} = ln {Y_0} + r*S

(3.1)

Trong đó:
S: là số năm đi học
{Y_0}: là tiền lương hàng năm của người không có đi học
{Y_S}: là tiền lương hàng năm của người có S năm đi học
r: tỉ suất chiết khấu
Hệ số r của S biểu thị mức độ gia tăng tiền lương cũng chính là tỷ suất thu hồi nội
bộ. Đây là dạng thô sơ nhất về hàm tiền lương của cá nhân. Mô hình học vấn trở nên
đầy đủ hơn khi xét đến cả yếu tố kinh nghiệm như là quá trình đào tạo sau khi thôi học
và sự đào tạo này là có chi phí. Diễn dịch toán học của hàm Mincer đã quy đổi yếu tố
kinh nghiệm về đơn vị thời gian, từ đó dẫn tới hàm tiền lương phụ thuộc và số năm đi
học lẫn số năm kinh nghiệm, cho phép ước lượng các hệ số bằng phương pháp kinh tế
lượng. Phương trình (3.1) được viết lại như sau:
ln {mức lương} = ߙ 0 + ߙ 1Số năm đi học + ߙ 2Kinh nghiệm + ߙ 3Kinh nghiệm2 + ߝ
(3.2)
Trong đó:
S: là số năm đi học
t: là số năm kinh nghiệm. t=0,1,2,…
Ui: là sai số ngẫu nhiên
Các giả định là:
Lương chịu ảnh hưởng của giáo dục và kinh nghiệm theo chiều hướng thuận,
nghĩa là người có nhiều năm đi học hơn sẽ có lương cao hơn và người có kinh nghiệm
làm việc nhiều hơn sẽ có lương cao hơn. Hay hệ số của S và t >0

29

Kinh nghiệm hiệu ứng tác động biên giảm dần, có nghĩa là ở những người có
nhiều kinh nghiệm rồi thì mức độ tăng lương khi tăng thêm kinh nghiệm làm việc sẽ ít
hơn so với những người có ít kinh nghiệm. Hay hệ số của t2<0.
Ngoài ra có ý kiến cho rằng có sự khác biệt lương của lao động nam và lao động
nữ là do bị phân biệt giới, cụ thể mức lương của lao động nam sẽ cao hơn lao động nữ
dù cùng có tay nghề như nhau và công việc tương tự nhau.
3.4.2 Mô hình thực nghiệm và biến số quan sát
3.4.2.1 Mô hình thực nghiệm
Mô hình được phát triển và mở rộng từ phương trình (3.2) cho phép ước lượng
thêm nhiều biến độc lập bằng phương pháp kinh tế lượng. Phương trình được viết lại
như sau:
ln {mức lương} = ߙ 0 + ߙ 1S + ߙ 2t + ߙ 3t2 + các biến khác + ߝ

(3.3)

Thực hiện một phép hồi quy bình phương tối thiểu, trong đó sử dụng logarithm
tự nhiên của thu nhập làm biến phụ thuộc và số năm đi học cũng như số năm kinh
nghiệm và bình phương của nó làm các biến độc lập. Hệ số ước lượng cho số năm đi
học sẽ cho chúng ta biết phần trăm gia tăng của tiền lương khi thời gian đi học tăng
thêm một năm. Thông qua giả định rằng các cá nhân không khác nhau về năng lực bẩm
sinh, hệ số ước lượng cho số năm đi học có thể được lý giải là suất sinh lợi của việc đi
học. Hệ số ước lượng cho số năm công tác sẽ xác định tác động ước tính của kinh
nghiệm tích lũy theo thời gian đối với tiền lương. Hệ số dương của biến số năm kinh
nghiệm và hệ số âm của biến số năm kinh nghiệm bình phương có nghĩa là khi gia tăng
kinh nghiệm giúp làm tăng tiền lương nhưng với tốc độ giảm dần.
3.4.2.2 Mô hình tương tác
Phân tích tác động khác nhau của các biến độc lập, tác động của các biến tương
tác giữa biến độc lập với biến giới tính lên tiền lương của người lao động, nghiên cứu
này sử dụng mô hình hồi quy tương tác.Bằng việc tiến hành hồi quy logarithm tiền
lương theo giờ giữa các biến độc lập với biến giới tính sau khi loại bỏ các biến không

30

có ý nghĩa thống kê ở mô hình hồi quy tiền lương Mincer nhằm xác định bất bình đẳng
về tiền lương là do phân biệt giới hay năng suất lao động.
3.4.2.3 Biến phụ thuộc:
Biến phụ thuộc của nghiên cứu này là mức lương. Để xác định giá trị của biến
phụ thuộc này, cần tính tiền lương tiền công lương chính của các cá nhân người lao
động làm công ăn lương, có cam kết, hợp đồng, hưởng lương hàng tháng trong vòng 12
tháng trước thời gian điều tra. Lương ở đây bao gồm cả giá trị và hiện vật được qui đổi.
Lương bao gồm 2 khoản: khoản lương chính thức và khoản theo lương như: tiền lễ tết.
Tiền lương, tiền công ở đây tính bình quân theo giờ lao động. Biến phụ thuộc này được
lấy giá trị logarithm theo từng cá nhân.
3.4.2.4 Biến độc lập, ý nghĩa và dấu kỳ vọng

31

Bảng 3.4 Biến độc lập và dấu kỳ vọng
Tên biến

Ý nghĩa

Số năm đi học của một các nhân được xác định bằng
số năm đi học ở các cấp học gồm: giáo dục phổ
thông, giáo dục dạy nghề và giáo dục đại học.
Số năm kinh nghiệm của người lao động là khoảng
thời gian được tính từ lúc cá nhân thôi học đến năm
kinhnghiem
khảo sát. Thời điểm tính thâm niên làm việc sớm
nhất là khi cá nhân đó đủ 15 tuổi.
kinhnghiem2 Số năm kinh nghiệm bình phương
tieuhoc
Tiểu học
thcs
Trung học cơ sở
thpt
Trung học phổ thông
cddh
Cao đẳng, đại học
sdh
Sau đại học
bangnghe
Có bằng dạy nghề
honnhan
Tình trạng hôn nhân đang có gia đình
thanhthi
Người lao động làm việc ở thành thị
kythuat
Lao động có trình độ chuyên môn kỹ thuật thấp
Lao động có trình độ chuyên môn kỹ thuật cao và
kythuatcc
trung
kvnlts
Làm nông, lâm, thủy sản
kvhosxkd
Làm cho hộ SXKD cá thể
kvnhanuoc
Làm cho khu vực nhà nước
kvtunhan
Làm khu vực Tư nhân
kvnuocngoai Làm khu vực Vốn nước ngoài
bhdv
Người lao động làm về ngành bán hàng, dịch vụ
Làm việc tại thành phố lớn: Hà Nội, Thành phố Hồ
tplon
Chí Minh
gioi
Giới tính của người lao động
sonamdihoc

Dấu kỳ
vọng
(+)

(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)
(+)

32

TÓM TẮT Ý CHÍNH CHƯƠNG 3
Mô hình hồi quy hàm tiền lương Mincer được dùng để đánh giá tác động của các
nhân tố ảnh hưởng đến mức lương. Bên cạnh biến số năm đi học, số năm kinh nghiệm
và kinh nghiệm bình phương theo mô hình gốc, nghiên cứu này sử dụng hàm Mincer
gốc và sau đó mở rộng ra bằng cách sử dụng các biến về nhân khẩu học của người lao
động đã trình bày ở chương 2 nhằm kiểm chứng tác động của các yếu tố kinh tế lên
tiền lương của lao động nam và lao động nữ. Phương pháp chọn mẫu là bỏ các quan sát
không đầy đủ các biến trong mô hình. Biến phụ thuộc của nghiên cứu này là mức
lương. Được xác định thông qua tiền lương tiền công lương chính của các cá nhân
người lao động làm công ăn lương, có cam kết, hợp đồng, hưởng lương hàng tháng
trong vòng 12 tháng trước thời gian điều tra và số giờ làm việc của lao động đó trong
một năm. Biến phụ thuộc này được lấy giá trị logarithm theo từng cá nhân. Ngoài ra để
xác định có sự phân biệt đối xử theo giới tính được phân tích kết quả hồi quy mô hình
tương tác.