Bài giảng Sử dụng Stata cơ bản - Phan Hoàng Long

SỬ DỤNG STATA  
CƠ BẢN  
Phan Hoàng Long – Khoa QTKD - DUE  
STATA, SAS, SPSS và R  
SPSS  
SAS  
Stata  
R
Điểm mạnh  
Dễ học và sử dụng  
Biểu đồ tốt  
Rất mạnh và  
Mạnh và toàn diện  
Rất mạnh và toàn  
diện  
toàn diện  
hơn SPSS  
Rất hiệu quả khi chạy  
các mô hình hồi quy cơ  
bản  
Thông dụng cho Rất hiệu quả khi  
Miễn phí  
việc xử lý dữ  
liệu khối lượng  
lớn  
chạy các mô hình  
hồi quy nâng cao  
Điểm yếu  
Khó sử dụng cho các mô Chủ yếu dùng  
Khó học và sử dụng Dùng code, khó học  
hình hồi quy nâng cao  
Chủ yếu phù hợp cho các  
phương pháp nghiên cứu  
trong lĩnh vực khoa học  
xã hội, nghiên cứu thị  
code nên khó  
học và sử dụng  
hơn SPSS và  
Stata  
hơn SPSS nhưng dễ  
hơn SAS và R  
Khả năng xử lý dữ  
liệu khối lượng lớn  
yếu hơn SAS và R  
và sử dụng hơn  
SAS, SPSS và Stata.  
Cho người có trình  
độ lập trình nhất  
định  
trường hay tâm lý học  
Sdng Stata  
Câu lnh  
Menu  
Phần I: Cross-sectional OLS  
File dữ liệu: “1 - Diem tot nghiep va luong khoi diem.xlsx”  
Thay đổi thư mục làm việc, import dữ  
liệu  
cd "C:\Users\Admin\Dropbox\STATA tutorial"  
import excel "1 - Diem tot nghiep va luong khoi diem.xlsx", sheet("Sheet1") firstrow  
Kiểm tra dữ liệu  
Quản lý các biến  
drop STT MasoSV  
rename Ngaythangnamsinh DoB  
sort Diemtotnghiep  
Format của dữ liệu  
Numerical  
%
Description  
Example  
fmt  
right-justified  
% . g  
general  
fixed  
%9.0g  
%9.2f  
%10.7e  
%21x  
%16H  
%16L  
%8H  
# #  
% . f  
# #  
% . e  
exponential  
hexadecimal  
binary, hilo  
binary, lohi  
binary, hilo  
binary, lohi  
# #  
%21x  
%16H  
%16L  
%8H  
%8L  
%8L  
right-justified with commas  
% . gc  
# #  
% . fc  
# #  
general  
fixed  
%9.0gc  
%9.2fc  
right-justified with leading zeros  
%0 . f  
fixed  
%09.2f  
# #  
left-justified  
%- . g  
# #  
%- . f  
# #  
%- . e  
# #  
general  
fixed  
exponential  
%-9.0g  
%-9.2f  
%-10.7e  
left-justified with commas  
%- . gc  
# #  
%- . fc  
# #  
general  
fixed  
%-9.0gc  
%-9.2fc  
You may substitute comma (,) for period (.) in any of  
the above formats to make comma the decimal point. In  
%9,2fc, 1000.03 is 1.000,03. Or you can set dp comma.  
Format của dữ liệu  
date  
%fmt  
string  
%fmt  
Description  
Example  
Description  
string  
Example  
%15s  
right-justified  
right-justified  
%tc  
%tC  
%td  
%tw  
%tm  
%tq  
%th  
%ty  
%tg  
date/time  
date/time  
date  
week  
month  
quarter  
half-year  
year  
%tc  
%tC  
%td  
%tw  
%tm  
%tq  
%th  
%ty  
%tg  
% s  
#
left-justified  
%- s  
string  
%-20s  
%~12s  
#
centered  
%~ s  
string  
#
generic  
left-justified  
%-tc  
%-tC  
%-td  
etc.  
date/time  
date/time  
date  
%-tc  
%-tC  
%-td  
Mô hình hồi quy OLS  
Lương khởi điểm = Điểm tốt nghiệp + Điểm hoạt động + Ngành + Giới tính + ɛ  
Các phép toán trong stata  
Tạo biến mới  
tab Gioitinh  
tab Nganh  
gen D_Nam = 1 if Gioitinh==“Nam”  
replace D_Nam=0 if Gioitinh!=“Nam”  
gen D_NganhKT = 1 if Nganh==“Kinh te”  
replace D_NganhKT=0 if D_NganhKT == .  
encode Gioitinh, gen(D_Gioitinh)  
encode Nganh, gen(D_Nganh)  
tab D_Gioitinh  
tab D_Nganh  
save "Diem tot nghiep va luong khoi diem.dta"  
Mô tả tổng kết dữ liệu  
Mô tả tổng kết dữ liệu  
Mô tả: sum Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT  
Mô tả chi tiết: summarize Luongkhoidiem, d  
Mô tả theo nhóm: bysort Gioitinh: sum Luongkhoidiem  
Bảng mô tả: table Gioitinh Nganh, contents(mean Luongkhoidiem median  
Diemtotnghiep max Diemhoatdong )  
Tương quan: pwcorr Diemtotnghiep Diemhoatdong Luongkhoidiem D_Nam  
D_NganhKT, sig star(5)  
Biểu đồ: twoway (scatter Luongkhoidiem Diemtotnghiep, sort)  
T-test  
ttest Luongkhoidiem, by(Gioitinh)  
ttest Luongkhoidiem, by(Nganh)  
ttest Luongkhoidiem if Dantoc == "Kinh", by(Nganh)  
Chạy hồi quy  
Lương khởi điểm = Điểm tốt nghiệp + Điểm hoạt động + Ngành + Giới tính + ɛ  
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT  
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT, vce(robust)  
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT if Dantoc =="Kinh", vce(hc2)  
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT, cformat(%6.3f) sformat(%4.1f)  
pformat(%4.2f)  
Phân tích sau hồi quy  
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity: estat hettest  
Residual: predict RES, resid  
Fitted values: predict fitted_Luong_khoi_diem  
Mô hình hồi quy mở rộng  
Lương khởi điểm = Điểm tốt nghiệp + Điểm hoạt động + Ngành + Giới tính + Tuổi  
+ Tháng sinh + Dân tộc + ɛ  
gen ThangSinh=month(DoB)  
gen NamSinh=year(DoB)  
gen Tuoi=2018-NamSinh  
Replace Dantoc=trim(Dantoc)  
xi: reg Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT Tuoi  
i.ThangSinh i.Dantoc  
Mô hình hồi quy mở rộng với biến  
tương tác  
Lương khởi điểm = NgànhKT x Điểm tốt nghiệp + Điểm hoạt động + Giới tính +  
Tuổi + Tháng sinh + Dân tộc + ɛ  
xi: regress Luongkhoidiem D_NganhKT##c.Diemtotnghiep Diemhoatdong D_Nam  
Tuoi i.ThangSinh i.Dantoc  
Lương khởi điểm = Điểm tốt nghiệp + NgànhKT x Điểm hoạt động + Giới tính +  
Tuổi + Tháng sinh + Dân tộc + ɛ  
xi: regress Luongkhoidiem Diemtotnghiep D_NganhKT##c.Diemhoatdong D_Nam  
Tuoi i.ThangSinh i.Dantoc  
Lương khởi điểm = NgànhKT x Điểm tốt nghiệp + NgànhKT x Điểm hoạt động +  
Giới tính + Tuổi + Tháng sinh + Dân tộc + ɛ  
xi: regress Luongkhoidiem D_NganhKT##c.Diemtotnghiep  
D_NganhKT##c.Diemhoatdong D_Nam Tuoi i.ThangSinh i.Dantoc  
Xuất bảng kết quả  
ssc install estout  
eststo: regress Luongkhoidiem Diemtotnghiep Diemhoatdong  
eststo: regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT  
eststo: xi: reg Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT  
Tuoi i.ThangSinh i.Dantoc  
esttab est1 est2 est3  
Tải về để xem bản đầy đủ
pdf 41 trang yennguyen 09/04/2022 9240
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Sử dụng Stata cơ bản - Phan Hoàng Long", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfbai_giang_su_dung_stata_co_ban_phan_hoang_long.pdf