Bài giảng Sử dụng Stata cơ bản - Phan Hoàng Long
SỬ DỤNG STATA
CƠ BẢN
Phan Hoàng Long – Khoa QTKD - DUE
STATA, SAS, SPSS và R
SPSS
SAS
Stata
R
Điểm mạnh
• Dễ học và sử dụng
• Biểu đồ tốt
• Rất mạnh và
• Mạnh và toàn diện
• Rất mạnh và toàn
diện
toàn diện
hơn SPSS
• Rất hiệu quả khi chạy
các mô hình hồi quy cơ
bản
• Thông dụng cho • Rất hiệu quả khi
• Miễn phí
việc xử lý dữ
liệu khối lượng
lớn
chạy các mô hình
hồi quy nâng cao
Điểm yếu
• Khó sử dụng cho các mô • Chủ yếu dùng
• Khó học và sử dụng • Dùng code, khó học
hình hồi quy nâng cao
• Chủ yếu phù hợp cho các
phương pháp nghiên cứu
trong lĩnh vực khoa học
xã hội, nghiên cứu thị
code nên khó
học và sử dụng
hơn SPSS và
Stata
hơn SPSS nhưng dễ
hơn SAS và R
• Khả năng xử lý dữ
liệu khối lượng lớn
yếu hơn SAS và R
và sử dụng hơn
SAS, SPSS và Stata.
• Cho người có trình
độ lập trình nhất
định
trường hay tâm lý học
Sử dụng Stata
■ Câu lệnh
■ Menu
Phần I: Cross-sectional OLS
■ File dữ liệu: “1 - Diem tot nghiep va luong khoi diem.xlsx”
Thay đổi thư mục làm việc, import dữ
liệu
cd "C:\Users\Admin\Dropbox\STATA tutorial"
import excel "1 - Diem tot nghiep va luong khoi diem.xlsx", sheet("Sheet1") firstrow
Kiểm tra dữ liệu
Quản lý các biến
drop STT MasoSV
rename Ngaythangnamsinh DoB
sort Diemtotnghiep
Format của dữ liệu
Numerical
%
Description
Example
fmt
right-justified
% . g
general
fixed
%9.0g
%9.2f
%10.7e
%21x
%16H
%16L
%8H
# #
% . f
# #
% . e
exponential
hexadecimal
binary, hilo
binary, lohi
binary, hilo
binary, lohi
# #
%21x
%16H
%16L
%8H
%8L
%8L
right-justified with commas
% . gc
# #
% . fc
# #
general
fixed
%9.0gc
%9.2fc
right-justified with leading zeros
%0 . f
fixed
%09.2f
# #
left-justified
%- . g
# #
%- . f
# #
%- . e
# #
general
fixed
exponential
%-9.0g
%-9.2f
%-10.7e
left-justified with commas
%- . gc
# #
%- . fc
# #
general
fixed
%-9.0gc
%-9.2fc
You may substitute comma (,) for period (.) in any of
the above formats to make comma the decimal point. In
%9,2fc, 1000.03 is 1.000,03. Or you can set dp comma.
Format của dữ liệu
date
%fmt
string
%fmt
Description
Example
Description
string
Example
%15s
right-justified
right-justified
%tc
%tC
%td
%tw
%tm
%tq
%th
%ty
%tg
date/time
date/time
date
week
month
quarter
half-year
year
%tc
%tC
%td
%tw
%tm
%tq
%th
%ty
%tg
% s
#
left-justified
%- s
string
%-20s
%~12s
#
centered
%~ s
string
#
generic
left-justified
%-tc
%-tC
%-td
etc.
date/time
date/time
date
%-tc
%-tC
%-td
Mô hình hồi quy OLS
■ Lương khởi điểm = Điểm tốt nghiệp + Điểm hoạt động + Ngành + Giới tính + ɛ
Các phép toán trong stata
Tạo biến mới
■ tab Gioitinh
■ tab Nganh
■ gen D_Nam = 1 if Gioitinh==“Nam”
■ replace D_Nam=0 if Gioitinh!=“Nam”
■ gen D_NganhKT = 1 if Nganh==“Kinh te”
■ replace D_NganhKT=0 if D_NganhKT == .
■ encode Gioitinh, gen(D_Gioitinh)
■ encode Nganh, gen(D_Nganh)
■ tab D_Gioitinh
■ tab D_Nganh
■ save "Diem tot nghiep va luong khoi diem.dta"
Mô tả tổng kết dữ liệu
Mô tả tổng kết dữ liệu
■ Mô tả: sum Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT
■ Mô tả chi tiết: summarize Luongkhoidiem, d
■ Mô tả theo nhóm: bysort Gioitinh: sum Luongkhoidiem
■ Bảng mô tả: table Gioitinh Nganh, contents(mean Luongkhoidiem median
Diemtotnghiep max Diemhoatdong )
■ Tương quan: pwcorr Diemtotnghiep Diemhoatdong Luongkhoidiem D_Nam
D_NganhKT, sig star(5)
■ Biểu đồ: twoway (scatter Luongkhoidiem Diemtotnghiep, sort)
T-test
ttest Luongkhoidiem, by(Gioitinh)
ttest Luongkhoidiem, by(Nganh)
ttest Luongkhoidiem if Dantoc == "Kinh", by(Nganh)
Chạy hồi quy
■ Lương khởi điểm = Điểm tốt nghiệp + Điểm hoạt động + Ngành + Giới tính + ɛ
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT, vce(robust)
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT if Dantoc =="Kinh", vce(hc2)
regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT, cformat(%6.3f) sformat(%4.1f)
pformat(%4.2f)
Phân tích sau hồi quy
■ Breusch-Pagan / Cook-Weisberg test for heteroskedasticity: estat hettest
■ Residual: predict RES, resid
■ Fitted values: predict fitted_Luong_khoi_diem
Mô hình hồi quy mở rộng
■ Lương khởi điểm = Điểm tốt nghiệp + Điểm hoạt động + Ngành + Giới tính + Tuổi
+ Tháng sinh + Dân tộc + ɛ
■ gen ThangSinh=month(DoB)
■ gen NamSinh=year(DoB)
■ gen Tuoi=2018-NamSinh
■ Replace Dantoc=trim(Dantoc)
■ xi: reg Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT Tuoi
i.ThangSinh i.Dantoc
Mô hình hồi quy mở rộng với biến
tương tác
■ Lương khởi điểm = NgànhKT x Điểm tốt nghiệp + Điểm hoạt động + Giới tính +
Tuổi + Tháng sinh + Dân tộc + ɛ
■ xi: regress Luongkhoidiem D_NganhKT##c.Diemtotnghiep Diemhoatdong D_Nam
Tuoi i.ThangSinh i.Dantoc
■ Lương khởi điểm = Điểm tốt nghiệp + NgànhKT x Điểm hoạt động + Giới tính +
Tuổi + Tháng sinh + Dân tộc + ɛ
■ xi: regress Luongkhoidiem Diemtotnghiep D_NganhKT##c.Diemhoatdong D_Nam
Tuoi i.ThangSinh i.Dantoc
■ Lương khởi điểm = NgànhKT x Điểm tốt nghiệp + NgànhKT x Điểm hoạt động +
Giới tính + Tuổi + Tháng sinh + Dân tộc + ɛ
■ xi: regress Luongkhoidiem D_NganhKT##c.Diemtotnghiep
D_NganhKT##c.Diemhoatdong D_Nam Tuoi i.ThangSinh i.Dantoc
Xuất bảng kết quả
■ ssc install estout
■ eststo: regress Luongkhoidiem Diemtotnghiep Diemhoatdong
■ eststo: regress Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT
■ eststo: xi: reg Luongkhoidiem Diemtotnghiep Diemhoatdong D_Nam D_NganhKT
Tuoi i.ThangSinh i.Dantoc
■ esttab est1 est2 est3
Tải về để xem bản đầy đủ
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Sử dụng Stata cơ bản - Phan Hoàng Long", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
File đính kèm:
- bai_giang_su_dung_stata_co_ban_phan_hoang_long.pdf