Bài giảng Phân tích dữ liệu với SPSS - Chương 1: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang

Chương I  
PHÂN LOI DLIU, MÃ HÓA, NHP  
LIU VÀ MT SXLÝ TRÊN BIN  
Biên soạn: TS. NGUYỄN THỊ PHƯƠNG GIANG  
Phone: 0944.822.211  
E-Mail: nguyenthiphuonggiang@iuh.edu.vn  
NI DUNG  
• Phân loại dữ liệu  
• Các loại thang đo  
• Nguyên tắc mã hóa và nhập liệu  
• Cửa sổ làm việc của SPSS  
• Tạo tập tin dữ liệu trong SPSS  
• Một số xử lý trên biến  
• Thay đổi một số mặc định  
• Tiếng việt trong SPSS  
02/08/2017  
2
Phân loi Dliu  
• Dữ liệu định tính: Phản ánh tính chất, sự  
hơn kém, không tính được trị trung bình.  
• Ví dụ: Giới tính, kết quả học tập.  
• Dữ liệu định lượng: Phản ánh mức độ hơn  
kém, được thể hiện bằng các con số nên  
tính được giá trị trung bình. Các con số  
thu thập có thể ở dạng liên tục hay rời rạc.  
02/08/2017  
3
1
Các loi thang đo  
• Thang đo danh nghĩa (Nominal scale):  
Trong thang đo này, các con số chỉ dùng  
để phân loại các đối tượng.  
• Những phép toán thống kê có thể sử dụng  
được là: đếm, tính tần suất của một biểu  
hiện nào đó  
02/08/2017  
4
Các loi thang đo  
• Thang đo thứ bậc (Ordinal scale): Các con  
số trong thang đo danh nghĩa được sắp  
xếp theo một qui thứ bậc.  
Ví dụ: Bạn hài lòng như thế nào về mùi của  
sản phẩm Snack Khoai tây chiên mà bạn  
vừa dùng thử? (Hài lòng, bình thường,  
không hài lòng)  
02/08/2017  
5
Các loi thang đo  
• Thang đo khoảng (Interval scale): Là dạng  
đặc biệt của thang đo thứ bậc vì nó cho  
biết được khoảng cách giữa các thứ bậc.  
Thông thường thang đo khoảng có dạng là  
một dãy các chữ số liên tục và đều đặn từ  
1 đến 5, từ 1 đến 7 hay từ 1 đến 10,…  
Dãy số này có 2 cực ở hai đầu thể hiện 2  
trạng thái đối nghịch nhau.  
02/08/2017  
6
2
Các loi thang đo  
• Thang đo tỉ lệ (Ratio scale): có tất cả các  
đặc tính khoảng cách và thứ tự của thang  
đo khoảng, ngoài ra điểm không trong  
thang đo khoảng là một giá trị thật nên có  
thể thực hiện được phép chia để tính tỉ lệ.  
Thang đo khoảng và thang đo tỉ lệ có thể đo  
lường nên SPSS gộp chung hai loại thang  
đo này thành thang đo mức độ (Scale  
Measures).  
02/08/2017  
7
Nguyên tc Mã hóa – Nhp liu  
Gii tính Tui  
Nghnghip  
1
2
N  
Nữ  
21  
Sinh viên  
32 Nhân viên văn phòng  
3
Nam  
53  
42  
Vhưu  
n
Nam  
Nghkhác  
02/08/2017  
8
Nguyên tc Mã hóa –  
Nhp liu  
Gii tính Tui  
Nghnghip  
1
2
2
2
21  
32  
53  
42  
10  
3
3
1
11  
14  
1
n
02/08/2017  
9
3
Nguyên tc Mã hóa –  
Nhp liu  
• Phần lớn mỗi biến tương ứng với một câu  
hỏi cụ thể trong bản trả lời. Như thế ta chỉ  
cần tạo 1 biến.  
• Trường hợp câu hỏi có thể chọn nhiều trả  
lời thì chúng ta phải có nhiều con số để  
nhập nên cần phải có nhiều ô để nhập.  
• Qui tắc nhập liệu: Từ trái qua phải (theo  
từng dòng) và từ trên xuống (sang dòng)  
02/08/2017  
10  
Ca slàm vic ca SPSS  
• Khởi động  
- Click biểu chương trình trên thanh công cụ  
- Từ Menu Start, chọn Program, chọn SPSS  
• Nội dung của Menu  
- File: xử lý File  
- Edit: chỉnh sửa  
- View: Hiển thị  
02/08/2017  
11  
Ca slàm vic ca SPSS  
- Data: các công tác liên quan đến dữ liệu  
- Transform: Chuyển đổi dữ liệu, tính toán,  
mã hóa lại các biến.  
- Analyze: Thực hiện các thủ tục thống kê  
- Graphs: Tạo biểu đồ, đồ thị  
- Windows: Sắp xếp các cửa sổ làm việc  
trong SPSS.  
02/08/2017  
12  
4
To tp tin dliu trong  
SPSS for Windows  
• Khai báo biến:  
- Click Variable view.  
- Khai báo biến trên từng dòng, nội dung  
của dòng là các thuộc tính của biến.  
- Name: Tên biến  
- Type: Kiểu biến  
- Width: Độ rộng của biến  
02/08/2017  
13  
14  
15  
To tp tin dliu trong  
SPSS for Windows  
- Decimals: Số số lẻ  
- Label: Nhãn biến  
- Value: Mã hóa cho các giá trị định tính  
- Missing: Khai báo các loại giá trị khuyết  
- Column: Độ rộng của biến khi nhập liệu  
- Align: Vị trí dữ liệu trong cột  
- Measure: Chọn loại thang đo  
02/08/2017  
To tp tin dliu trong  
SPSS for Windows  
• Lưu tập tin dữ liệu:  
- Menu File, chọn Save.  
- Save in: chọn nơi lưu  
- File name: Đặt tên file (chỉ đặt tên chính)  
- Click nút Save  
Mặc định kiểu tập tin là sav  
02/08/2017  
5
Mt sxlý trên biến  
• Mã hóa lại biến (Recode):  
Sử dụng khi cần giảm số biểu hiện của một  
biến định tính.  
Hoặc muốn chuyển biến định lượng thành  
biến định tính  
- Qui trình thực hiện:  
- Menu Transform > Recode into Different  
Variables (tạo biến mới) hoặc Recode into  
Same Variables (thay biến cũ)  
02/08/2017  
16  
Mt sxlý trên biến  
- Chọn biến muốn Recode  
- Đặt lại Name và Label, Click Change  
- Click Old and New Values… để xác định sự  
chuyển đổi.  
- Click Continue và OK để thực hiện lệnh.  
02/08/2017  
17  
Mt sxlý trên biến  
• Chuyển biến dạng Category thành biến  
dạng Dichotomy:  
Biến dạng Category có nhiều trị số mã hóa  
tượng trưng cho nhiều trạng thái.  
Biến Dichotomy là biến phân loại chỉ có 2 trị  
số mã hóa tượng trưng cho 2 trạng thái  
khác nhau (có hoặc không)  
02/08/2017  
18  
6
Mt sxlý trên biến  
• Cách thực hiện:  
– Menu transform, chọn Count  
Target Variable: Khai báo tên biến cần tạo  
Target Label: Khai báo nhãn  
– Đưa các biến cần chuyển vào Numeric Var  
– Click Define Values mở hộp thoại  
– Nhận 7 vào ô Value  
02/0  
8/2  
C
017lick Continue và OK  
19  
Tùy chn ca chương  
trình  
• Menu Edit, chọn Options:  
– Measurement System: Thay đổi đơn vị  
– Variable list: Thay đổi cách thể hiện  
– Pivot Table: Chọn cách thể hiện bảng kết quả  
– File Location: Chọn nơi lưu trữ và mở file dữ  
liệu  
– Viewer: Chọn font hiển thị kết quả  
02/08/2017  
20  
Câu hi ôn tp  
1. Hãy cho biết các loi dliu và các  
loi thang đo?  
2. Nguyên tc mã hóa và nhp liu  
3. Trình bày cách to tp tin dliu  
trong SPSS For Windows.  
4. Qui trình thc hin vic mã hóa li  
biến (Recode)  
5. Chuyn Category thành Dichotomy  
02/08/2017  
21  
7
CHƯƠNG II  
LÀM SẠCH DỮ LIỆU  
NỘI DUNG  
Sự cần thiết  
Các biện pháp ngăn ngừa  
Các phương pháp làm sạch dữ liệu  
Sự cần thiết  
Dữ liệu sau khi nhập xong chưa thể đưa vào xử lý và  
phân tích vì:  
Chất lượng của phỏng vấn và đọc soát (hiểu sai, thu  
thập sai, chọn sai đối tượng, trả lời sai ý, người đọc  
soát chưa phát hiện,…)  
Nhập dữ liệu (sai, sót, thừa)  
8
Các biện pháp ngăn ngừa  
Thiết kế bản câu hỏi rõ ràng, dễ hỏi, dễ trả lời.  
Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.  
Sau khi phỏng vấn, bản câu hỏi phải được đọc soát  
trước khi nhập.  
Việc mã hóa phải được tiến hành tập trung với một số  
ít cá nhân phụ trách.  
Các phương pháp làm sạch dữ liệu  
Dùng bảng tần số  
-
Lập bảng tần số cho tất cả các biến, đọc và rà soát các  
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.  
-
Cách thực hiện  
Trong Data View, chọn cột có giá trị lỗi  
Vào Menu Edit > Find  
Nhập vào giá trị lỗi  
-
-
-
Truy ngược lại số thứ tự của hàng để biết được bản  
câu hỏi tương ứng.  
Các phương pháp làm sạch dữ liệu  
Dùng bảng phối hợp hai hay ba biến  
-
Lập bảng tần số cho tất cả các biến, đọc và rà soát các  
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.  
-
Cách thực hiện  
Trong Data View, chọn cột có giá trị lỗi  
Vào Menu Edit > Find  
Nhập vào giá trị lỗi  
-
-
-
Truy ngược lại số thứ tự của hàng để biết được bản  
câu hỏi tương ứng.  
-
Vào Data > Sort Case để sắp xếp biến filter_$  
9
Các phương pháp làm sạch dữ liệu  
Cách tìm lỗi đơn giản ngay trên cửa sổ dữ liệu  
-
Sử dụng lệnh Data > Sort Case để tìm lỗi đơn giản  
cho các biến giới tính.  
Câu hỏi ôn tập  
Sự cần thiết phải làm sạch dữ liệu.  
Các biện pháp ngăn ngừa lỗi cho dữ liệu  
Trình bày các phương pháp làm sạch dữ  
liệu từ đơn giản đến phức tạp.  
CHƯƠNG III  
TÓM TẮT VÀ TRÌNH BÀY  
DỮ LIỆU  
30  
10  
pdf 10 trang yennguyen 08/04/2022 73260
Bạn đang xem tài liệu "Bài giảng Phân tích dữ liệu với SPSS - Chương 1: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfbai_giang_phan_tich_du_lieu_voi_spss_chuong_1_phan_loai_du_l.pdf