Bài giảng Phân tích dữ liệu với SPSS - Chương 1: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang
Chương I
PHÂN LOẠI DỮ LIỆU, MÃ HÓA, NHẬP
LIỆU VÀ MỘT SỐ XỬ LÝ TRÊN BIẾN
Biên soạn: TS. NGUYỄN THỊ PHƯƠNG GIANG
Phone: 0944.822.211
E-Mail: nguyenthiphuonggiang@iuh.edu.vn
NỘI DUNG
• Phân loại dữ liệu
• Các loại thang đo
• Nguyên tắc mã hóa và nhập liệu
• Cửa sổ làm việc của SPSS
• Tạo tập tin dữ liệu trong SPSS
• Một số xử lý trên biến
• Thay đổi một số mặc định
• Tiếng việt trong SPSS
02/08/2017
2
Phân loại Dữ liệu
• Dữ liệu định tính: Phản ánh tính chất, sự
hơn kém, không tính được trị trung bình.
• Ví dụ: Giới tính, kết quả học tập.
• Dữ liệu định lượng: Phản ánh mức độ hơn
kém, được thể hiện bằng các con số nên
tính được giá trị trung bình. Các con số
thu thập có thể ở dạng liên tục hay rời rạc.
02/08/2017
3
1
Các loại thang đo
• Thang đo danh nghĩa (Nominal scale):
Trong thang đo này, các con số chỉ dùng
để phân loại các đối tượng.
• Những phép toán thống kê có thể sử dụng
được là: đếm, tính tần suất của một biểu
hiện nào đó
02/08/2017
4
Các loại thang đo
• Thang đo thứ bậc (Ordinal scale): Các con
số trong thang đo danh nghĩa được sắp
xếp theo một qui thứ bậc.
Ví dụ: Bạn hài lòng như thế nào về mùi của
sản phẩm Snack Khoai tây chiên mà bạn
vừa dùng thử? (Hài lòng, bình thường,
không hài lòng)
02/08/2017
5
Các loại thang đo
• Thang đo khoảng (Interval scale): Là dạng
đặc biệt của thang đo thứ bậc vì nó cho
biết được khoảng cách giữa các thứ bậc.
Thông thường thang đo khoảng có dạng là
một dãy các chữ số liên tục và đều đặn từ
1 đến 5, từ 1 đến 7 hay từ 1 đến 10,…
Dãy số này có 2 cực ở hai đầu thể hiện 2
trạng thái đối nghịch nhau.
02/08/2017
6
2
Các loại thang đo
• Thang đo tỉ lệ (Ratio scale): có tất cả các
đặc tính khoảng cách và thứ tự của thang
đo khoảng, ngoài ra điểm không trong
thang đo khoảng là một giá trị thật nên có
thể thực hiện được phép chia để tính tỉ lệ.
Thang đo khoảng và thang đo tỉ lệ có thể đo
lường nên SPSS gộp chung hai loại thang
đo này thành thang đo mức độ (Scale
Measures).
02/08/2017
7
Nguyên tắc Mã hóa – Nhập liệu
Giới tính Tuổi
Nghề nghiệp
1
2
Nữ
Nữ
21
Sinh viên
32 Nhân viên văn phòng
3
Nam
…
53
…
42
Về hưu
…
…
n
Nam
Nghề khác
02/08/2017
8
Nguyên tắc Mã hóa –
Nhập liệu
Giới tính Tuổi
Nghề nghiệp
1
2
2
2
21
32
53
…
42
10
3
3
1
11
…
14
…
…
1
n
02/08/2017
9
3
Nguyên tắc Mã hóa –
Nhập liệu
• Phần lớn mỗi biến tương ứng với một câu
hỏi cụ thể trong bản trả lời. Như thế ta chỉ
cần tạo 1 biến.
• Trường hợp câu hỏi có thể chọn nhiều trả
lời thì chúng ta phải có nhiều con số để
nhập nên cần phải có nhiều ô để nhập.
• Qui tắc nhập liệu: Từ trái qua phải (theo
từng dòng) và từ trên xuống (sang dòng)
02/08/2017
10
Cửa sổ làm việc của SPSS
• Khởi động
- Click biểu chương trình trên thanh công cụ
- Từ Menu Start, chọn Program, chọn SPSS
• Nội dung của Menu
- File: xử lý File
- Edit: chỉnh sửa
- View: Hiển thị
02/08/2017
11
Cửa sổ làm việc của SPSS
- Data: các công tác liên quan đến dữ liệu
- Transform: Chuyển đổi dữ liệu, tính toán,
mã hóa lại các biến.
- Analyze: Thực hiện các thủ tục thống kê
- Graphs: Tạo biểu đồ, đồ thị
- Windows: Sắp xếp các cửa sổ làm việc
trong SPSS.
02/08/2017
12
4
Tạo tập tin dữ liệu trong
SPSS for Windows
• Khai báo biến:
- Click Variable view.
- Khai báo biến trên từng dòng, nội dung
của dòng là các thuộc tính của biến.
- Name: Tên biến
- Type: Kiểu biến
- Width: Độ rộng của biến
02/08/2017
13
14
15
Tạo tập tin dữ liệu trong
SPSS for Windows
- Decimals: Số số lẻ
- Label: Nhãn biến
- Value: Mã hóa cho các giá trị định tính
- Missing: Khai báo các loại giá trị khuyết
- Column: Độ rộng của biến khi nhập liệu
- Align: Vị trí dữ liệu trong cột
- Measure: Chọn loại thang đo
02/08/2017
Tạo tập tin dữ liệu trong
SPSS for Windows
• Lưu tập tin dữ liệu:
- Menu File, chọn Save.
- Save in: chọn nơi lưu
- File name: Đặt tên file (chỉ đặt tên chính)
- Click nút Save
Mặc định kiểu tập tin là sav
02/08/2017
5
Một số xử lý trên biến
• Mã hóa lại biến (Recode):
Sử dụng khi cần giảm số biểu hiện của một
biến định tính.
Hoặc muốn chuyển biến định lượng thành
biến định tính
- Qui trình thực hiện:
- Menu Transform > Recode into Different
Variables (tạo biến mới) hoặc Recode into
Same Variables (thay biến cũ)
02/08/2017
16
Một số xử lý trên biến
- Chọn biến muốn Recode
- Đặt lại Name và Label, Click Change
- Click Old and New Values… để xác định sự
chuyển đổi.
- Click Continue và OK để thực hiện lệnh.
02/08/2017
17
Một số xử lý trên biến
• Chuyển biến dạng Category thành biến
dạng Dichotomy:
Biến dạng Category có nhiều trị số mã hóa
tượng trưng cho nhiều trạng thái.
Biến Dichotomy là biến phân loại chỉ có 2 trị
số mã hóa tượng trưng cho 2 trạng thái
khác nhau (có hoặc không)
02/08/2017
18
6
Một số xử lý trên biến
• Cách thực hiện:
– Menu transform, chọn Count
– Target Variable: Khai báo tên biến cần tạo
– Target Label: Khai báo nhãn
– Đưa các biến cần chuyển vào Numeric Var
– Click Define Values mở hộp thoại
– Nhận 7 vào ô Value
02/0
–
8/2
C
017lick Continue và OK
19
Tùy chọn của chương
trình
• Menu Edit, chọn Options:
– Measurement System: Thay đổi đơn vị
– Variable list: Thay đổi cách thể hiện
– Pivot Table: Chọn cách thể hiện bảng kết quả
– File Location: Chọn nơi lưu trữ và mở file dữ
liệu
– Viewer: Chọn font hiển thị kết quả
02/08/2017
20
Câu hỏi ôn tập
1. Hãy cho biết các loại dữ liệu và các
loại thang đo?
2. Nguyên tắc mã hóa và nhập liệu
3. Trình bày cách tạo tập tin dữ liệu
trong SPSS For Windows.
4. Qui trình thực hiện việc mã hóa lại
biến (Recode)
5. Chuyển Category thành Dichotomy
02/08/2017
21
7
CHƯƠNG II
LÀM SẠCH DỮ LIỆU
NỘI DUNG
Sự cần thiết
Các biện pháp ngăn ngừa
Các phương pháp làm sạch dữ liệu
Sự cần thiết
Dữ liệu sau khi nhập xong chưa thể đưa vào xử lý và
phân tích vì:
Chất lượng của phỏng vấn và đọc soát (hiểu sai, thu
thập sai, chọn sai đối tượng, trả lời sai ý, người đọc
soát chưa phát hiện,…)
Nhập dữ liệu (sai, sót, thừa)
8
Các biện pháp ngăn ngừa
Thiết kế bản câu hỏi rõ ràng, dễ hỏi, dễ trả lời.
Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.
Sau khi phỏng vấn, bản câu hỏi phải được đọc soát
trước khi nhập.
Việc mã hóa phải được tiến hành tập trung với một số
ít cá nhân phụ trách.
Các phương pháp làm sạch dữ liệu
Dùng bảng tần số
-
Lập bảng tần số cho tất cả các biến, đọc và rà soát các
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.
-
Cách thực hiện
Trong Data View, chọn cột có giá trị lỗi
Vào Menu Edit > Find
Nhập vào giá trị lỗi
-
-
-
Truy ngược lại số thứ tự của hàng để biết được bản
câu hỏi tương ứng.
Các phương pháp làm sạch dữ liệu
Dùng bảng phối hợp hai hay ba biến
-
Lập bảng tần số cho tất cả các biến, đọc và rà soát các
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.
-
Cách thực hiện
Trong Data View, chọn cột có giá trị lỗi
Vào Menu Edit > Find
Nhập vào giá trị lỗi
-
-
-
Truy ngược lại số thứ tự của hàng để biết được bản
câu hỏi tương ứng.
-
Vào Data > Sort Case để sắp xếp biến filter_$
9
Các phương pháp làm sạch dữ liệu
Cách tìm lỗi đơn giản ngay trên cửa sổ dữ liệu
-
Sử dụng lệnh Data > Sort Case để tìm lỗi đơn giản
cho các biến giới tính.
Câu hỏi ôn tập
Sự cần thiết phải làm sạch dữ liệu.
Các biện pháp ngăn ngừa lỗi cho dữ liệu
Trình bày các phương pháp làm sạch dữ
liệu từ đơn giản đến phức tạp.
CHƯƠNG III
TÓM TẮT VÀ TRÌNH BÀY
DỮ LIỆU
30
10
Bạn đang xem tài liệu "Bài giảng Phân tích dữ liệu với SPSS - Chương 1: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
File đính kèm:
- bai_giang_phan_tich_du_lieu_voi_spss_chuong_1_phan_loai_du_l.pdf