1. Mức ý nghĩa thống kê (alpha level, α) thường được sử dụng trong khoa học xã hội là:
A. 0.1
B. 0.01
C. 0.05
D. 0.5
2. Phương pháp chọn mẫu ngẫu nhiên phân tầng (stratified random sampling) giúp:
A. Đảm bảo mỗi cá thể trong tổng thể đều có cơ hội được chọn như nhau
B. Giảm thiểu sai số chọn mẫu và tăng tính đại diện của mẫu
C. Tiết kiệm thời gian và chi phí thu thập dữ liệu
D. Loại bỏ hoàn toàn sai số chọn mẫu
3. Trong hồi quy tuyến tính đơn giản, hệ số góc (slope) biểu thị:
A. Giá trị trung bình của biến phụ thuộc khi biến độc lập bằng 0
B. Mức độ phân tán của dữ liệu xung quanh đường hồi quy
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên một đơn vị
D. Độ mạnh yếu của mối quan hệ tuyến tính giữa hai biến
4. Độ mạnh của kiểm định (statistical power) là:
A. Xác suất mắc phải sai lầm Loại I
B. Xác suất bác bỏ giả thuyết null khi nó thực sự sai
C. Xác suất không bác bỏ giả thuyết null khi nó thực sự đúng
D. Mức ý nghĩa thống kê (alpha level)
5. Để so sánh sự khác biệt về trung bình của hai nhóm *phụ thuộc* (paired samples), kiểm định nào sau đây là phù hợp nhất?
A. Kiểm định t độc lập (independent samples t-test)
B. Kiểm định t cặp (paired samples t-test)
C. Kiểm định ANOVA
D. Kiểm định Chi-bình phương
6. Khi cỡ mẫu tăng lên, điều gì thường xảy ra với khoảng tin cậy?
A. Khoảng tin cậy trở nên rộng hơn
B. Khoảng tin cậy trở nên hẹp hơn
C. Khoảng tin cậy không thay đổi
D. Khoảng tin cậy trở nên không xác định
7. Khi báo cáo kết quả thống kê, giá trị p-value nên được trình bày như thế nào?
A. p = 0.000
B. p < 0.05
C. p = .000
D. p < .001
8. Phân tích phương sai (ANOVA) được sử dụng để:
A. Kiểm tra mối quan hệ giữa hai biến định lượng
B. So sánh trung bình của hai nhóm độc lập
C. So sánh trung bình của ba nhóm trở lên
D. Dự đoán giá trị của một biến phụ thuộc dựa trên một biến độc lập
9. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi cỡ mẫu rất lớn (n > 100)
B. Khi dữ liệu tuân theo phân phối chuẩn
C. Khi giả định về phân phối chuẩn của dữ liệu không được đáp ứng
D. Khi muốn tính toán khoảng tin cậy
10. Khoảng tin cậy (confidence interval) cung cấp:
A. Một giá trị duy nhất ước tính cho tham số tổng thể
B. Một khoảng giá trị mà tham số tổng thể có khả năng nằm trong đó với một mức độ tin cậy nhất định
C. Xác suất tham số tổng thể nằm trong một khoảng cụ thể
D. Mức độ chính xác của kết quả kiểm định giả thuyết
11. Sai lầm Loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Không bác bỏ giả thuyết null khi nó thực sự sai
C. Chọn mẫu không đại diện cho tổng thể
D. Tính toán sai giá trị thống kê kiểm định
12. Giá trị trung vị (median) KHÔNG bị ảnh hưởng bởi:
A. Các giá trị cực đoan (outliers)
B. Tổng số lượng quan sát
C. Vị trí tương đối của các giá trị trong dãy số liệu
D. Giá trị trung bình cộng (mean)
13. Nếu hệ số tương quan Pearson r = -0.8, điều này có nghĩa là:
A. Không có mối quan hệ tuyến tính giữa hai biến
B. Có mối quan hệ tuyến tính mạnh mẽ và dương giữa hai biến
C. Có mối quan hệ tuyến tính mạnh mẽ và âm giữa hai biến
D. Có mối quan hệ phi tuyến tính mạnh mẽ giữa hai biến
14. Phương pháp thống kê mô tả (descriptive statistics) chủ yếu tập trung vào việc:
A. Dự đoán giá trị của tổng thể dựa trên mẫu
B. Khái quát hóa kết quả nghiên cứu cho nhóm lớn hơn
C. Tóm tắt và trình bày dữ liệu một cách có ý nghĩa
D. Kiểm định các giả thuyết nghiên cứu
15. Biểu đồ hộp (boxplot) đặc biệt hữu ích trong việc:
A. So sánh trung bình của nhiều nhóm
B. Hiển thị tần số của các biến định tính
C. Xác định các giá trị ngoại lệ (outliers) trong dữ liệu
D. Mô tả xu hướng theo thời gian của dữ liệu
16. Mục đích chính của việc chuẩn hóa dữ liệu (data standardization) là:
A. Loại bỏ giá trị ngoại lệ
B. Chuyển đổi dữ liệu về thang đo chung để so sánh được
C. Đảm bảo dữ liệu tuân theo phân phối chuẩn
D. Tăng cỡ mẫu
17. Trong nghiên cứu khoa học xã hội, vấn đề đạo đức nào sau đây liên quan đến thống kê?
A. Lựa chọn phương pháp thống kê không phù hợp
B. Báo cáo kết quả thống kê một cách thiên vị hoặc sai lệch để ủng hộ một kết luận nhất định
C. Sử dụng cỡ mẫu quá nhỏ
D. Không kiểm tra giả định của các kiểm định thống kê
18. Sai số chọn mẫu (sampling error) phát sinh do:
A. Lỗi trong quá trình nhập liệu
B. Việc sử dụng mẫu thay vì toàn bộ tổng thể
C. Thiết kế nghiên cứu không phù hợp
D. Sự thiên vị của người nghiên cứu
19. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung vị
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Giá trị lớn nhất trừ giá trị nhỏ nhất của dữ liệu
D. Phần trăm dữ liệu nằm trong khoảng giữa hai giá trị cụ thể
20. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường:
A. Mức độ mạnh yếu của mối quan hệ phi tuyến tính giữa hai biến định lượng
B. Mức độ mạnh yếu và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Sự khác biệt về trung bình giữa hai nhóm
D. Tỷ lệ thay đổi của một biến khi biến kia thay đổi một đơn vị
21. Trong nghiên cứu định tính, thống kê có vai trò:
A. Thay thế hoàn toàn các phương pháp phân tích định tính
B. Không có vai trò gì vì chỉ tập trung vào số liệu
C. Hỗ trợ mô tả mẫu nghiên cứu và đôi khi định lượng hóa một số khía cạnh
D. Luôn là phương pháp phân tích chính và duy nhất
22. Phương pháp phân tích nhân tố (factor analysis) được sử dụng để:
A. Dự đoán giá trị của một biến dựa trên nhiều biến khác
B. Phân loại các đối tượng vào các nhóm khác nhau
C. Giảm số lượng biến bằng cách tìm ra các nhân tố tiềm ẩn
D. So sánh trung bình của nhiều nhóm
23. Trong phân tích dữ liệu định tính, phần mềm NVivo thường được sử dụng để:
A. Thực hiện các kiểm định thống kê phức tạp
B. Quản lý, mã hóa và phân tích dữ liệu văn bản và đa phương tiện
C. Vẽ các biểu đồ và đồ thị thống kê
D. Tính toán các thống kê mô tả
24. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến định lượng liên tục
B. Biến định lượng rời rạc
C. Biến định tính nhị phân (binary)
D. Biến định tính đa danh mục (categorical)
25. Vấn đề `đa cộng tuyến` (multicollinearity) trong hồi quy đa biến xảy ra khi:
A. Biến phụ thuộc không có phân phối chuẩn
B. Các biến độc lập có tương quan cao với nhau
C. Cỡ mẫu quá nhỏ so với số lượng biến độc lập
D. Mô hình hồi quy không phù hợp với dữ liệu
26. Kỹ thuật `bootstrap` trong thống kê phi tham số được sử dụng để:
A. Kiểm định giả thuyết về trung bình tổng thể
B. Ước lượng độ tin cậy của các ước lượng mẫu bằng cách lấy mẫu lại có hoàn lại từ mẫu gốc
C. Phân tích phương sai giữa các nhóm
D. Xác định giá trị ngoại lệ
27. Thang đo nào sau đây là thang đo định danh (nominal scale)?
A. Nhiệt độ (Celsius)
B. Thu nhập (VNĐ)
C. Giới tính (Nam, Nữ, Khác)
D. Mức độ hài lòng (Rất hài lòng, Hài lòng, Bình thường, Không hài lòng)
28. Trong nghiên cứu khoa học xã hội, biến số định lượng (quantitative variable) KHÔNG bao gồm loại nào sau đây?
A. Biến liên tục (continuous variable)
B. Biến rời rạc (discrete variable)
C. Biến thứ bậc (ordinal variable)
D. Biến tỷ lệ (ratio variable)
29. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để:
A. So sánh trung bình của hai nhóm độc lập
B. Kiểm tra sự phù hợp của phân phối dữ liệu quan sát với phân phối lý thuyết
C. Đo lường mối quan hệ tuyến tính giữa hai biến định lượng
D. Phân tích phương sai giữa các nhóm
30. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện:
A. Xác suất giả thuyết null là đúng
B. Mức độ quan trọng thực tiễn của kết quả nghiên cứu
C. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả quan sát được, giả sử giả thuyết null là đúng
D. Ngưỡng ý nghĩa thống kê (significance level) được chọn trước