1. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích mối quan hệ giữa hai biến định lượng.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi dự đoán giá trị của biến liên tục.
2. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị trung bình của biến phụ thuộc.
C. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
D. Mức độ phù hợp của mô hình hồi quy.
3. Khi so sánh hai nhóm độc lập về một biến định lượng, kiểm định thống kê nào sau đây thường được sử dụng nếu dữ liệu tuân theo phân phối chuẩn và phương sai bằng nhau?
A. Kiểm định Chi-bình phương.
B. Kiểm định t độc lập (Independent t-test).
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
4. Giá trị trung vị (Median) phù hợp nhất để đo xu hướng trung tâm khi dữ liệu bị ảnh hưởng bởi:
A. Giá trị ngoại lệ (Outliers).
B. Phân phối chuẩn (Normal distribution).
C. Dữ liệu định danh (Nominal data).
D. Mẫu kích thước lớn.
5. Loại thang đo nào sau đây cho phép xác định thứ hạng và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Thang đo danh nghĩa (Nominal)
B. Thang đo thứ bậc (Ordinal)
C. Thang đo khoảng (Interval)
D. Thang đo tỷ lệ (Ratio)
6. Thang đo Likert thường được sử dụng trong khoa học xã hội thuộc loại thang đo nào?
A. Danh nghĩa (Nominal).
B. Thứ bậc (Ordinal).
C. Khoảng (Interval).
D. Tỷ lệ (Ratio).
7. Loại thống kê nào tập trung vào việc khám phá các mẫu và mối quan hệ trong dữ liệu mà không kiểm định giả thuyết cụ thể?
A. Thống kê suy diễn.
B. Thống kê mô tả.
C. Thống kê khám phá (Exploratory statistics).
D. Thống kê tham số.
8. Độ lệch chuẩn (Standard deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
9. Phương pháp thống kê nào cho phép kiểm soát ảnh hưởng của biến nhiễu (confounding variable) khi nghiên cứu mối quan hệ giữa hai biến khác?
A. Tương quan (Correlation).
B. Hồi quy đa biến (Multiple regression).
C. Kiểm định t (t-test).
D. Thống kê mô tả (Descriptive statistics).
10. Biểu đồ phân tán (scatter plot) được sử dụng để:
A. Hiển thị phân phối tần số của một biến.
B. So sánh trung bình giữa các nhóm.
C. Khám phá mối quan hệ giữa hai biến định lượng.
D. Hiển thị dữ liệu theo thời gian.
11. Phương pháp thống kê nào thường được sử dụng để phân tích dữ liệu bảng (panel data) trong nghiên cứu khoa học xã hội?
A. Hồi quy tuyến tính đơn.
B. Phân tích phương sai (ANOVA).
C. Mô hình tác động cố định (Fixed effects model) hoặc tác động ngẫu nhiên (Random effects model).
D. Kiểm định Chi-bình phương.
12. Trong kiểm định giả thuyết, `giá trị p` (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả như hiện tại hoặc cực đoan hơn, giả định giả thuyết null là đúng.
C. Ngưỡng ý nghĩa thống kê được chọn trước.
D. Sai số loại I.
13. Biểu đồ hộp (boxplot) thích hợp nhất để:
A. Hiển thị tần số của các biến định tính.
B. So sánh phân phối của một biến định lượng giữa các nhóm.
C. Hiển thị mối quan hệ giữa hai biến định lượng.
D. Theo dõi sự thay đổi của một biến theo thời gian.
14. Phân tích phương sai (ANOVA) được sử dụng để:
A. Kiểm tra mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm độc lập.
C. So sánh trung bình của ba nhóm trở lên.
D. Dự đoán giá trị của một biến dựa trên biến khác.
15. Trong nghiên cứu khoa học xã hội, `tính giá trị` (validity) của một nghiên cứu đề cập đến điều gì?
A. Tính nhất quán của kết quả nghiên cứu.
B. Mức độ nghiên cứu thực sự đo lường những gì nó được thiết kế để đo lường.
C. Khả năng lặp lại nghiên cứu bởi các nhà nghiên cứu khác.
D. Tính kịp thời và phù hợp của nghiên cứu với vấn đề hiện tại.
16. Trong bối cảnh thống kê, `độ tin cậy` (reliability) của một công cụ đo lường đề cập đến điều gì?
A. Mức độ công cụ đo lường thực sự đo lường khái niệm mong muốn.
B. Tính nhất quán và ổn định của phép đo qua thời gian hoặc các lần đo khác nhau.
C. Khả năng khái quát hóa kết quả nghiên cứu cho tổng thể.
D. Tính dễ dàng sử dụng và thực hiện của công cụ đo lường.
17. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ phụ thuộc giữa hai biến định tính.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Tỷ lệ phương sai được giải thích bởi mô hình hồi quy.
18. Trong thống kê Bayes, khái niệm `prior probability` (xác suất tiên nghiệm) đề cập đến điều gì?
A. Xác suất của dữ liệu được quan sát.
B. Xác suất của giả thuyết sau khi xem xét dữ liệu.
C. Xác suất ban đầu của giả thuyết trước khi xem xét dữ liệu.
D. Xác suất của sự kiện ngẫu nhiên.
19. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện cho tổng thể.
D. Tính toán sai giá trị p.
20. Sai số chuẩn của trung bình (Standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của mẫu.
B. Độ lệch chuẩn của tổng thể.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số ngẫu nhiên trong dữ liệu.
21. Khi báo cáo kết quả kiểm định giả thuyết, ngưỡng ý nghĩa thống kê (alpha) thường được đặt ở mức bao nhiêu trong khoa học xã hội?
A. 0.1.
B. 0.05.
C. 0.10.
D. 0.50.
22. Phân phối chuẩn (Normal distribution) có đặc điểm nào sau đây?
A. Bất đối xứng.
B. Có hai đỉnh.
C. Đối xứng và hình chuông.
D. Dữ liệu phân tán đều.
23. Thống kê mô tả được sử dụng chủ yếu để:
A. Đưa ra kết luận về tổng thể dựa trên mẫu.
B. Tóm tắt và mô tả các đặc điểm chính của một tập dữ liệu.
C. Kiểm định các giả thuyết về mối quan hệ giữa các biến.
D. Dự đoán giá trị tương lai của một biến.
24. Phương pháp thống kê nào phù hợp để phân tích mối quan hệ giữa nhiều biến độc lập định lượng và một biến phụ thuộc định lượng?
A. Tương quan Pearson.
B. Kiểm định t.
C. Hồi quy đa tuyến tính (Multiple linear regression).
D. Kiểm định Chi-bình phương.
25. Khi nào thì giá trị trung bình (Mean) và giá trị trung vị (Median) gần bằng nhau?
A. Khi dữ liệu có nhiều giá trị ngoại lệ.
B. Khi phân phối dữ liệu lệch trái.
C. Khi phân phối dữ liệu đối xứng.
D. Khi dữ liệu là định tính.
26. Trong thống kê suy diễn, mục tiêu chính là:
A. Mô tả dữ liệu một cách chi tiết nhất có thể.
B. Rút ra kết luận về tổng thể dựa trên thông tin từ mẫu.
C. Trình bày dữ liệu một cách trực quan.
D. Đảm bảo tính chính xác tuyệt đối của dữ liệu.
27. Phương pháp lấy mẫu nào đảm bảo mỗi cá thể trong tổng thể đều có cơ hội được chọn vào mẫu và các nhóm cá thể có cơ hội chọn bằng nhau?
A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
C. Lấy mẫu phân tầng (Stratified sampling).
D. Lấy mẫu cụm (Cluster sampling).
28. Phương pháp nào sau đây giúp giảm thiểu sai số lấy mẫu (sampling error)?
A. Lấy mẫu thuận tiện.
B. Tăng kích thước mẫu.
C. Giảm kích thước mẫu.
D. Sử dụng thống kê mô tả.
29. Khi nào thì nên sử dụng thống kê phi tham số (non-parametric statistics) thay vì thống kê tham số (parametric statistics)?
A. Khi cỡ mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc thang đo thứ bậc/danh nghĩa.
D. Khi cần tính toán trung bình và độ lệch chuẩn.
30. Ưu điểm chính của việc sử dụng cỡ mẫu lớn trong nghiên cứu thống kê là gì?
A. Giảm sai số hệ thống.
B. Tăng tính đại diện của mẫu cho tổng thể.
C. Đơn giản hóa quá trình thu thập dữ liệu.
D. Đảm bảo kết quả luôn có ý nghĩa thống kê.