1. Trong nghiên cứu khoa học xã hội, vấn đề `đa cộng tuyến` (multicollinearity) thường gặp trong:
A. Phân tích thống kê mô tả.
B. Phân tích hồi quy đa biến.
C. Kiểm định t-test.
D. Kiểm định Chi-bình phương.
2. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường mối quan hệ nào giữa hai biến định lượng?
A. Mối quan hệ phi tuyến tính.
B. Mối quan hệ nhân quả.
C. Mối quan hệ tuyến tính.
D. Mối quan hệ giữa biến định tính và định lượng.
3. Khi diễn giải hệ số hồi quy trong mô hình hồi quy tuyến tính, điều gì quan trọng cần lưu ý về mối quan hệ nhân quả?
A. Hệ số hồi quy luôn chỉ ra mối quan hệ nhân quả trực tiếp.
B. Hệ số hồi quy chỉ mô tả mối quan hệ liên kết, không nhất thiết là nhân quả.
C. Mối quan hệ nhân quả chỉ có thể được xác định nếu giá trị p nhỏ hơn 0.05.
D. Mối quan hệ nhân quả chỉ đúng nếu hệ số hồi quy dương.
4. Hạn chế chính của việc chỉ dựa vào ý nghĩa thống kê (p-value) trong nghiên cứu khoa học xã hội là gì?
A. Giá trị p không phản ánh kích thước hiệu ứng (effect size) hoặc ý nghĩa thực tế.
B. Giá trị p luôn bị ảnh hưởng bởi cỡ mẫu.
C. Giá trị p không phù hợp với dữ liệu định tính.
D. Giá trị p không thể tính toán được trong mọi trường hợp.
5. Giá trị trung vị (Median) phù hợp nhất để đo xu hướng trung tâm của dữ liệu nào?
A. Dữ liệu tuân theo phân phối chuẩn.
B. Dữ liệu có giá trị ngoại lệ (outliers).
C. Dữ liệu định danh.
D. Dữ liệu khoảng.
6. Giá trị ngoại lệ (outlier) trong dữ liệu có thể gây ảnh hưởng lớn đến:
A. Giá trị trung vị (median).
B. Khoảng tứ phân vị (interquartile range).
C. Giá trị trung bình (mean) và độ lệch chuẩn (standard deviation).
D. Tần số (mode).
7. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi cần độ chính xác cao nhất.
8. Khi nào thì việc sử dụng thống kê suy diễn (inferential statistics) là cần thiết trong nghiên cứu khoa học xã hội?
A. Khi muốn mô tả đặc điểm của mẫu nghiên cứu.
B. Khi muốn khái quát hóa kết quả từ mẫu lên tổng thể.
C. Khi chỉ có dữ liệu định tính.
D. Khi cỡ mẫu rất lớn.
9. Trong thống kê Bayes, `prior` (tiền nghiệm) đề cập đến:
A. Dữ liệu quan sát được.
B. Xác suất của giả thuyết sau khi quan sát dữ liệu.
C. Niềm tin ban đầu về giả thuyết trước khi quan sát dữ liệu.
D. Ngưỡng ý nghĩa thống kê.
10. Phương pháp nào sau đây thường được sử dụng để kiểm tra tính chuẩn (normality) của dữ liệu?
A. Kiểm định t-test.
B. Biểu đồ hộp (boxplot).
C. Biểu đồ tần suất (histogram) và kiểm định Shapiro-Wilk.
D. Phân tích hồi quy.
11. Phương pháp nào sau đây KHÔNG phù hợp để so sánh trung bình của hai nhóm độc lập?
A. Kiểm định t-test cho mẫu độc lập.
B. Kiểm định Mann-Whitney U (nếu không đáp ứng giả định tham số).
C. Phân tích phương sai (ANOVA) một yếu tố.
D. Phân tích tương quan (correlation analysis).
12. Trong bối cảnh thống kê, `phân phối` (distribution) đề cập đến:
A. Trung bình và độ lệch chuẩn của dữ liệu.
B. Cách thức các giá trị của một biến được phân bổ hoặc trải rộng.
C. Mẫu được lấy từ tổng thể như thế nào.
D. Mức độ tin cậy của kết quả thống kê.
13. Trong nghiên cứu khoa học xã hội, cỡ mẫu (sample size) càng lớn thì thường:
A. Sai số chuẩn càng lớn.
B. Khoảng tin cậy càng rộng.
C. Sức mạnh thống kê (statistical power) càng cao.
D. Giá trị p càng lớn.
14. Sai lầm Loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Chấp nhận giả thuyết rỗng khi nó thực sự sai.
B. Bác bỏ giả thuyết rỗng khi nó thực sự đúng.
C. Không bác bỏ giả thuyết rỗng khi nó thực sự sai.
D. Bác bỏ giả thuyết rỗng khi nó thực sự đúng và có ý nghĩa thực tiễn.
15. Trong kiểm định giả thuyết, `giá trị p` (p-value) thể hiện điều gì?
A. Xác suất giả thuyết rỗng là đúng.
B. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết rỗng là đúng.
C. Mức độ quan trọng thực tế của kết quả.
D. Ngưỡng ý nghĩa thống kê.
16. Phương pháp thống kê nào phù hợp để phân tích mối quan hệ giữa hai biến định tính?
A. Phân tích hồi quy tuyến tính.
B. Kiểm định t-test.
C. Kiểm định Chi-bình phương (Chi-square test).
D. Phân tích phương sai (ANOVA).
17. Phân tích hồi quy tuyến tính (Linear Regression) được sử dụng để:
A. Mô tả phân phối của một biến.
B. Ước tính giá trị của biến phụ thuộc dựa trên biến độc lập.
C. So sánh trung bình của hai nhóm.
D. Xác định mối quan hệ nhân quả trực tiếp.
18. Phương pháp nào sau đây KHÔNG phải là phương pháp lấy mẫu ngẫu nhiên?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu thuận tiện.
19. Khoảng tin cậy (Confidence Interval) 95% có nghĩa là:
A. 95% dữ liệu nằm trong khoảng này.
B. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
C. Có 95% khả năng trung bình tổng thể nằm trong khoảng này.
D. Khoảng này chứa 95% các giá trị có thể của thống kê mẫu.
20. Trong phân tích phương sai (ANOVA), giả thuyết rỗng thường là:
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trung bình của nhóm khác với các nhóm khác.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai giữa các nhóm lớn hơn phương sai trong nhóm.
21. Độ lệch chuẩn (Standard Deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mức độ tin cậy của ước lượng.
22. Phương pháp nào sau đây giúp giảm thiểu ảnh hưởng của biến nhiễu (confounding variable) trong nghiên cứu?
A. Thống kê mô tả.
B. Lấy mẫu ngẫu nhiên và thiết kế nghiên cứu chặt chẽ.
C. Tăng cỡ mẫu một cách tùy tiện.
D. Chỉ sử dụng thống kê suy diễn.
23. Sai số chuẩn (Standard Error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của mẫu.
B. Độ lệch chuẩn của tổng thể.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Khoảng tin cậy của trung bình mẫu.
24. Trong phân tích nội dung định lượng (quantitative content analysis), thống kê được sử dụng để:
A. Diễn giải ý nghĩa sâu sắc của văn bản.
B. Phân loại và mã hóa dữ liệu văn bản.
C. Tóm tắt và phân tích tần suất xuất hiện của các chủ đề hoặc mã hóa.
D. Xây dựng lý thuyết từ dữ liệu văn bản.
25. Trong nghiên cứu khoa học xã hội, `hiệu ứng cỡ mẫu` (sample size effect) đề cập đến:
A. Ảnh hưởng của phương pháp lấy mẫu đến kết quả.
B. Ảnh hưởng của kích thước mẫu đến ý nghĩa thống kê của kết quả.
C. Ảnh hưởng của giá trị ngoại lệ trong mẫu.
D. Ảnh hưởng của sai số đo lường.
26. Ý nghĩa thống kê (Statistical significance) có nghĩa là:
A. Kết quả nghiên cứu có ý nghĩa quan trọng trong thực tế.
B. Kết quả nghiên cứu có khả năng xảy ra do yếu tố ngẫu nhiên rất thấp.
C. Kích thước mẫu đủ lớn.
D. Phương pháp nghiên cứu được thiết kế tốt.
27. Thống kê mô tả trong khoa học xã hội chủ yếu được sử dụng để:
A. Đưa ra dự đoán về tương lai.
B. Mô tả và tóm tắt dữ liệu.
C. Kiểm định các giả thuyết phức tạp.
D. Xây dựng mô hình toán học.
28. Loại thang đo nào sau đây cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Thang đo định danh (Nominal).
B. Thang đo thứ bậc (Ordinal).
C. Thang đo khoảng (Interval).
D. Thang đo tỷ lệ (Ratio).
29. Khi báo cáo kết quả nghiên cứu định lượng, điều quan trọng là phải:
A. Chỉ tập trung vào các kết quả có ý nghĩa thống kê.
B. Bỏ qua các hạn chế của nghiên cứu.
C. Trình bày đầy đủ thông tin về phương pháp, kết quả và thảo luận về ý nghĩa thực tế cùng hạn chế.
D. Chỉ trình bày kết quả dưới dạng bảng và biểu đồ.
30. Khi thực hiện phân tích đa biến (multivariate analysis), điều gì cần được xem xét đặc biệt?
A. Chỉ tập trung vào mối quan hệ giữa hai biến chính.
B. Sự tương tác và mối quan hệ phức tạp giữa nhiều biến.
C. Giả định rằng các biến độc lập không liên quan đến nhau.
D. Sử dụng các phương pháp thống kê đơn biến cho từng biến riêng lẻ.