1. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị:
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả biến độc lập bằng 0.
C. Mức độ biến thiên của biến phụ thuộc.
D. Mức độ phù hợp của mô hình hồi quy.
2. Phương pháp nào sau đây KHÔNG thuộc thống kê suy luận?
A. Kiểm định giả thuyết.
B. Ước lượng khoảng tin cậy.
C. Tính trung bình và độ lệch chuẩn.
D. Hồi quy tuyến tính.
3. Khi nào thì nên sử dụng thống kê phi tham số (non-parametric statistics) thay vì thống kê tham số (parametric statistics)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của thống kê tham số không được đáp ứng (ví dụ, dữ liệu không phân phối chuẩn hoặc kích thước mẫu nhỏ).
D. Khi muốn tính toán trung bình và độ lệch chuẩn.
4. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Vị trí trung tâm của dữ liệu.
D. Mức độ lệch của phân phối dữ liệu.
5. Chọn phát biểu SAI về thống kê trong khoa học xã hội.
A. Thống kê giúp hiểu rõ hơn về các hiện tượng xã hội.
B. Thống kê có thể được sử dụng để kiểm tra các lý thuyết xã hội.
C. Thống kê luôn chứng minh được mối quan hệ nhân quả.
D. Thống kê hỗ trợ việc đưa ra quyết định dựa trên bằng chứng.
6. Phân phối chuẩn (normal distribution) có đặc điểm nào sau đây?
A. Lệch trái.
B. Lệch phải.
C. Đối xứng và hình chuông.
D. Đa đỉnh.
7. Chọn phát biểu ĐÚNG về mối quan hệ giữa kích thước mẫu và sai số chuẩn (standard error).
A. Kích thước mẫu càng lớn, sai số chuẩn càng lớn.
B. Kích thước mẫu càng nhỏ, sai số chuẩn càng nhỏ.
C. Kích thước mẫu càng lớn, sai số chuẩn càng nhỏ.
D. Kích thước mẫu không ảnh hưởng đến sai số chuẩn.
8. Loại biến số nào sau đây là biến định tính?
A. Thu nhập hàng tháng.
B. Điểm kiểm tra.
C. Giới tính.
D. Chiều cao.
9. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật lấy mẫu ngẫu nhiên?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu thuận tiện.
10. Phân tích phương sai (ANOVA) được sử dụng để:
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.
11. Ý nghĩa thực tế (practical significance) khác với ý nghĩa thống kê (statistical significance) ở điểm nào?
A. Ý nghĩa thực tế liên quan đến giá trị p, còn ý nghĩa thống kê liên quan đến độ lớn của hiệu ứng.
B. Ý nghĩa thống kê liên quan đến giá trị p, còn ý nghĩa thực tế liên quan đến tầm quan trọng hoặc ảnh hưởng của kết quả trong thực tế.
C. Ý nghĩa thực tế chỉ áp dụng cho nghiên cứu định tính, còn ý nghĩa thống kê cho nghiên cứu định lượng.
D. Ý nghĩa thống kê luôn quan trọng hơn ý nghĩa thực tế.
12. Trong phân tích dữ liệu định tính, phần mềm hỗ trợ (ví dụ, NVivo, Atlas.ti) chủ yếu giúp:
A. Thực hiện các phép kiểm định thống kê phức tạp.
B. Mã hóa, quản lý và phân tích dữ liệu văn bản, hình ảnh hoặc video.
C. Tự động tạo ra báo cáo kết quả nghiên cứu.
D. Thu thập dữ liệu trực tuyến từ mạng xã hội.
13. Ý nghĩa thống kê (statistical significance) có nghĩa là:
A. Kết quả nghiên cứu có tầm quan trọng thực tế lớn.
B. Kết quả nghiên cứu chắc chắn đúng.
C. Kết quả nghiên cứu ít có khả năng xảy ra do ngẫu nhiên.
D. Kết quả nghiên cứu có thể khái quát hóa cho mọi quần thể.
14. Khi báo cáo kết quả nghiên cứu định lượng, phần nào thường chứa các thống kê mô tả?
A. Phần thảo luận.
B. Phần phương pháp.
C. Phần kết quả.
D. Phần giới thiệu.
15. Kỹ thuật `bootstrap` trong thống kê được sử dụng chủ yếu để:
A. Giảm kích thước mẫu cần thiết cho nghiên cứu.
B. Ước lượng sai số chuẩn và khoảng tin cậy khi các giả định tham số không được đáp ứng.
C. Phát hiện các giá trị ngoại lệ trong dữ liệu.
D. Tăng cường tính giá trị của công cụ đo lường.
16. Phương pháp nào sau đây thường được sử dụng để giảm thiểu sai số do yếu tố gây nhiễu (confounding variables) trong nghiên cứu quan sát?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Thực hiện nghiên cứu thực nghiệm.
C. Sử dụng phân tích hồi quy đa biến để kiểm soát các biến gây nhiễu.
D. Tăng kích thước mẫu.
17. Thống kê mô tả trong khoa học xã hội chủ yếu tập trung vào:
A. Dự đoán xu hướng tương lai.
B. Mô tả và tóm tắt dữ liệu.
C. Kiểm định giả thuyết về mối quan hệ nhân quả.
D. Xây dựng mô hình lý thuyết phức tạp.
18. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện:
A. Xác suất giả thuyết đối (alternative hypothesis) là đúng.
B. Xác suất giả thuyết không (null hypothesis) là đúng.
C. Xác suất quan sát được kết quả hiện tại hoặc kết quả cực đoan hơn nếu giả thuyết không là đúng.
D. Mức độ ý nghĩa thực tế của kết quả.
19. Biểu đồ hộp (boxplot) thích hợp nhất để:
A. Hiển thị phân phối tần số của biến định tính.
B. So sánh trung bình của nhiều nhóm.
C. Hiển thị phân phối và các giá trị ngoại lệ (outliers) của biến định lượng.
D. Thể hiện mối quan hệ giữa hai biến định lượng.
20. Loại biểu đồ nào phù hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ đường.
B. Biểu đồ tròn.
C. Biểu đồ histogram hoặc biểu đồ hộp song song.
D. Biểu đồ phân tán.
21. Chọn phát biểu ĐÚNG về mối quan hệ giữa độ tin cậy (reliability) và tính giá trị (validity) của một công cụ đo lường.
A. Một công cụ đo lường có giá trị chắc chắn cũng có độ tin cậy.
B. Một công cụ đo lường có độ tin cậy chắc chắn cũng có giá trị.
C. Một công cụ đo lường có thể có độ tin cậy cao nhưng không có giá trị.
D. Độ tin cậy và tính giá trị là hai khái niệm hoàn toàn độc lập.
22. Khi nào thì nên sử dụng thang đo Likert?
A. Khi đo lường các đặc điểm nhân khẩu học như tuổi và giới tính.
B. Khi đo lường thái độ, ý kiến hoặc mức độ đồng ý với một phát biểu.
C. Khi đo lường các hành vi quan sát được.
D. Khi thu thập dữ liệu định lượng về thu nhập và chi tiêu.
23. Phương pháp nào sau đây phù hợp nhất để phân tích mối quan hệ giữa hai biến định tính?
A. Hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương.
D. Tương quan Pearson.
24. Trong nghiên cứu khoa học xã hội, khái niệm `tính giá trị` (validity) đề cập đến:
A. Mức độ nhất quán của kết quả đo lường theo thời gian.
B. Mức độ mà một công cụ đo lường thực sự đo lường được khái niệm mà nó được thiết kế để đo lường.
C. Mức độ mà kết quả nghiên cứu có thể khái quát hóa cho các quần thể khác.
D. Mức độ dễ dàng và tiết kiệm chi phí khi thu thập dữ liệu.
25. Hệ số tương quan Pearson đo lường điều gì?
A. Sức mạnh của mối quan hệ nhân quả giữa hai biến.
B. Mức độ phù hợp của mô hình hồi quy tuyến tính.
C. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
D. Sự khác biệt trung bình giữa hai nhóm.
26. Trong nghiên cứu khoa học xã hội, vấn đề đạo đức nào quan trọng nhất khi thu thập dữ liệu?
A. Đảm bảo kích thước mẫu đủ lớn.
B. Bảo vệ quyền riêng tư và tính bảo mật của người tham gia.
C. Sử dụng phương pháp thống kê phức tạp nhất.
D. Công bố kết quả nghiên cứu nhanh chóng.
27. Khi nào thì sử dụng kiểm định t (t-test) cặp đôi (paired t-test)?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của ba nhóm trở lên.
C. Khi so sánh trung bình của cùng một nhóm trước và sau can thiệp.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
28. Trong kiểm định giả thuyết một đuôi (one-tailed test), giả thuyết đối (alternative hypothesis) chỉ định:
A. Sự khác biệt theo bất kỳ hướng nào.
B. Sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
C. Không có sự khác biệt.
D. Sự khác biệt là không đáng kể về mặt thống kê.
29. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết không khi nó thực sự sai.
B. Không bác bỏ giả thuyết không khi nó thực sự đúng.
C. Bác bỏ giả thuyết không khi nó thực sự đúng.
D. Không bác bỏ giả thuyết không khi nó thực sự sai.
30. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến:
A. Mối quan hệ phi tuyến tính giữa biến độc lập và biến phụ thuộc.
B. Mối tương quan cao giữa các biến độc lập.
C. Phương sai của sai số thay đổi không đồng đều.
D. Phân phối của sai số không chuẩn.