1. Độ lệch chuẩn (standard deviation) đo lường:
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
D. Vị trí trung tâm của dữ liệu khi sắp xếp theo thứ tự.
2. Khái niệm `cỡ mẫu đủ lớn` trong thống kê suy diễn phụ thuộc vào yếu tố nào quan trọng nhất?
A. Tổng kích thước của tổng thể nghiên cứu.
B. Độ tin cậy mong muốn và kích thước hiệu ứng dự kiến.
C. Số lượng biến trong nghiên cứu.
D. Ngân sách và thời gian cho nghiên cứu.
3. Mục đích chính của việc sử dụng thống kê suy diễn (inferential statistics) là:
A. Mô tả dữ liệu mẫu một cách chi tiết.
B. Khái quát hóa kết quả từ mẫu lên tổng thể.
C. Sắp xếp và trình bày dữ liệu một cách trực quan.
D. Tính toán các chỉ số thống kê mô tả.
4. Phương pháp chọn mẫu ngẫu nhiên phân tầng (stratified random sampling) đặc biệt hữu ích khi:
A. Tổng thể nghiên cứu rất nhỏ.
B. Các nhóm (strata) trong tổng thể có phương sai rất khác nhau.
C. Chi phí thu thập dữ liệu rất thấp.
D. Mục tiêu nghiên cứu là mô tả đặc điểm của toàn bộ tổng thể một cách nhanh chóng.
5. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở:
A. Cả hai phía của phân phối lấy mẫu.
B. Một phía của phân phối lấy mẫu, tùy thuộc vào hướng của giả thuyết đối.
C. Chính giữa của phân phối lấy mẫu.
D. Bên ngoài khoảng tin cậy.
6. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ phụ thuộc lẫn nhau giữa hai biến định tính.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Tỷ lệ biến thiên được giải thích bởi mô hình hồi quy.
7. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến:
A. Mối quan hệ phi tuyến tính giữa các biến.
B. Sự tương quan cao giữa các biến độc lập.
C. Sự phân tán của phần dư (residuals) không đồng đều.
D. Số lượng biến độc lập quá ít so với số lượng quan sát.
8. Phương pháp `Bootstrap` trong thống kê được sử dụng chủ yếu để:
A. Kiểm định giả thuyết về trung bình tổng thể.
B. Ước lượng độ tin cậy của các ước lượng thống kê (ví dụ: sai số chuẩn, khoảng tin cậy) khi không có giả định phân phối.
C. Phân tích phương sai cho dữ liệu không tuân theo phân phối chuẩn.
D. Xây dựng mô hình hồi quy tuyến tính khi có đa cộng tuyến.
9. Khi trình bày kết quả thống kê mô tả, thông tin nào sau đây KHÔNG cần thiết phải bao gồm?
A. Cỡ mẫu (sample size).
B. Giá trị trung bình (mean) và độ lệch chuẩn (standard deviation).
C. Giá trị p (p-value) của kiểm định giả thuyết.
D. Trung vị (median) và khoảng tứ phân vị (interquartile range) nếu dữ liệu không phân phối chuẩn.
10. Phân tích trung gian (mediation analysis) trong khoa học xã hội nhằm mục đích:
A. Xác định mối quan hệ nhân quả trực tiếp giữa biến độc lập và biến phụ thuộc.
B. Kiểm tra xem một biến trung gian giải thích như thế nào mối quan hệ giữa biến độc lập và biến phụ thuộc.
C. Đo lường mức độ tương quan giữa nhiều biến.
D. Phân loại các đối tượng nghiên cứu vào các nhóm khác nhau.
11. Sai số chuẩn của trung bình (standard error of the mean) giảm khi:
A. Độ lệch chuẩn của tổng thể tăng.
B. Cỡ mẫu (sample size) tăng.
C. Giá trị trung bình của mẫu tăng.
D. Phương sai của tổng thể giảm.
12. Một nhà nghiên cứu muốn khảo sát ý kiến của sinh viên về chất lượng dịch vụ thư viện trong trường đại học. Phương pháp chọn mẫu nào sau đây có thể dẫn đến sai lệch chọn mẫu (sampling bias) cao nhất?
A. Chọn mẫu ngẫu nhiên đơn giản từ danh sách sinh viên.
B. Chọn mẫu phân tầng theo khoa và năm học.
C. Chọn mẫu cụm, chọn ngẫu nhiên một số lớp học và khảo sát tất cả sinh viên trong lớp đó.
D. Chọn mẫu thuận tiện, phỏng vấn sinh viên tại cửa thư viện vào giờ cao điểm.
13. Loại thang đo nào sau đây cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Thang đo danh nghĩa (Nominal).
B. Thang đo thứ bậc (Ordinal).
C. Thang đo khoảng (Interval).
D. Thang đo tỷ lệ (Ratio).
14. Khi nào thì việc sử dụng thống kê phi tham số (non-parametric statistics) được ưu tiên hơn thống kê tham số (parametric statistics)?
A. Khi dữ liệu có phân phối chuẩn (normal distribution).
B. Khi cỡ mẫu lớn (n > 30).
C. Khi các giả định của thống kê tham số không được đáp ứng (ví dụ: dữ liệu không phân phối chuẩn hoặc cỡ mẫu nhỏ).
D. Khi muốn tính toán khoảng tin cậy.
15. Để kiểm tra giả thuyết về sự khác biệt trung bình giữa hai nhóm phụ thuộc (ví dụ: đo lường trước và sau can thiệp trên cùng một nhóm đối tượng), phương pháp nào phù hợp?
A. T-test độc lập (Independent t-test).
B. T-test cặp đôi (Paired t-test).
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính (Linear Regression).
16. Sai số loại II (Type II error) trong kiểm định giả thuyết thống kê xảy ra khi:
A. Bác bỏ giả thuyết không (null hypothesis) khi nó thực sự đúng.
B. Không bác bỏ giả thuyết không khi nó thực sự sai.
C. Chọn mẫu không đại diện cho tổng thể.
D. Tính toán sai giá trị p (p-value).
17. Phương pháp thống kê nào sau đây phù hợp nhất để kiểm tra mối quan hệ giữa hai biến định tính?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính (Linear Regression).
C. Kiểm định Chi-bình phương (Chi-square test).
D. T-test độc lập (Independent t-test).
18. Thống kê mô tả trong khoa học xã hội chủ yếu tập trung vào:
A. Đưa ra dự đoán về tổng thể dựa trên mẫu.
B. Tóm tắt và mô tả các đặc điểm chính của dữ liệu.
C. Kiểm định các giả thuyết về mối quan hệ nhân quả.
D. Xây dựng mô hình toán học phức tạp cho dữ liệu.
19. Biểu đồ hộp (boxplot) chủ yếu được sử dụng để:
A. Thể hiện tần số của các giá trị trong dữ liệu.
B. So sánh phân phối của hai biến định lượng.
C. Mô tả phân phối và phát hiện giá trị ngoại lệ trong một biến định lượng.
D. Thể hiện mối quan hệ tuyến tính giữa hai biến.
20. Một nghiên cứu báo cáo kết quả kiểm định t-test độc lập với p = 0.08. Điều này có nghĩa là:
A. Có sự khác biệt có ý nghĩa thống kê giữa hai nhóm ở mức ý nghĩa 0.05.
B. Không có đủ bằng chứng để bác bỏ giả thuyết không về sự không khác biệt giữa hai nhóm ở mức ý nghĩa 0.05.
C. Kích thước hiệu ứng của sự khác biệt giữa hai nhóm là lớn.
D. Mẫu nghiên cứu không đủ lớn để đưa ra kết luận.
21. Trong nghiên cứu khoa học xã hội, tính giá trị (validity) của một đo lường đề cập đến:
A. Mức độ đo lường nhất quán qua thời gian.
B. Mức độ đo lường thực sự đo lường được khái niệm mà nó được thiết kế để đo lường.
C. Mức độ dễ dàng thực hiện đo lường trong thực tế.
D. Mức độ mẫu nghiên cứu đại diện cho tổng thể.
22. Phân tích phương sai (ANOVA) được sử dụng để:
A. Kiểm tra mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm độc lập.
C. So sánh trung bình của ba nhóm trở lên.
D. Dự đoán giá trị của một biến dựa trên biến khác.
23. Khi báo cáo kết quả nghiên cứu thống kê, độ tin cậy (reliability) của kết quả đo lường thường được đánh giá thông qua:
A. Giá trị p (p-value).
B. Khoảng tin cậy (confidence interval).
C. Hệ số Cronbach`s alpha hoặc test-retest reliability.
D. Hệ số tương quan Pearson (Pearson correlation coefficient).
24. Trong nghiên cứu khoa học xã hội, vấn đề đạo đức nào cần được quan tâm hàng đầu khi thu thập và phân tích dữ liệu thống kê?
A. Sử dụng phần mềm thống kê phù hợp.
B. Đảm bảo tính bảo mật và ẩn danh của người tham gia.
C. Trình bày kết quả một cách hấp dẫn.
D. Thu thập dữ liệu với chi phí thấp nhất.
25. Trong phân tích hồi quy tuyến tính, hệ số hồi quy (regression coefficient) cho biết:
A. Mức độ phù hợp của mô hình với dữ liệu.
B. Độ mạnh của mối quan hệ giữa các biến độc lập.
C. Mức thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị, giữ các biến khác không đổi.
D. Sai số chuẩn của các ước lượng hệ số.
26. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện:
A. Xác suất giả thuyết không (null hypothesis) là đúng.
B. Xác suất quan sát được kết quả hiện tại (hoặc cực đoan hơn) nếu giả thuyết không là đúng.
C. Mức độ quan trọng thực tế của kết quả nghiên cứu.
D. Ngưỡng ý nghĩa thống kê được đặt ra trước khi kiểm định.
27. Trong nghiên cứu định lượng, biến số độc lập (independent variable) thường được hiểu là:
A. Biến số được đo lường để xem xét sự thay đổi.
B. Biến số được cho là gây ra hoặc ảnh hưởng đến biến số khác.
C. Biến số không thay đổi trong suốt quá trình nghiên cứu.
D. Biến số chỉ có thể nhận hai giá trị (ví dụ: có/không).
28. Trong nghiên cứu khoa học xã hội, việc sử dụng thống kê có thể giúp:
A. Chứng minh một cách tuyệt đối tính đúng đắn của một lý thuyết.
B. Đưa ra bằng chứng khách quan và định lượng để hỗ trợ hoặc bác bỏ các giả thuyết.
C. Thay thế hoàn toàn các phương pháp nghiên cứu định tính.
D. Loại bỏ mọi yếu tố chủ quan trong quá trình nghiên cứu.
29. Trong ngữ cảnh thống kê, `ngoại suy` (extrapolation) có nghĩa là:
A. Ước lượng giá trị bên trong phạm vi dữ liệu quan sát được.
B. Ước lượng giá trị bên ngoài phạm vi dữ liệu quan sát được.
C. Loại bỏ các giá trị ngoại lệ khỏi dữ liệu.
D. Chuyển đổi dữ liệu sang dạng phù hợp hơn cho phân tích.
30. Khi nào thì trung vị (median) là thước đo xu hướng trung tâm phù hợp hơn so với trung bình (mean)?
A. Khi dữ liệu có phân phối chuẩn (normal distribution).
B. Khi dữ liệu có giá trị ngoại lệ (outliers) đáng kể.
C. Khi muốn tính tổng tất cả các giá trị dữ liệu.
D. Khi dữ liệu được thu thập từ mẫu ngẫu nhiên đơn giản.