1. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không đúng là đúng.
B. Xác suất dữ liệu quan sát được hoặc dữ liệu cực đoan hơn xảy ra nếu giả thuyết không đúng.
C. Xác suất giả thuyết không đúng là sai.
D. Xác suất dữ liệu quan sát được là do ngẫu nhiên.
2. Giá trị `phương sai` (variance) là bình phương của đại lượng nào?
A. Trung bình.
B. Trung vị.
C. Độ lệch chuẩn.
D. Sai số chuẩn.
3. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Đo lường mối quan hệ giữa hai biến định lượng.
B. Kiểm tra sự khác biệt giữa trung bình của hai nhóm.
C. Kiểm tra sự khác biệt giữa trung bình của ba nhóm trở lên.
D. Dự đoán giá trị của một biến phụ thuộc dựa trên biến độc lập.
4. Mục đích của việc chuẩn hóa dữ liệu (standardization) trong thống kê là gì?
A. Để làm cho dữ liệu dễ hiểu hơn.
B. Để loại bỏ giá trị ngoại lệ.
C. Để đưa các biến có thang đo khác nhau về cùng một thang đo, giúp so sánh và phân tích dễ dàng hơn.
D. Để chuyển dữ liệu định tính thành dữ liệu định lượng.
5. Loại thang đo nào sau đây cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Định danh (Nominal).
B. Thứ bậc (Ordinal).
C. Khoảng (Interval).
D. Tỷ lệ (Ratio).
6. Trong nghiên cứu khoa học xã hội, `tính giá trị nội tại` (internal validity) đề cập đến:
A. Khả năng tổng quát hóa kết quả nghiên cứu ra ngoài mẫu.
B. Mức độ đo lường chính xác khái niệm nghiên cứu.
C. Mức độ chắc chắn rằng mối quan hệ nhân quả quan sát được là thực sự và không bị gây nhiễu bởi các yếu tố khác.
D. Tính nhất quán của kết quả nghiên cứu khi lặp lại.
7. Lỗi Loại II (Type II error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Không bác bỏ giả thuyết không khi nó thực sự sai.
C. Chọn mẫu không đại diện.
D. Tính toán sai giá trị p.
8. Khi thực hiện kiểm định t độc lập (independent t-test), giả định quan trọng nhất là gì?
A. Kích thước mẫu lớn hơn 30.
B. Các nhóm độc lập và phương sai bằng nhau.
C. Dữ liệu phải là biến định tính.
D. Không có giá trị ngoại lệ trong dữ liệu.
9. Trong nghiên cứu khoa học xã hội, `tính giá trị bên ngoài` (external validity) đề cập đến:
A. Độ chính xác của phép đo.
B. Tính nhất quán của kết quả nghiên cứu.
C. Khả năng tổng quát hóa kết quả nghiên cứu đến các đối tượng, bối cảnh hoặc thời gian khác.
D. Mức độ tin cậy của nguồn dữ liệu.
10. Giá trị trung vị (median) phù hợp nhất để đo lường xu hướng trung tâm khi dữ liệu bị:
A. Phân phối chuẩn.
B. Không có giá trị ngoại lệ.
C. Lệch (skewed) hoặc có giá trị ngoại lệ.
D. Có phương sai nhỏ.
11. Trong phân tích hồi quy logistic, biến phụ thuộc thuộc loại nào?
A. Định lượng liên tục.
B. Định lượng rời rạc.
C. Định tính nhị phân (binary).
D. Định tính đa danh mục (categorical).
12. Chọn phương pháp thu thập dữ liệu định lượng phổ biến trong khoa học xã hội:
A. Phỏng vấn sâu.
B. Quan sát tham gia.
C. Khảo sát bằng bảng hỏi có cấu trúc.
D. Nghiên cứu trường hợp.
13. Trong kiểm định giả thuyết, `mức ý nghĩa thống kê` (alpha, α) thường được đặt ở 0.05. Điều này có nghĩa là:
A. Có 5% khả năng giả thuyết không bị bác bỏ là đúng.
B. Có 5% khả năng mắc lỗi Loại II (Type II error).
C. Có 5% khả năng mắc lỗi Loại I (Type I error).
D. Có 95% khả năng giả thuyết không bị bác bỏ là sai.
14. Phương pháp thống kê nào phù hợp để kiểm tra mối quan hệ giữa hai biến định tính?
A. Hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Hệ số tương quan Pearson.
15. Phương pháp chọn mẫu nào đảm bảo mọi cá thể trong tổng thể đều có cơ hội được chọn vào mẫu, và cơ hội này là như nhau?
A. Mẫu thuận tiện (Convenience sampling).
B. Mẫu phân tầng (Stratified sampling).
C. Mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Mẫu cụm (Cluster sampling).
16. Trong phân tích dữ liệu định tính, khái niệm `tam giác hóa` (triangulation) đề cập đến:
A. Sử dụng ba biến số để phân tích dữ liệu.
B. Sử dụng ba loại biểu đồ khác nhau để trình bày dữ liệu.
C. Sử dụng nhiều nguồn dữ liệu hoặc phương pháp khác nhau để kiểm tra tính nhất quán và độ tin cậy của kết quả.
D. Chia dữ liệu thành ba nhóm để so sánh.
17. Chọn phát biểu ĐÚNG về mối quan hệ giữa kích thước mẫu và sai số chuẩn:
A. Kích thước mẫu lớn hơn dẫn đến sai số chuẩn lớn hơn.
B. Kích thước mẫu nhỏ hơn dẫn đến sai số chuẩn nhỏ hơn.
C. Kích thước mẫu và sai số chuẩn không liên quan đến nhau.
D. Kích thước mẫu lớn hơn dẫn đến sai số chuẩn nhỏ hơn.
18. Khi nào thì sử dụng biểu đồ hộp (boxplot) hiệu quả nhất?
A. Để so sánh tần số của các biến định tính.
B. Để hiển thị xu hướng theo thời gian.
C. Để so sánh phân phối của một biến định lượng giữa các nhóm khác nhau và xác định giá trị ngoại lệ.
D. Để hiển thị mối quan hệ giữa hai biến định lượng.
19. Khái niệm `độ mạnh thống kê` (statistical power) trong kiểm định giả thuyết liên quan đến:
A. Xác suất mắc lỗi Loại I.
B. Xác suất mắc lỗi Loại II.
C. Xác suất bác bỏ đúng giả thuyết không khi nó thực sự sai.
D. Xác suất không bác bỏ giả thuyết không khi nó thực sự đúng.
20. Chọn phát biểu SAI về thống kê trong khoa học xã hội:
A. Thống kê giúp mô tả và tóm tắt dữ liệu.
B. Thống kê chỉ phù hợp với dữ liệu định lượng.
C. Thống kê hỗ trợ kiểm định giả thuyết và đưa ra kết luận dựa trên bằng chứng.
D. Thống kê giúp phát hiện các mối quan hệ và xu hướng trong dữ liệu.
21. Sai số chuẩn (standard error) của trung bình mẫu phản ánh điều gì?
A. Độ lệch chuẩn của tổng thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số do đo lường không chính xác.
22. Trong phân tích hồi quy, hệ số R-bình phương (R-squared) thể hiện điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Sai số chuẩn của các hệ số hồi quy.
D. Giá trị p của kiểm định F.
23. Phân tích hồi quy tuyến tính đa biến được sử dụng khi:
A. Chỉ có một biến độc lập và một biến phụ thuộc.
B. Biến phụ thuộc là biến định tính.
C. Có nhiều hơn một biến độc lập ảnh hưởng đến biến phụ thuộc.
D. Các biến độc lập không tương quan với nhau.
24. Phương pháp lấy mẫu `phân tầng` (stratified sampling) đặc biệt hữu ích khi:
A. Tổng thể nghiên cứu đồng nhất.
B. Muốn đảm bảo tính đại diện của các nhóm nhỏ (phân tầng) trong tổng thể.
C. Không có danh sách đầy đủ về tổng thể.
D. Chi phí thu thập dữ liệu rất thấp.
25. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mối quan hệ giữa hai biến.
26. Hệ số tương quan Pearson (r) đo lường điều gì?
A. Mức độ khác biệt giữa trung bình của hai nhóm.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Khả năng một biến định tính ảnh hưởng đến một biến định lượng.
D. Mức độ phù hợp của một mô hình hồi quy.
27. Trong kiểm định giả thuyết một đuôi (one-tailed test), chúng ta quan tâm đến điều gì?
A. Sự khác biệt theo cả hai hướng (lớn hơn hoặc nhỏ hơn) so với giả thuyết không.
B. Sự khác biệt theo một hướng cụ thể (lớn hơn HOẶC nhỏ hơn) so với giả thuyết không.
C. Sự khác biệt lớn nhất có thể xảy ra.
D. Sự khác biệt không có ý nghĩa thống kê.
28. Thống kê mô tả trong khoa học xã hội chủ yếu tập trung vào:
A. Đưa ra dự đoán về tổng thể dựa trên mẫu.
B. Mô tả và tóm tắt dữ liệu của một mẫu cụ thể.
C. Kiểm định các giả thuyết về mối quan hệ nhân quả.
D. Xây dựng mô hình toán học phức tạp cho dữ liệu lớn.
29. Trong phân tích bảng chéo (cross-tabulation), chúng ta thường sử dụng kiểm định thống kê nào?
A. Kiểm định t.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Hồi quy tuyến tính.
30. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ: dữ liệu không phân phối chuẩn).
D. Khi muốn tăng độ mạnh của kiểm định.