1. Trong nghiên cứu khoa học xã hội, đạo đức nghiên cứu thống kê bao gồm nguyên tắc nào?
A. Chỉ tập trung vào kết quả có ý nghĩa thống kê
B. Bảo vệ quyền riêng tư và bảo mật thông tin của người tham gia nghiên cứu
C. Luôn sử dụng các phương pháp thống kê phức tạp nhất
D. Báo cáo kết quả theo hướng có lợi cho nhà tài trợ nghiên cứu
2. Phương pháp nào sau đây giúp giảm thiểu sai số do yếu tố nhiễu (confounding variables) trong nghiên cứu thực nghiệm?
A. Chọn mẫu thuận tiện
B. Sử dụng nhóm chứng (control group)
C. Tăng kích thước mẫu
D. Sử dụng thống kê mô tả
3. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ, dữ liệu không phân phối chuẩn)
D. Khi muốn tính toán khoảng tin cậy
4. Phương pháp nào sau đây thường được sử dụng để phân tích dữ liệu định tính trong khoa học xã hội?
A. Phân tích hồi quy
B. Phân tích phương sai (ANOVA)
C. Phân tích nội dung (Content analysis)
D. Kiểm định t (t-test)
5. Phương pháp chọn mẫu nào đảm bảo rằng mọi thành viên của quần thể đều có cơ hội được chọn vào mẫu, và các thành viên được chọn hoàn toàn ngẫu nhiên?
A. Mẫu thuận tiện (Convenience sampling)
B. MẫuSnowball (Snowball sampling)
C. Mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Mẫu phân tầng (Stratified sampling)
6. Khi nào thì sử dụng kiểm định Chi-bình phương (Chi-square test) là phù hợp?
A. Để so sánh trung bình của hai nhóm độc lập
B. Để đo lường mối quan hệ tuyến tính giữa hai biến định lượng
C. Để kiểm tra sự độc lập giữa hai biến định tính
D. Để so sánh phương sai của hai quần thể
7. Giá trị trung vị (median) là thước đo vị trí trung tâm nào của dữ liệu?
A. Giá trị trung bình cộng
B. Giá trị chính giữa khi dữ liệu được sắp xếp theo thứ tự
C. Giá trị xuất hiện nhiều nhất
D. Giá trị trung bình của phần tư thứ nhất và thứ ba
8. Biểu đồ nào thích hợp nhất để thể hiện sự phân bố tần số của một biến định lượng liên tục?
A. Biểu đồ tròn (Pie chart)
B. Biểu đồ cột (Bar chart)
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ hộp (Box plot)
9. Trong kiểm định giả thuyết, `giá trị p` (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Xác suất quan sát được kết quả cực đoan như kết quả mẫu (hoặc cực đoan hơn) nếu giả thuyết null là đúng
C. Mức ý nghĩa thống kê được chọn trước
D. Kích thước của hiệu ứng thực tế
10. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Đo lường mối quan hệ tuyến tính giữa hai biến
B. So sánh trung bình của hai nhóm
C. So sánh trung bình của ba nhóm trở lên
D. Phân tích phương sai của một biến duy nhất
11. Hệ số tương quan Pearson đo lường điều gì giữa hai biến định lượng?
A. Sự khác biệt về trung bình giữa hai biến
B. Mức độ và chiều hướng của mối quan hệ tuyến tính
C. Mối quan hệ phi tuyến tính giữa hai biến
D. Mức độ ảnh hưởng của một biến lên biến kia
12. Loại biểu đồ nào thích hợp để so sánh tỷ lệ phần trăm của các danh mục khác nhau?
A. Biểu đồ đường (Line chart)
B. Biểu đồ tán xạ (Scatter plot)
C. Biểu đồ tròn (Pie chart)
D. Biểu đồ hộp (Box plot)
13. Khoảng tin cậy (confidence interval) được sử dụng để làm gì?
A. Kiểm định giả thuyết về quần thể
B. Ước lượng một khoảng giá trị mà tham số quần thể có khả năng nằm trong đó
C. Mô tả đặc điểm của mẫu
D. Xác định kích thước mẫu cần thiết
14. Phương pháp lấy mẫu phân tầng (stratified sampling) đặc biệt hữu ích khi nào?
A. Khi quần thể rất đồng nhất
B. Khi quần thể có các nhóm con (strata) khác biệt rõ rệt và chúng ta muốn đảm bảo đại diện từ mỗi nhóm
C. Khi việc tiếp cận quần thể là khó khăn
D. Khi muốn chọn mẫu một cách nhanh chóng và dễ dàng
15. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể
B. Độ lệch chuẩn của mẫu
C. Độ biến động của trung bình mẫu giữa các mẫu khác nhau lấy từ cùng một quần thể
D. Sai số do đo lường không chính xác
16. Thang đo nào sau đây cho phép phân loại đối tượng thành các nhóm riêng biệt và sắp xếp thứ tự giữa các nhóm, nhưng không có khoảng cách bằng nhau giữa các thứ hạng?
A. Định danh (Nominal)
B. Thứ bậc (Ordinal)
C. Khoảng (Interval)
D. Tỷ lệ (Ratio)
17. Sai lầm Loại I trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Không bác bỏ giả thuyết null khi nó thực sự sai
C. Chọn mẫu không đại diện cho quần thể
D. Sử dụng kiểm định thống kê không phù hợp
18. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với khoảng tin cậy cho trung bình quần thể?
A. Khoảng tin cậy trở nên rộng hơn
B. Khoảng tin cậy trở nên hẹp hơn
C. Khoảng tin cậy không thay đổi
D. Khoảng tin cậy trở nên không xác định
19. Trong nghiên cứu khoa học xã hội, tính giá trị (validity) của một công cụ đo lường đề cập đến điều gì?
A. Mức độ nhất quán của kết quả đo lường qua thời gian
B. Mức độ công cụ đo lường thực sự đo lường khái niệm mà nó được thiết kế để đo lường
C. Khả năng áp dụng công cụ đo lường trong nhiều bối cảnh khác nhau
D. Mức độ dễ dàng sử dụng công cụ đo lường
20. Khi nào thì việc sử dụng thống kê mô tả là phù hợp trong nghiên cứu khoa học xã hội?
A. Chỉ khi muốn suy rộng kết quả mẫu ra quần thể
B. Khi muốn tóm tắt và mô tả các đặc điểm chính của một tập dữ liệu
C. Chỉ khi dữ liệu là định lượng và liên tục
D. Khi muốn kiểm định các mối quan hệ nhân quả phức tạp
21. Trong thống kê, `mode` (mốt) là gì?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị ở giữa tập dữ liệu khi được sắp xếp
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
D. Tổng của tất cả các giá trị chia cho số lượng giá trị
22. Khi báo cáo kết quả nghiên cứu định lượng, giá trị nào sau đây thường được dùng để đánh giá mức độ ý nghĩa thống kê?
A. Giá trị trung bình
B. Độ lệch chuẩn
C. Giá trị p (p-value)
D. Hệ số tương quan
23. Trong phân tích hồi quy đa biến, `đa cộng tuyến` (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh mẽ giữa biến phụ thuộc và biến độc lập
B. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập với nhau
C. Dữ liệu không tuân theo phân phối chuẩn
D. Sai số chuẩn của các hệ số hồi quy quá lớn
24. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc
B. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên một đơn vị
C. Giá trị của biến phụ thuộc khi biến độc lập bằng 0
D. Độ mạnh của mối quan hệ giữa hai biến
25. Thống kê suy luận (inferential statistics) chủ yếu được sử dụng để làm gì trong khoa học xã hội?
A. Mô tả dữ liệu mẫu
B. Tóm tắt dữ liệu mẫu
C. Suy rộng kết quả từ mẫu ra quần thể
D. Trực quan hóa dữ liệu
26. Khi nào thì nên sử dụng thống kê phi tham số Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu phân phối chuẩn
B. Để so sánh trung bình của hai nhóm liên quan (paired) khi dữ liệu không phân phối chuẩn
C. Để so sánh trung bình của ba nhóm trở lên
D. Để đo lường mối quan hệ tuyến tính giữa hai biến định lượng
27. Điều gì xảy ra với `power` (uy lực) của một kiểm định thống kê khi kích thước mẫu tăng lên?
A. Power giảm
B. Power tăng
C. Power không thay đổi
D. Power trở nên không xác định
28. Hạn chế chính của việc sử dụng mẫu thuận tiện (convenience sampling) là gì?
A. Mẫu có thể quá lớn
B. Mẫu có thể không đại diện cho quần thể mục tiêu
C. Phương pháp này tốn kém thời gian và nguồn lực
D. Phương pháp này chỉ áp dụng cho dữ liệu định lượng
29. Trong thống kê mô tả, độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Giá trị trung bình của dữ liệu
B. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình
C. Giá trị lớn nhất trong dữ liệu
D. Vị trí trung tâm của dữ liệu
30. Trong thiết kế nghiên cứu, `tính tin cậy` (reliability) của một công cụ đo lường đề cập đến điều gì?
A. Mức độ công cụ đo lường đo lường đúng khái niệm cần đo
B. Mức độ nhất quán và ổn định của kết quả đo lường khi sử dụng công cụ nhiều lần
C. Khả năng tổng quát hóa kết quả nghiên cứu cho quần thể khác
D. Tính dễ sử dụng và thực tế của công cụ đo lường