1. Trong phân tích hồi quy tuyến tính đơn biến (simple linear regression), hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị trung bình của biến phụ thuộc khi biến độc lập bằng 0.
C. Mức độ mạnh yếu của mối quan hệ tuyến tính.
D. Sai số dự đoán trung bình.
2. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong tập dữ liệu lớn, đồng thời giữ lại thông tin quan trọng nhất?
A. Phân tích hồi quy (Regression analysis).
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định Chi-bình phương (Chi-square test).
3. Trong nghiên cứu khoa học xã hội, `hiệu ứng cỡ mẫu` (effect size) quan trọng vì nó cho biết:
A. Mức độ ý nghĩa thống kê (statistical significance) của kết quả.
B. Độ lớn thực tế (practical significance) hoặc tầm quan trọng của hiệu ứng nghiên cứu được.
C. Xác suất mắc sai số loại I.
D. Cỡ mẫu cần thiết để đạt được ý nghĩa thống kê.
4. Trong phân tích trung gian (mediation analysis), biến trung gian (mediator variable) có vai trò gì?
A. Gây nhiễu mối quan hệ giữa biến độc lập và biến phụ thuộc.
B. Giải thích cơ chế hoặc con đường mà biến độc lập ảnh hưởng đến biến phụ thuộc.
C. Điều chỉnh mối quan hệ giữa biến độc lập và biến phụ thuộc.
D. Đo lường mối quan hệ tổng thể giữa biến độc lập và biến phụ thuộc.
5. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị trung vị của tập dữ liệu.
C. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
6. Sai lầm phổ biến khi diễn giải kết quả thống kê là `ngụy biện tương quan là nhân quả` (correlation does not imply causation). Điều này có nghĩa là:
A. Tương quan âm giữa hai biến là không thể xảy ra.
B. Nếu hai biến tương quan với nhau, chắc chắn có mối quan hệ nhân quả giữa chúng.
C. Tương quan giữa hai biến không tự động chứng minh mối quan hệ nhân quả giữa chúng.
D. Chỉ có các nghiên cứu thực nghiệm mới có thể xác định mối quan hệ nhân quả.
7. Khi trình bày kết quả nghiên cứu định lượng, việc báo cáo `khoảng tin cậy` (confidence intervals) quan trọng vì nó cung cấp thông tin về:
A. Ý nghĩa thống kê (p-value).
B. Hiệu ứng cỡ mẫu (effect size).
C. Độ chính xác của ước lượng mẫu về tham số tổng thể.
D. Cỡ mẫu sử dụng trong nghiên cứu.
8. Trong nghiên cứu khoa học xã hội, `sai số loại I` (Type I error) xảy ra khi:
A. Chấp nhận giả thuyết null khi nó thực sự đúng.
B. Bác bỏ giả thuyết null khi nó thực sự đúng.
C. Chấp nhận giả thuyết null khi nó thực sự sai.
D. Bác bỏ giả thuyết null khi nó thực sự sai.
9. Khái niệm `tính giá trị` (validity) trong nghiên cứu khoa học xã hội đề cập đến:
A. Mức độ nhất quán của kết quả đo lường qua thời gian.
B. Mức độ đo lường chính xác những gì cần đo.
C. Mức độ kết quả nghiên cứu có thể khái quát hóa cho tổng thể.
D. Mức độ dễ dàng thực hiện nghiên cứu.
10. Lựa chọn nào sau đây KHÔNG phải là một biện pháp đo lường xu hướng trung tâm (measures of central tendency)?
A. Trung bình (Mean).
B. Trung vị (Median).
C. Mốt (Mode).
D. Phương sai (Variance).
11. Trong phân tích phương sai (ANOVA), giả thuyết null (H0) thường là gì?
A. Có ít nhất một cặp trung bình nhóm khác nhau.
B. Tất cả các trung bình nhóm đều bằng nhau.
C. Phương sai giữa các nhóm lớn hơn phương sai trong nội bộ nhóm.
D. Mẫu được lấy từ phân phối chuẩn.
12. Khi nào nên sử dụng thống kê phi tham số (non-parametric statistics) thay vì thống kê tham số (parametric statistics)?
A. Khi cỡ mẫu lớn (n > 30).
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc thang đo thứ bậc/danh nghĩa.
D. Khi muốn tính toán trung bình và độ lệch chuẩn.
13. Trong phân tích dữ liệu định tính, kỹ thuật `mã hóa` (coding) được sử dụng để:
A. Thống kê tần suất xuất hiện của các chủ đề.
B. Chuyển đổi dữ liệu định tính thành dữ liệu định lượng.
C. Phân loại và gán nhãn cho các đoạn dữ liệu văn bản hoặc hình ảnh theo các chủ đề hoặc khái niệm.
D. Kiểm định giả thuyết về mối quan hệ giữa các chủ đề.
14. Phương pháp nào sau đây thường được sử dụng để phân tích dữ liệu bảng (panel data) trong khoa học xã hội?
A. Phân tích hồi quy tuyến tính đơn biến.
B. Phân tích phương sai (ANOVA).
C. Mô hình tác động cố định (Fixed effects model) hoặc tác động ngẫu nhiên (Random effects model).
D. Kiểm định Chi-bình phương.
15. Trong phân tích hồi quy bội (multiple regression), hệ số hồi quy riêng phần (partial regression coefficient) cho biết:
A. Mức độ ảnh hưởng của tất cả các biến độc lập lên biến phụ thuộc.
B. Mức độ ảnh hưởng của một biến độc lập lên biến phụ thuộc, khi các biến độc lập khác được giữ không đổi.
C. Mức độ tương quan giữa các biến độc lập.
D. Tổng phương sai được giải thích bởi mô hình hồi quy.
16. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ mạnh yếu của mối quan hệ phi tuyến tính giữa hai biến định lượng.
B. Mức độ mạnh yếu của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Mức độ khác biệt trung bình giữa hai nhóm.
D. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
17. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất giả thuyết đối thuyết là đúng.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Ngưỡng ý nghĩa thống kê mặc định (thường là 0.05).
18. Khi so sánh trung bình của hai nhóm độc lập, kiểm định t (t-test) nào phù hợp khi phương sai của hai nhóm không bằng nhau?
A. Kiểm định t cặp đôi (Paired t-test).
B. Kiểm định t một mẫu (One-sample t-test).
C. Kiểm định t độc lập với giả định phương sai bằng nhau.
D. Kiểm định t độc lập với giả định phương sai không bằng nhau (Welch`s t-test).
19. `Khoảng tin cậy 95%` (95% confidence interval) được hiểu như thế nào?
A. Xác suất trung bình tổng thể nằm trong khoảng tin cậy là 95%.
B. 95% mẫu từ tổng thể sẽ cho ra khoảng tin cậy chứa trung bình mẫu.
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy được xây dựng sẽ chứa trung bình tổng thể thực sự.
D. Khoảng tin cậy chứa 95% dữ liệu mẫu.
20. Loại thang đo nào cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm 0 tuyệt đối?
A. Thang đo danh nghĩa (Nominal).
B. Thang đo thứ bậc (Ordinal).
C. Thang đo khoảng (Interval).
D. Thang đo tỷ lệ (Ratio).
21. Một nhà nghiên cứu muốn so sánh mức độ hài lòng công việc trung bình của nhân viên ở ba bộ phận khác nhau trong công ty. Phương pháp thống kê nào phù hợp nhất?
A. Phân tích tương quan (Correlation analysis).
B. Kiểm định t cặp đôi (Paired t-test).
C. Phân tích phương sai một yếu tố (One-way ANOVA).
D. Phân tích hồi quy tuyến tính đa biến (Multiple linear regression).
22. Phương pháp lấy mẫu nào đảm bảo mỗi cá thể trong tổng thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu phán đoán (Judgment sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu theo mục tiêu (Purposive sampling).
23. Trong thống kê, `phân phối chuẩn` (normal distribution) có đặc điểm quan trọng nào?
A. Dữ liệu luôn tập trung ở hai đầu mút.
B. Trung bình, trung vị và mốt không bằng nhau.
C. Dạng hình chuông đối xứng, trung bình, trung vị và mốt bằng nhau.
D. Chỉ áp dụng cho dữ liệu định tính.
24. Trong thiết kế nghiên cứu thực nghiệm, việc `ngẫu nhiên hóa` (randomization) có vai trò quan trọng nhất là gì?
A. Tăng cỡ mẫu nghiên cứu.
B. Đảm bảo tính đại diện của mẫu so với tổng thể.
C. Kiểm soát các biến gây nhiễu tiềm ẩn và tăng tính giá trị bên trong (internal validity).
D. Tăng tính giá trị bên ngoài (external validity) của nghiên cứu.
25. Khi dữ liệu vi phạm nghiêm trọng giả định về phân phối chuẩn, phương pháp nào sau đây thường được sử dụng để chuyển đổi dữ liệu trước khi phân tích?
A. Loại bỏ các giá trị ngoại lệ (outliers).
B. Sử dụng thống kê mô tả.
C. Chuyển đổi dữ liệu (data transformation), ví dụ logarit, căn bậc hai.
D. Tăng cỡ mẫu.
26. Khi nào thì việc sử dụng thống kê mô tả là đủ, và không cần đến thống kê suy diễn?
A. Khi muốn suy rộng kết quả từ mẫu lên tổng thể.
B. Khi chỉ quan tâm đến việc mô tả đặc điểm của mẫu dữ liệu hiện có, không muốn khái quát hóa.
C. Khi muốn kiểm định giả thuyết về mối quan hệ nhân quả.
D. Khi cỡ mẫu rất lớn.
27. Phương pháp thống kê nào phù hợp để kiểm tra mối quan hệ giữa hai biến định tính?
A. Phân tích hồi quy tuyến tính.
B. Kiểm định t (t-test).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Phân tích phương sai (ANOVA).
28. Thống kê mô tả chủ yếu được sử dụng để:
A. Suy rộng kết quả từ mẫu lên tổng thể.
B. Tóm tắt và mô tả các đặc điểm chính của tập dữ liệu.
C. Kiểm định các giả thuyết về mối quan hệ giữa các biến.
D. Dự đoán giá trị của biến phụ thuộc dựa trên biến độc lập.
29. Trong thống kê Bayes (Bayesian statistics), chúng ta cập nhật niềm tin ban đầu (prior belief) về một giả thuyết dựa trên:
A. Chỉ dựa vào dữ liệu mẫu hiện tại.
B. Kết hợp niềm tin ban đầu và dữ liệu mẫu.
C. Chỉ dựa vào niềm tin ban đầu, không cần dữ liệu.
D. Sử dụng tần suất xuất hiện của sự kiện trong quá khứ.
30. Chọn phát biểu ĐÚNG về `cỡ mẫu` (sample size) trong nghiên cứu thống kê:
A. Cỡ mẫu càng nhỏ, kết quả nghiên cứu càng chính xác.
B. Cỡ mẫu không ảnh hưởng đến độ chính xác của kết quả nghiên cứu.
C. Cỡ mẫu lớn thường giúp tăng độ mạnh của kiểm định thống kê và độ tin cậy của ước lượng.
D. Cỡ mẫu lớn luôn đảm bảo kết quả nghiên cứu là đúng, bất kể phương pháp nghiên cứu.