1. Trong nghiên cứu khoa học xã hội, biến định tính (qualitative variable) được sử dụng để:
A. Đo lường số lượng hoặc tần suất của một hiện tượng.
B. Phân loại đối tượng nghiên cứu vào các nhóm hoặc phạm trù khác nhau.
C. Xác định mối quan hệ nhân quả giữa các hiện tượng.
D. Tính toán giá trị trung bình và độ lệch chuẩn của dữ liệu.
2. Trong hồi quy tuyến tính đơn giản, hệ số góc (slope coefficient) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc khi biến độc lập bằng 0.
B. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên 1 đơn vị.
C. Mức độ phân tán của dữ liệu xung quanh đường hồi quy.
D. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
3. Khoảng tin cậy (confidence interval) 95% cho trung bình tổng thể có nghĩa là:
A. 95% mẫu từ tổng thể sẽ có trung bình nằm trong khoảng này.
B. Có 95% xác suất trung bình tổng thể nằm trong khoảng này.
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy được tạo ra sẽ chứa trung bình tổng thể thực sự.
D. Khoảng này chứa 95% dữ liệu trong mẫu.
4. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật chọn mẫu xác suất?
A. Chọn mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
B. Chọn mẫu phân tầng (Stratified Sampling)
C. Chọn mẫu cụm (Cluster Sampling)
D. Chọn mẫu thuận tiện (Convenience Sampling)
5. Phương pháp thống kê mô tả nào phù hợp nhất để tóm tắt xu hướng trung tâm của một tập dữ liệu có phân phối lệch (skewed distribution)?
A. Giá trị trung bình (Mean)
B. Trung vị (Median)
C. Phương sai (Variance)
D. Độ lệch chuẩn (Standard deviation)
6. Trong nghiên cứu định lượng, `tính giá trị bên trong` (internal validity) đề cập đến:
A. Khả năng khái quát hóa kết quả nghiên cứu cho tổng thể lớn hơn.
B. Mức độ chắc chắn rằng mối quan hệ nhân quả quan sát được trong nghiên cứu là thực sự và không bị ảnh hưởng bởi các yếu tố gây nhiễu.
C. Tính nhất quán và ổn định của kết quả nghiên cứu khi đo lường lặp lại.
D. Mức độ phù hợp của công cụ đo lường với khái niệm cần đo.
7. Để khảo sát ý kiến của sinh viên về chất lượng giảng dạy của một trường đại học, phương pháp thu thập dữ liệu nào sau đây phù hợp nhất?
A. Thí nghiệm trong phòng thí nghiệm.
B. Phỏng vấn sâu cá nhân.
C. Khảo sát bằng bảng hỏi (survey questionnaire) trên diện rộng.
D. Quan sát hành vi tự nhiên của sinh viên trong lớp học.
8. Phương pháp nào sau đây thường được sử dụng để đánh giá độ tin cậy (reliability) của một thang đo trắc nghiệm (psychometric scale)?
A. Độ giá trị nội dung (content validity).
B. Độ giá trị tiêu chuẩn (criterion validity).
C. Hệ số Cronbach`s alpha.
D. Phân tích nhân tố khám phá (exploratory factor analysis).
9. Khái niệm `phương sai giải thích được` (explained variance) trong mô hình hồi quy đề cập đến:
A. Tổng phương sai của biến phụ thuộc.
B. Phương sai của phần dư (residuals).
C. Phần phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
D. Phương sai của các biến độc lập.
10. Trong kiểm định giả thuyết thống kê, lỗi Loại I (Type I error) xảy ra khi:
A. Chấp nhận giả thuyết нуле khi nó thực sự đúng.
B. Bác bỏ giả thuyết нуле khi nó thực sự đúng.
C. Chấp nhận giả thuyết нуле khi nó thực sự sai.
D. Bác bỏ giả thuyết нуле khi nó thực sự sai.
11. Phương pháp chọn mẫu ngẫu nhiên đơn giản (Simple Random Sampling) đảm bảo rằng:
A. Mỗi phần tử trong tổng thể đều có cơ hội được chọn vào mẫu như nhau.
B. Mẫu thu được phản ánh chính xác tỷ lệ các nhóm trong tổng thể.
C. Mẫu thu được là đại diện nhất cho tổng thể.
D. Việc chọn mẫu được thực hiện một cách hệ thống theo quy tắc nhất định.
12. Phân tích phương sai (ANOVA) chủ yếu được sử dụng để:
A. Xác định mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm độc lập.
C. So sánh trung bình của ba nhóm trở lên độc lập.
D. Đo lường mức độ phân tán của dữ liệu.
13. Ưu điểm chính của việc sử dụng cỡ mẫu lớn trong nghiên cứu thống kê là gì?
A. Giảm chi phí và thời gian thu thập dữ liệu.
B. Tăng tính đại diện của mẫu và giảm sai số chuẩn.
C. Đảm bảo dữ liệu tuân theo phân phối chuẩn.
D. Loại bỏ hoàn toàn sai số lấy mẫu.
14. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để:
A. So sánh trung bình của hai nhóm độc lập.
B. Kiểm tra sự phù hợp của dữ liệu định tính với phân phối lý thuyết.
C. Đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
D. Ước lượng khoảng tin cậy cho trung bình tổng thể.
15. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Sức mạnh và hướng của mối quan hệ phi tuyến tính giữa hai biến.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt về trung bình giữa hai nhóm.
D. Mức độ phù hợp của một mô hình hồi quy.
16. Trong phân tích phương sai hai yếu tố (two-way ANOVA), `tương tác` (interaction effect) giữa hai biến độc lập có nghĩa là:
A. Hai biến độc lập có mối tương quan tuyến tính với nhau.
B. Hai biến độc lập có tác động độc lập lên biến phụ thuộc.
C. Tác động của một biến độc lập lên biến phụ thuộc phụ thuộc vào giá trị của biến độc lập còn lại.
D. Tổng tác động của hai biến độc lập lên biến phụ thuộc bằng tổng tác động riêng lẻ của từng biến.
17. Loại thang đo nào cho phép sắp xếp thứ tự các đối tượng nghiên cứu và xác định khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Thang đo danh nghĩa (Nominal scale)
B. Thang đo thứ bậc (Ordinal scale)
C. Thang đo khoảng (Interval scale)
D. Thang đo tỷ lệ (Ratio scale)
18. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến:
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập với nhau.
C. Phân phối không chuẩn của phần dư (residuals).
D. Sự biến động lớn của sai số chuẩn.
19. Khi so sánh hai nhóm độc lập về một biến định lượng, nếu dữ liệu không tuân theo phân phối chuẩn, kiểm định phi tham số nào sau đây phù hợp?
A. Kiểm định t-test mẫu độc lập (independent samples t-test).
B. Kiểm định ANOVA (Analysis of Variance).
C. Kiểm định Mann-Whitney U test (Wilcoxon rank-sum test).
D. Kiểm định tương quan Pearson (Pearson correlation test).
20. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết нуле là đúng.
B. Xác suất quan sát được kết quả hiện tại (hoặc cực đoan hơn) nếu giả thuyết нуле là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Xác suất mắc lỗi Loại I.
21. Khi thực hiện kiểm định giả thuyết về sự khác biệt giữa trung bình của hai mẫu phụ thuộc (paired samples t-test), giả thuyết нуле (H0) thường là:
A. Trung bình của hai mẫu bằng nhau.
B. Phương sai của hai mẫu bằng nhau.
C. Không có sự khác biệt trung bình giữa hai mẫu.
D. Có sự khác biệt trung bình giữa hai mẫu.
22. Sai số chuẩn (Standard Error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của tổng thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Khoảng tin cậy cho trung bình tổng thể.
23. Trong thống kê, `độ mạnh kiểm định` (statistical power) đề cập đến:
A. Xác suất mắc lỗi Loại I.
B. Xác suất mắc lỗi Loại II.
C. Xác suất bác bỏ đúng giả thuyết нуле khi nó thực sự sai.
D. Xác suất chấp nhận đúng giả thuyết нуле khi nó thực sự đúng.
24. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến nào?
A. Biến định lượng liên tục.
B. Biến định lượng rời rạc.
C. Biến định tính nhị phân (binary categorical variable).
D. Biến định tính đa danh mục (multi-categorical variable).
25. Khi nào thì việc sử dụng thống kê phi tham số (non-parametric statistics) được ưu tiên hơn thống kê tham số (parametric statistics)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc thang đo thứ bậc/danh nghĩa.
D. Khi cần tính toán khoảng tin cậy hẹp.
26. Trong nghiên cứu khoa học xã hội, vấn đề đạo đức nào sau đây cần được đặc biệt quan tâm khi thu thập và phân tích dữ liệu?
A. Tính hợp lệ (validity) của công cụ đo lường.
B. Tính tin cậy (reliability) của dữ liệu.
C. Bảo mật thông tin cá nhân và sự đồng ý có hiểu biết của người tham gia.
D. Tính khái quát hóa (generalizability) của kết quả nghiên cứu.
27. Sử dụng phần mềm thống kê trong khoa học xã hội mang lại lợi ích nào sau đây?
A. Loại bỏ hoàn toàn sai sót trong phân tích dữ liệu.
B. Tăng tốc độ và hiệu quả phân tích dữ liệu phức tạp.
C. Thay thế hoàn toàn kiến thức và kỹ năng thống kê của nhà nghiên cứu.
D. Đảm bảo kết quả nghiên cứu luôn chính xác và khách quan.
28. Khi trình bày kết quả nghiên cứu định lượng, biểu đồ hộp (boxplot) thường được sử dụng để:
A. Hiển thị tần suất của các giá trị trong một biến.
B. So sánh phân phối của một biến số giữa các nhóm khác nhau.
C. Thể hiện mối quan hệ giữa hai biến định lượng.
D. Tóm tắt xu hướng trung tâm và độ phân tán của dữ liệu theo thời gian.
29. Khi báo cáo kết quả kiểm định giả thuyết, giá trị `p < 0.05` thường được hiểu là:
A. Giả thuyết нуле được chấp nhận ở mức ý nghĩa 5%.
B. Giả thuyết нуле bị bác bỏ ở mức ý nghĩa 5%, có bằng chứng thống kê có ý nghĩa ủng hộ giả thuyết thay thế.
C. Có 5% khả năng kết quả quan sát được là do ngẫu nhiên.
D. Có 95% khả năng kết quả quan sát được là đúng.
30. Trong phân tích dữ liệu định tính, mã hóa (coding) là quá trình:
A. Chuyển đổi dữ liệu định tính thành dữ liệu định lượng.
B. Gán nhãn hoặc tên gọi cho các đoạn dữ liệu để xác định chủ đề và mô hình.
C. Tính toán tần suất xuất hiện của các từ khóa trong văn bản.
D. Sử dụng phần mềm thống kê để phân tích dữ liệu văn bản.