1. Trong một hộp có 5 bi đỏ và 3 bi xanh. Nếu bạn rút ngẫu nhiên 2 bi mà không hoàn lại, xác suất để cả hai bi đều đỏ là bao nhiêu?
A. 5/8
B. 25/64
C. 5/14
D. 10/56
2. Độ lệch chuẩn của mẫu là một ước lượng cho đại lượng nào của tổng thể?
A. Trung bình tổng thể
B. Phương sai tổng thể
C. Độ lệch chuẩn tổng thể
D. Kích thước tổng thể
3. Khái niệm nào sau đây mô tả tập hợp tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên?
A. Biến cố
B. Không gian mẫu
C. Xác suất
D. Phân phối xác suất
4. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình nhóm đều khác nhau.
B. Ít nhất một trung bình nhóm khác với các trung bình nhóm khác.
C. Tất cả các trung bình nhóm đều bằng nhau.
D. Phương sai giữa các nhóm lớn hơn phương sai trong nhóm.
5. Trong thống kê mô tả, `mốt` (mode) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị ở giữa khi dữ liệu được sắp xếp.
C. Giá trị xuất hiện nhiều lần nhất trong dữ liệu.
D. Độ lệch chuẩn của dữ liệu.
6. Nếu P(A) = 0.4 và P(B) = 0.5, và A và B là hai biến cố độc lập, thì P(A và B) bằng bao nhiêu?
A. 0.9
B. 0.2
C. 0.1
D. 0.0
7. Giá trị P trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả mẫu, giả sử giả thuyết null là đúng.
C. Xác suất giả thuyết đối là đúng.
D. Mức ý nghĩa của kiểm định.
8. Mục đích chính của việc ước lượng điểm là gì?
A. Đưa ra một khoảng giá trị có khả năng chứa tham số tổng thể.
B. Đưa ra một giá trị duy nhất tốt nhất để ước tính tham số tổng thể.
C. Kiểm định giả thuyết về tham số tổng thể.
D. Mô tả đặc điểm của mẫu dữ liệu.
9. Loại biểu đồ nào phù hợp nhất để hiển thị tần số phân bố của một biến định lượng liên tục?
A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ hộp
D. Biểu đồ tần suất (Histogram)
10. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm đi.
C. Độ rộng khoảng tin cậy không đổi.
D. Không có mối quan hệ rõ ràng.
11. Trong kiểm định giả thuyết thống kê, lỗi loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chấp nhận giả thuyết đối khi nó thực sự đúng.
D. Bác bỏ giả thuyết đối khi nó thực sự sai.
12. Biến ngẫu nhiên liên tục khác với biến ngẫu nhiên rời rạc ở điểm nào?
A. Biến liên tục chỉ nhận giá trị nguyên.
B. Biến liên tục có thể nhận bất kỳ giá trị nào trong một khoảng xác định.
C. Biến rời rạc có phân phối xác suất liên tục.
D. Biến rời rạc không thể nhận giá trị âm.
13. Đặc điểm nào sau đây KHÔNG phải là đặc điểm của phân phối chuẩn?
A. Đối xứng quanh giá trị trung bình.
B. Giá trị trung bình, trung vị và mốt bằng nhau.
C. Có hai đỉnh.
D. Diện tích dưới đường cong bằng 1.
14. Công thức nào sau đây được sử dụng để tính xác suất có điều kiện P(A|B)?
A. P(A|B) = P(A ∩ B) / P(B)
B. P(A|B) = P(A) * P(B)
C. P(A|B) = P(A) + P(B) - P(A ∩ B)
D. P(A|B) = P(B) / P(A ∩ B)
15. Sai sót loại II (lỗi β) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chấp nhận giả thuyết đối khi nó thực sự đúng.
D. Bác bỏ giả thuyết đối khi nó thực sự sai.
16. Phân phối nào sau đây thường được sử dụng để mô hình hóa thời gian cho đến khi một sự kiện xảy ra?
A. Phân phối nhị thức
B. Phân phối Poisson
C. Phân phối mũ (Exponential)
D. Phân phối đều
17. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định về phân phối dữ liệu của kiểm định tham số không được đáp ứng.
D. Khi muốn tăng độ mạnh của kiểm định.
18. Khi nào thì thích hợp sử dụng kiểm định t-student?
A. Khi so sánh trung bình của hai tổng thể độc lập với kích thước mẫu lớn.
B. Khi so sánh trung bình của hai tổng thể độc lập với kích thước mẫu nhỏ và độ lệch chuẩn tổng thể chưa biết.
C. Khi kiểm định sự độc lập giữa hai biến định tính.
D. Khi phân tích phương sai của nhiều nhóm.
19. Phương pháp lấy mẫu nào mà mỗi phần tử trong tổng thể có cơ hội được chọn như nhau?
A. Lấy mẫu phân tầng
B. Lấy mẫu cụm
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu thuận tiện
20. Trong biểu đồ hộp (boxplot), `râu` (whiskers) thường kéo dài đến giá trị nào?
A. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
B. Phạm vi liên phần tư (IQR).
C. 1.5 lần phạm vi liên phần tư (IQR) từ hộp, hoặc đến giá trị dữ liệu cực trị gần nhất.
D. Độ lệch chuẩn.
21. Phân phối chuẩn (Gaussian) có hình dạng đặc trưng nào?
A. Hình chữ nhật
B. Hình tam giác
C. Hình chuông
D. Đường thẳng
22. Giá trị trung bình của một biến ngẫu nhiên rời rạc được gọi là gì?
A. Phương sai
B. Độ lệch chuẩn
C. Kỳ vọng toán
D. Trung vị
23. Phân phối xác suất nào thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện hiếm trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
24. Khoảng tin cậy 95% cho trung bình tổng thể có nghĩa là gì?
A. Xác suất trung bình mẫu nằm trong khoảng này là 95%.
B. Có 95% khả năng trung bình tổng thể nằm trong khoảng này.
C. Khoảng này chứa 95% dữ liệu mẫu.
D. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa trung bình tổng thể thực sự.
25. Trong phân tích hồi quy tuyến tính, R-squared đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình.
C. Sai số chuẩn của ước lượng.
D. Độ dốc của đường hồi quy.
26. Trung vị là thước đo vị trí trung tâm nào?
A. Giá trị trung bình
B. Giá trị ở giữa khi dữ liệu được sắp xếp theo thứ tự
C. Giá trị xuất hiện nhiều nhất
D. Tổng của tất cả các giá trị chia cho số lượng giá trị
27. Hệ số tương quan Pearson đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
B. Mức độ phân tán của dữ liệu.
C. Độ lệch của phân phối dữ liệu.
D. Giá trị trung bình của dữ liệu.
28. Nếu một kiểm định giả thuyết có mức ý nghĩa α = 0.05, điều này có nghĩa là gì?
A. Xác suất mắc lỗi loại II là 5%.
B. Xác suất bác bỏ giả thuyết null đúng là 5%.
C. Xác suất chấp nhận giả thuyết null sai là 5%.
D. Độ tin cậy của kiểm định là 95%.
29. Đại lượng nào đo mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Mốt
C. Phương sai
D. Tần số
30. Phương pháp nào sau đây giúp giảm thiểu sai lệch chọn mẫu?
A. Tăng kích thước mẫu.
B. Sử dụng phương pháp lấy mẫu phi ngẫu nhiên.
C. Sử dụng phương pháp lấy mẫu ngẫu nhiên.
D. Giảm kích thước mẫu.