1. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng:
A. Phân phối của mẫu luôn là phân phối chuẩn.
B. Phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể phân phối gốc của tổng thể.
C. Trung bình mẫu luôn bằng trung bình tổng thể.
D. Phương sai mẫu luôn bằng phương sai tổng thể.
2. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả đã quan sát, giả định giả thuyết null là đúng.
C. Xác suất mắc sai số loại II.
D. Mức ý nghĩa (significance level) của kiểm định.
3. Trong biểu đồ hộp (boxplot), `râu` (whiskers) thường kéo dài đến giá trị nào?
A. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
B. Trung bình cộng và độ lệch chuẩn.
C. Giá trị lớn nhất và nhỏ nhất trong phạm vi 1.5 lần khoảng tứ phân vị (IQR) từ các tứ phân vị.
D. Tứ phân vị thứ nhất (Q1) và tứ phân vị thứ ba (Q3).
4. Quy tắc cộng xác suất được áp dụng cho các biến cố nào sau đây?
A. Các biến cố độc lập.
B. Các biến cố xung khắc (mutually exclusive).
C. Các biến cố có điều kiện.
D. Tất cả các loại biến cố.
5. Trong thống kê suy diễn, chúng ta sử dụng dữ liệu mẫu để:
A. Mô tả đặc điểm của mẫu.
B. Suy luận về đặc điểm của tổng thể.
C. Tính toán các tham số mẫu.
D. Trực quan hóa dữ liệu mẫu.
6. Chọn phát biểu đúng về mối quan hệ giữa sai số loại I (α) và sai số loại II (β):
A. α và β luôn độc lập với nhau.
B. Giảm α sẽ làm giảm β.
C. Giảm α thường làm tăng β (nếu các yếu tố khác không đổi).
D. α và β luôn có tổng bằng 1.
7. “Biến ngẫu nhiên liên tục” khác với “biến ngẫu nhiên rời rạc” ở điểm nào?
A. Biến liên tục chỉ nhận giá trị dương, biến rời rạc có thể âm.
B. Biến liên tục có thể nhận vô số giá trị trong một khoảng xác định, biến rời rạc chỉ nhận giá trị đếm được.
C. Biến liên tục luôn có phân phối chuẩn, biến rời rạc không có.
D. Biến liên tục dễ đo lường hơn biến rời rạc.
8. Trong lý thuyết xác suất, biến cố sơ cấp (elementary event) được định nghĩa là:
A. Một tập hợp con của không gian mẫu.
B. Một kết quả duy nhất có thể xảy ra của một phép thử.
C. Một biến cố chắc chắn xảy ra.
D. Một biến cố không thể xảy ra.
9. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Bác bỏ giả thuyết thay thế khi nó thực sự đúng.
10. Khi kích thước mẫu tăng lên, độ rộng của khoảng tin cậy (với cùng mức độ tin cậy) thường:
A. Tăng lên.
B. Giảm đi.
C. Không thay đổi.
D. Thay đổi không theo quy luật.
11. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope coefficient) cho biết:
A. Giá trị trung bình của biến phụ thuộc.
B. Mức độ biến thiên của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của ước lượng.
12. Công thức Bayes được sử dụng để tính:
A. Xác suất của hợp hai biến cố.
B. Xác suất của giao hai biến cố.
C. Xác suất có điều kiện ngược (posterior probability) khi biết xác suất tiên nghiệm (prior probability) và các thông tin khác.
D. Xác suất của biến cố đối.
13. Phân phối chuẩn (Normal distribution) còn được gọi là phân phối:
A. Phân phối Poisson.
B. Phân phối nhị thức.
C. Phân phối Gauss.
D. Phân phối mũ.
14. Phân phối Poisson thường được sử dụng để mô hình hóa:
A. Thời gian giữa các sự kiện.
B. Số lần thành công trong một số phép thử cố định.
C. Số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Giá trị trung bình của một biến liên tục.
15. Phân phối nhị thức (Binomial distribution) mô tả số lần thành công trong:
A. Một loạt các phép thử độc lập Bernoulli.
B. Một khoảng thời gian liên tục.
C. Các sự kiện hiếm gặp.
D. Một tổng thể có kích thước lớn.
16. Khoảng tin cậy (confidence interval) cung cấp một khoảng ước lượng cho:
A. Giá trị của mẫu.
B. Tham số tổng thể.
C. Sai số chuẩn.
D. Giá trị p.
17. Chọn khẳng định SAI về phân phối chuẩn:
A. Đối xứng qua giá trị trung bình.
B. Có dạng hình chuông.
C. Trung bình, trung vị và mốt bằng nhau.
D. Luôn có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1.
18. Giá trị trung vị (median) của một tập dữ liệu là:
A. Giá trị trung bình cộng của tất cả các giá trị.
B. Giá trị xuất hiện nhiều nhất.
C. Giá trị nằm chính giữa tập dữ liệu đã sắp xếp.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất.
19. Biến ngẫu nhiên rời rạc (discrete random variable) là biến:
A. Có thể nhận bất kỳ giá trị nào trong một khoảng.
B. Chỉ nhận một số hữu hạn hoặc vô hạn đếm được các giá trị.
C. Luôn nhận giá trị nguyên.
D. Có phân phối liên tục.
20. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình mẫu với trung bình tổng thể?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai tổng thể đã biết.
C. Khi phương sai tổng thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Kiểm định t luôn tốt hơn kiểm định z.
21. Hệ số tương quan (correlation coefficient) đo lường điều gì giữa hai biến định lượng?
A. Sự khác biệt giữa giá trị trung bình của hai biến.
B. Mức độ quan hệ tuyến tính và chiều hướng của mối quan hệ giữa hai biến.
C. Mức độ phân tán của dữ liệu của hai biến.
D. Mức độ phù hợp của mô hình hồi quy tuyến tính.
22. Độ lệch chuẩn (standard deviation) là căn bậc hai của:
A. Giá trị trung bình.
B. Phương sai.
C. Trung vị.
D. Mốt.
23. Giá trị của xác suất luôn nằm trong khoảng nào?
A. (-∞, +∞)
B. (0, 1)
C. [0, 1]
D. (-1, 1)
24. Mục đích chính của việc lấy mẫu ngẫu nhiên (random sampling) là gì?
A. Tiết kiệm chi phí và thời gian thu thập dữ liệu.
B. Đảm bảo mẫu đại diện cho tổng thể và giảm thiểu thiên vị (bias).
C. Tăng kích thước mẫu để cải thiện độ chính xác.
D. Làm cho dữ liệu dễ phân tích hơn.
25. Nếu hai biến cố A và B là độc lập, khẳng định nào sau đây là đúng?
A. P(A∩B) = P(A) + P(B)
B. P(A∩B) = P(A) * P(B)
C. P(A|B) = P(B|A)
D. P(A∪B) = P(A) * P(B)
26. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) α thường được chọn là bao nhiêu?
A. 0.1
B. 0.5
C. 0.05
D. 1.0
27. Trong thống kê mô tả, `phương sai` (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Độ lệch trung bình tuyệt đối của dữ liệu.
C. Mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất của dữ liệu.
28. Phương pháp nào sau đây KHÔNG phải là một phương pháp lấy mẫu ngẫu nhiên?
A. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
B. Lấy mẫu phân tầng (Stratified sampling).
C. Lấy mẫu cụm (Cluster sampling).
D. Lấy mẫu thuận tiện (Convenience sampling).
29. Trong phân tích phương sai (ANOVA), mục đích chính là:
A. So sánh phương sai của hai mẫu.
B. So sánh trung bình của hai mẫu.
C. So sánh trung bình của ba hoặc nhiều hơn nhóm độc lập.
D. Phân tích mối quan hệ giữa hai biến định lượng.
30. Giá trị kỳ vọng (expected value) của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng các giá trị có thể của biến.
B. Giá trị trung bình của các giá trị có thể.
C. Tổng của tích mỗi giá trị với xác suất tương ứng của nó.
D. Giá trị xuất hiện nhiều nhất của biến.