1. Biến định tính (qualitative variable) còn được gọi là:
A. Biến số
B. Biến liên tục
C. Biến phân loại (categorical variable)
D. Biến định lượng
2. Mức ý nghĩa (alpha, α) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết không khi nó thực sự đúng (lỗi loại I).
C. Xác suất chấp nhận giả thuyết không khi nó thực sự sai (lỗi loại II).
D. Xác suất chấp nhận giả thuyết không khi nó thực sự đúng.
3. Trong biểu đồ hộp (boxplot), `râu` (whiskers) thường kéo dài đến giá trị nào?
A. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
B. Giá trị tứ phân vị thứ nhất (Q1) và tứ phân vị thứ ba (Q3).
C. 1.5 lần khoảng tứ phân vị (IQR) ngoài các tứ phân vị.
D. Giá trị trung bình cộng và trừ độ lệch chuẩn.
4. Khoảng tin cậy là gì?
A. Một giá trị đơn lẻ ước tính cho tham số tổng thể.
B. Một khoảng giá trị mà tham số tổng thể có khả năng cao nằm trong đó.
C. Xác suất mà một thống kê mẫu bằng với tham số tổng thể.
D. Sai số chuẩn của ước lượng.
5. Phương sai đo lường điều gì về phân phối xác suất?
A. Vị trí trung tâm của phân phối.
B. Độ lệch hoặc độ phân tán của phân phối.
C. Hình dạng của phân phối.
D. Xác suất của sự kiện phổ biến nhất.
6. Biến định lượng (quantitative variable) có thể được phân loại thành:
A. Rời rạc và thứ bậc
B. Liên tục và danh nghĩa
C. Rời rạc và liên tục
D. Thứ bậc và danh nghĩa
7. Phân phối Student`s t được sử dụng thay cho phân phối chuẩn khi nào?
A. Khi phương sai tổng thể đã biết.
B. Khi kích thước mẫu lớn (n > 30).
C. Khi kích thước mẫu nhỏ và phương sai tổng thể chưa biết.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
8. Sai số chuẩn của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của dữ liệu gốc.
B. Độ lệch chuẩn của phân phối mẫu của trung bình mẫu.
C. Sai số lớn nhất có thể có trong ước lượng trung bình.
D. Trung bình của các sai số mẫu.
9. Giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất quan sát được kết quả cực đoan như kết quả mẫu, giả sử giả thuyết không là đúng.
C. Xác suất mắc lỗi loại I.
D. Xác suất mắc lỗi loại II.
10. Chọn phát biểu ĐÚNG về mối quan hệ giữa cỡ mẫu và sai số chuẩn:
A. Sai số chuẩn tăng khi cỡ mẫu tăng.
B. Sai số chuẩn giảm khi cỡ mẫu tăng.
C. Sai số chuẩn không phụ thuộc vào cỡ mẫu.
D. Sai số chuẩn tỷ lệ thuận với căn bậc hai của cỡ mẫu.
11. Hồi quy đa biến (Multiple Regression) khác với hồi quy tuyến tính đơn giản ở điểm nào?
A. Hồi quy đa biến sử dụng biến phụ thuộc định tính.
B. Hồi quy đa biến sử dụng nhiều biến độc lập để dự đoán một biến phụ thuộc.
C. Hồi quy đa biến chỉ sử dụng dữ liệu phi tham số.
D. Hồi quy đa biến chỉ sử dụng dữ liệu thời gian.
12. Trong thống kê mô tả, trung vị (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa của tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
13. Phân phối đều (uniform distribution) có đặc điểm gì?
A. Xác suất tập trung ở trung tâm.
B. Tất cả các kết quả trong một khoảng cho trước có xác suất bằng nhau.
C. Hình dạng phân phối hình chuông.
D. Xác suất giảm dần theo cấp số nhân.
14. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Vị trí trung tâm của dữ liệu.
B. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Giá trị lớn nhất trong dữ liệu.
15. Trong phân phối nhị thức, phép thử Bernoulli được lặp lại bao nhiêu lần?
A. 1
B. Vô hạn
C. n lần cố định
D. Tùy thuộc vào kết quả
16. Chọn phát biểu SAI về xác suất:
A. Xác suất của một biến cố luôn nằm trong khoảng từ 0 đến 1.
B. Tổng xác suất của tất cả các biến cố sơ cấp trong không gian mẫu bằng 1.
C. Xác suất có thể là một số âm nếu biến cố rất hiếm khi xảy ra.
D. Xác suất của biến cố không thể xảy ra là 0.
17. Tứ phân vị (quartiles) chia tập dữ liệu đã sắp xếp thành bao nhiêu phần?
A. 2 phần
B. 3 phần
C. 4 phần
D. 5 phần
18. Phân phối chuẩn tắc (Standard Normal Distribution) có trung bình và độ lệch chuẩn lần lượt là:
A. Trung bình = 1, Độ lệch chuẩn = 1
B. Trung bình = 0, Độ lệch chuẩn = 1
C. Trung bình = 0, Độ lệch chuẩn = 0
D. Trung bình = 1, Độ lệch chuẩn = 0
19. Khái niệm nào sau đây mô tả tập hợp tất cả các kết quả có thể có của một thí nghiệm ngẫu nhiên?
A. Biến cố
B. Không gian mẫu
C. Xác suất
D. Phân phối xác suất
20. Khi nào thì việc sử dụng thống kê phi tham số (non-parametric statistics) phù hợp hơn thống kê tham số (parametric statistics)?
A. Khi kích thước mẫu rất lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi các giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi cần ước tính tham số tổng thể.
21. Công thức Bayes được sử dụng để tính xác suất:
A. Xác suất biên (marginal probability).
B. Xác suất có điều kiện (conditional probability).
C. Xác suất đồng thời (joint probability).
D. Xác suất của biến cố hợp (union of events).
22. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối nhị thức
B. Phân phối Poisson
C. Phân phối chuẩn
D. Phân phối đều
23. Chọn phát biểu ĐÚNG về biến ngẫu nhiên rời rạc:
A. Biến ngẫu nhiên rời rạc nhận mọi giá trị trong một khoảng liên tục.
B. Biến ngẫu nhiên rời rạc chỉ nhận một số hữu hạn giá trị hoặc vô hạn đếm được.
C. Biến ngẫu nhiên rời rạc luôn có phân phối chuẩn.
D. Biến ngẫu nhiên rời rạc không có kỳ vọng.
24. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.
25. Trong hồi quy tuyến tính đơn giản, đường hồi quy được tìm bằng cách nào?
A. Bằng mắt thường trên biểu đồ phân tán.
B. Phương pháp bình phương tối thiểu, nhằm cực tiểu hóa tổng bình phương sai số.
C. Phương pháp trung bình di động.
D. Phương pháp trung vị tuyệt đối.
26. Định lý giới hạn trung tâm phát biểu điều gì về phân phối của trung bình mẫu khi kích thước mẫu lớn?
A. Phân phối của trung bình mẫu tiến tới phân phối Poisson.
B. Phân phối của trung bình mẫu tiến tới phân phối chuẩn, bất kể phân phối gốc.
C. Phân phối của trung bình mẫu giống hệt với phân phối gốc.
D. Phân phối của trung bình mẫu trở nên không xác định.
27. Nếu P(A) = 0.4 và P(B) = 0.5, và A và B là các biến cố độc lập, thì P(A và B) bằng bao nhiêu?
A. 0.9
B. 0.2
C. 0.1
D. 0.0
28. Phân phối mũ (exponential distribution) thường được sử dụng để mô hình hóa:
A. Số lần thành công trong một số lần thử cố định.
B. Thời gian giữa các sự kiện trong quá trình Poisson.
C. Chiều cao của người trưởng thành.
D. Điểm số trong một kỳ thi.
29. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến thiên của một biến.
B. Mối quan hệ tuyến tính giữa hai biến định lượng.
C. Mối quan hệ phi tuyến tính giữa hai biến.
D. Sự khác biệt trung bình giữa hai biến.
30. Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc được tính bằng công thức nào?
A. Tổng của tất cả các giá trị có thể có.
B. Giá trị có khả năng xảy ra cao nhất.
C. Trung bình có trọng số của tất cả các giá trị có thể có, với trọng số là xác suất của chúng.
D. Giá trị trung vị của các giá trị có thể có.