1. Sai số loại I trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Bác bỏ giả thuyết null khi nó sai.
2. Hệ số biến thiên (Coefficient of Variation - CV) là gì và nó hữu ích trong trường hợp nào?
A. Một thước đo vị trí trung tâm, hữu ích khi dữ liệu bị lệch.
B. Một thước đo độ phân tán tương đối, hữu ích khi so sánh độ biến động giữa các tập dữ liệu có đơn vị đo hoặc trung bình khác nhau.
C. Một thước đo mối quan hệ tuyến tính, hữu ích trong hồi quy.
D. Một thước đo độ lệch chuẩn, hữu ích khi dữ liệu tuân theo phân phối chuẩn.
3. Khi nào thì nên sử dụng kiểm định t-Student thay vì kiểm định z?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi biết độ lệch chuẩn của quần thể.
C. Khi độ lệch chuẩn của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu tuân theo phân phối nhị thức.
4. Phân phối Poisson thường được sử dụng để mô hình hóa loại hiện tượng nào?
A. Thời gian sống của thiết bị.
B. Số lần thành công trong một số lượng phép thử cố định.
C. Số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Chiều cao của người trưởng thành.
5. Trong thống kê mô tả, trung vị (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở vị trí chính giữa của tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu chia cho số lượng giá trị.
6. Giá trị p (p-value) trong kiểm định giả thuyết có ý nghĩa gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả dữ liệu hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
C. Ngưỡng ý nghĩa thống kê được đặt trước.
D. Kích thước của hiệu ứng.
7. Khi nào thì sử dụng kiểm định Chi-bình phương (Chi-squared test) cho tính độc lập?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra sự khác biệt giữa phương sai.
C. Để kiểm tra xem có mối liên hệ giữa hai biến định tính hay không.
D. Để kiểm tra phân phối chuẩn.
8. Phép thử Bernoulli là gì?
A. Phép thử có nhiều hơn hai kết quả có thể.
B. Phép thử mà các kết quả có thể không đồng khả năng.
C. Phép thử ngẫu nhiên chỉ có hai kết quả có thể, thường được gọi là `thành công` và `thất bại`.
D. Phép thử được lặp lại nhiều lần.
9. Trong lý thuyết xác suất, biến cố sơ cấp là gì?
A. Một tập hợp con của không gian mẫu.
B. Một kết quả duy nhất có thể xảy ra của một phép thử.
C. Một biến cố không thể phân rã thành các biến cố nhỏ hơn.
D. Một biến cố có xác suất bằng 0.
10. Trong kiểm định phi tham số, kiểm định nào sau đây thường được sử dụng để so sánh trung vị của hai nhóm độc lập?
A. Kiểm định t-Student độc lập.
B. Kiểm định ANOVA.
C. Kiểm định Mann-Whitney U (Wilcoxon rank-sum test).
D. Kiểm định Chi-bình phương.
11. Trong thống kê suy luận, `khoảng tin cậy` được sử dụng để làm gì?
A. Tính toán xác suất của một biến cố.
B. Ước lượng một tham số của quần thể dựa trên dữ liệu mẫu.
C. Kiểm định giả thuyết về quần thể.
D. Mô tả dữ liệu mẫu một cách trực quan.
12. Ưu điểm chính của việc sử dụng phương pháp lấy mẫu phân tầng (Stratified Sampling) so với lấy mẫu ngẫu nhiên đơn giản là gì?
A. Dễ thực hiện hơn.
B. Tiết kiệm chi phí hơn.
C. Tăng tính đại diện của mẫu, đặc biệt khi quần thể có các nhóm con (strata) khác biệt.
D. Luôn cho kết quả chính xác hơn.
13. Phân phối chuẩn (phân phối Gaussian) có đặc điểm gì?
A. Bất đối xứng và có hai đỉnh.
B. Đối xứng, hình chuông và được xác định bởi trung bình và độ lệch chuẩn.
C. Luôn luôn rời rạc.
D. Có đuôi bên trái dài hơn đuôi bên phải.
14. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị.
B. Phương sai.
C. Mốt.
D. Khoảng tứ phân vị.
15. Loại biểu đồ nào phù hợp nhất để so sánh phân phối của một biến số giữa các nhóm khác nhau?
A. Biểu đồ đường.
B. Biểu đồ tròn.
C. Biểu đồ hộp (boxplot).
D. Biểu đồ phân tán.
16. Histogram được sử dụng để biểu diễn loại dữ liệu nào?
A. Dữ liệu định tính.
B. Dữ liệu định lượng rời rạc.
C. Dữ liệu định lượng liên tục.
D. Cả dữ liệu định tính và định lượng.
17. Biến định tính (qualitative variable) khác với biến định lượng (quantitative variable) ở điểm nào?
A. Biến định tính có thể đo lường được bằng số, biến định lượng thì không.
B. Biến định tính biểu thị các thuộc tính hoặc phẩm chất, biến định lượng biểu thị số lượng.
C. Biến định tính luôn rời rạc, biến định lượng luôn liên tục.
D. Biến định tính được sử dụng trong thống kê mô tả, biến định lượng trong thống kê suy luận.
18. Phân phối nhị thức (Binomial distribution) mô tả xác suất của điều gì?
A. Số sự kiện xảy ra trong một khoảng thời gian.
B. Thời gian chờ đợi cho sự kiện đầu tiên xảy ra.
C. Số lần thành công trong một số lượng phép thử Bernoulli độc lập cố định.
D. Giá trị của một biến liên tục.
19. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình khác.
C. Tất cả các trung bình quần thể đều bằng nhau.
D. Phương sai của tất cả các quần thể đều khác nhau.
20. Ý nghĩa của `phân phối lấy mẫu` (sampling distribution) là gì?
A. Phân phối của dữ liệu mẫu ban đầu.
B. Phân phối lý thuyết của một thống kê (ví dụ: trung bình mẫu) được tính từ tất cả các mẫu có thể có cùng kích thước được rút ra từ quần thể.
C. Phân phối của quần thể.
D. Phân phối của sai số.
21. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend) đề cập đến điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên.
B. Mô hình dài hạn hoặc hướng đi chung của chuỗi thời gian theo thời gian.
C. Sự biến động theo mùa hoặc chu kỳ.
D. Sự biến động không đều đặn và không thể dự đoán.
22. Ma trận hiệp phương sai (Covariance matrix) được sử dụng chủ yếu trong lĩnh vực nào của thống kê?
A. Thống kê mô tả.
B. Hồi quy tuyến tính đơn biến.
C. Thống kê đa biến và phân tích thành phần chính (PCA).
D. Kiểm định giả thuyết một mẫu.
23. Chọn phát biểu đúng về định lý giới hạn trung tâm (Central Limit Theorem - CLT).
A. CLT chỉ áp dụng cho các phân phối chuẩn.
B. CLT nói rằng trung bình của mẫu sẽ luôn bằng trung bình của quần thể.
C. CLT nói rằng phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể hình dạng phân phối gốc của quần thể.
D. CLT chỉ áp dụng cho các mẫu nhỏ.
24. Trong thống kê Bayes, `prior probability` (xác suất tiên nghiệm) đề cập đến điều gì?
A. Xác suất của dữ liệu quan sát được.
B. Xác suất ban đầu hoặc niềm tin ban đầu về một tham số quần thể trước khi có dữ liệu.
C. Xác suất được tính toán sau khi có dữ liệu.
D. Xác suất của giả thuyết null.
25. Phương pháp Bootstrap trong thống kê là gì?
A. Một phương pháp kiểm định giả thuyết mạnh mẽ.
B. Một kỹ thuật lấy mẫu lại (resampling) từ dữ liệu mẫu ban đầu để ước lượng phân phối lấy mẫu của một thống kê.
C. Một phương pháp giảm chiều dữ liệu.
D. Một thuật toán phân cụm dữ liệu.
26. Phương pháp lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling) đảm bảo điều gì?
A. Mỗi phần tử trong quần thể có cơ hội được chọn khác nhau.
B. Mỗi phần tử trong quần thể có cơ hội được chọn bằng nhau và độc lập với nhau.
C. Các phần tử được chọn theo một quy luật nhất định.
D. Chỉ chọn các phần tử dễ tiếp cận nhất.
27. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của một biến.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Mức độ phù hợp của một mô hình hồi quy.
D. Sự khác biệt giữa trung bình của hai mẫu.
28. Trong phân tích hồi quy tuyến tính, R-squared (R²) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Sai số chuẩn của ước lượng.
D. Giá trị p của mô hình.
29. Độ lệch chuẩn của một mẫu càng nhỏ thì điều gì sau đây càng đúng?
A. Dữ liệu mẫu càng phân tán rộng.
B. Dữ liệu mẫu càng tập trung gần giá trị trung bình.
C. Kích thước mẫu càng lớn.
D. Trung bình mẫu càng gần trung bình quần thể.
30. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giữ nguyên mức độ tin cậy)?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm đi.
C. Độ rộng khoảng tin cậy không thay đổi.
D. Xu hướng thay đổi không xác định.