1. Sai số chuẩn của trung bình mẫu (standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Phương sai của mẫu.
2. Khi nào thì nên sử dụng kiểm định t-student thay vì kiểm định z?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
D. Khi dữ liệu tuân theo phân phối chuẩn.
3. Khi thực hiện kiểm định giả thuyết về trung bình quần thể với độ lệch chuẩn quần thể chưa biết và kích thước mẫu nhỏ, phân phối nào được sử dụng để tính giá trị p?
A. Phân phối chuẩn (Z).
B. Phân phối t-Student.
C. Phân phối Chi-bình phương.
D. Phân phối F.
4. Khi nào thì nên sử dụng phép kiểm định Wilcoxon signed-rank test thay vì phép kiểm định t ghép cặp (paired t-test)?
A. Khi kích thước mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc khi quan tâm đến trung vị thay vì trung bình.
D. Khi so sánh hai mẫu độc lập.
5. Khi nào thì nên sử dụng kiểm định Chi-bình phương (Chi-squared test) cho tính độc lập?
A. Khi so sánh trung bình của hai nhóm.
B. Khi kiểm tra sự phù hợp của một phân phối.
C. Khi muốn xác định xem có mối liên hệ giữa hai biến định tính hay không.
D. Khi kiểm tra phương sai của một quần thể.
6. Phương pháp Bootstrap trong thống kê được sử dụng để làm gì?
A. Ước tính tham số quần thể trực tiếp từ dữ liệu mẫu.
B. Ước tính phương sai và khoảng tin cậy của thống kê mẫu bằng cách lấy mẫu lại có hoàn lại từ mẫu gốc.
C. Kiểm định giả thuyết về trung bình quần thể.
D. Phân tích phương sai giữa các nhóm.
7. Trong kiểm định giả thuyết thống kê, mức ý nghĩa (significance level) thường được ký hiệu là α, đại diện cho điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết null khi giả thuyết null là đúng (lỗi loại I).
C. Xác suất chấp nhận giả thuyết null khi giả thuyết null là sai (lỗi loại II).
D. Xác suất bác bỏ giả thuyết null khi giả thuyết null là sai.
8. Trong phân tích hồi quy tuyến tính, hệ số xác định R-squared đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ mạnh mẽ của mối quan hệ tuyến tính.
C. Tỷ lệ phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình hồi quy.
D. Sai số chuẩn của ước lượng hồi quy.
9. Phép thử Bernoulli là một phép thử ngẫu nhiên như thế nào?
A. Có vô số kết quả có thể xảy ra.
B. Chỉ có hai kết quả có thể xảy ra, thường được gọi là `thành công` và `thất bại`.
C. Các kết quả có thể xảy ra là các số thực liên tục.
D. Xác suất của mỗi kết quả là như nhau.
10. Trong lý thuyết xác suất, biến cố sơ cấp là gì?
A. Một tập hợp con của không gian mẫu.
B. Một kết quả duy nhất có thể xảy ra của một phép thử.
C. Một biến cố không thể xảy ra.
D. Một biến cố chắc chắn xảy ra.
11. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ phi tuyến tính giữa các biến.
B. Mối tương quan cao giữa các biến độc lập.
C. Phương sai của sai số thay đổi theo giá trị của biến độc lập.
D. Sự thiếu độc lập giữa các sai số.
12. Trong học máy thống kê, phương pháp K-means clustering thuộc loại học nào?
A. Học có giám sát (supervised learning).
B. Học bán giám sát (semi-supervised learning).
C. Học tăng cường (reinforcement learning).
D. Học không giám sát (unsupervised learning).
13. Trong phân tích dữ liệu thời gian, thành phần xu hướng (trend component) mô tả điều gì?
A. Biến động ngắn hạn và ngẫu nhiên.
B. Mô hình biến động theo chu kỳ cố định (ví dụ, hàng năm).
C. Sự thay đổi dài hạn và có hệ thống trong giá trị trung bình của chuỗi thời gian.
D. Biến động theo mùa.
14. Trong thống kê suy diễn, khoảng tin cậy (confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số quần thể.
B. Một khoảng giá trị mà tham số quần thể có khả năng cao nằm trong đó.
C. Xác suất tham số quần thể nằm trong một khoảng nhất định.
D. Độ lệch chuẩn của tham số quần thể.
15. Ưu điểm chính của việc sử dụng phương pháp phi tham số (non-parametric methods) trong thống kê là gì?
A. Yêu cầu kích thước mẫu lớn hơn phương pháp tham số.
B. Ít bị ảnh hưởng bởi các giả định về phân phối của dữ liệu.
C. Luôn có độ mạnh kiểm định cao hơn phương pháp tham số.
D. Dễ dàng tính toán và giải thích hơn phương pháp tham số.
16. Mô hình hóa Bayesian khác biệt so với mô hình hóa tần suất (frequentist) chủ yếu ở điểm nào?
A. Mô hình Bayesian không sử dụng xác suất.
B. Mô hình Bayesian diễn giải xác suất như mức độ tin cậy vào một sự kiện hoặc tham số, trong khi mô hình tần suất diễn giải xác suất dựa trên tần suất tương đối trong dài hạn.
C. Mô hình tần suất sử dụng định lý Bayes, còn mô hình Bayesian thì không.
D. Mô hình Bayesian chỉ áp dụng cho dữ liệu định tính.
17. Trong thống kê mô tả, `phân vị` (percentile) được sử dụng để làm gì?
A. Đo lường độ phân tán của dữ liệu.
B. Chia dữ liệu thành các phần bằng nhau để xác định vị trí tương đối của một giá trị trong tập dữ liệu.
C. Tính giá trị trung bình của dữ liệu.
D. Xác định giá trị xuất hiện nhiều nhất trong dữ liệu.
18. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ giá trị ngoại lệ khỏi dữ liệu.
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh và phân tích dễ dàng hơn.
C. Làm cho dữ liệu tuân theo phân phối chuẩn.
D. Tăng độ phân tán của dữ liệu.
19. Sai số loại II (Type II error) trong kiểm định giả thuyết thống kê xảy ra khi nào?
A. Bác bỏ giả thuyết null khi giả thuyết null là đúng.
B. Chấp nhận giả thuyết null khi giả thuyết null là đúng.
C. Chấp nhận giả thuyết null khi giả thuyết null là sai.
D. Bác bỏ giả thuyết null khi giả thuyết null là sai.
20. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?
A. Mỗi phần tử trong quần thể có cơ hội được chọn vào mẫu như nhau.
B. Mẫu thu được chắc chắn đại diện cho quần thể.
C. Giảm thiểu sai số lấy mẫu.
D. Đảm bảo tất cả các nhóm con trong quần thể đều được đại diện trong mẫu.
21. Giá trị ngoại lệ (outlier) trong tập dữ liệu là gì?
A. Giá trị xuất hiện nhiều nhất trong dữ liệu.
B. Giá trị nằm ở giữa tập dữ liệu.
C. Giá trị khác biệt đáng kể so với các giá trị còn lại trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
22. Giá trị trung bình của một mẫu số liệu được tính như thế nào?
A. Giá trị xuất hiện nhiều nhất trong mẫu.
B. Giá trị ở giữa mẫu khi mẫu được sắp xếp theo thứ tự.
C. Tổng của tất cả các giá trị trong mẫu chia cho số lượng giá trị.
D. Hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất trong mẫu.
23. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh phương sai của hai quần thể.
B. So sánh trung bình của hai quần thể.
C. So sánh trung bình của ba hoặc nhiều hơn quần thể.
D. Phân tích mối quan hệ tuyến tính giữa các biến.
24. Phân phối chuẩn (Normal distribution) còn được gọi là phân phối nào?
A. Phân phối Poisson.
B. Phân phối nhị thức.
C. Phân phối Gauss.
D. Phân phối mũ.
25. So sánh trung vị và trung bình cộng, phát biểu nào sau đây đúng khi dữ liệu bị lệch phải?
A. Trung vị lớn hơn trung bình cộng.
B. Trung bình cộng và trung vị bằng nhau.
C. Trung bình cộng lớn hơn trung vị.
D. Không có mối quan hệ nhất định giữa trung vị và trung bình cộng.
26. Phân phối Poisson thường được sử dụng để mô hình hóa loại sự kiện nào?
A. Số lần thành công trong một số lượng phép thử cố định.
B. Thời gian cho đến khi xảy ra sự kiện thành công đầu tiên.
C. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian cố định.
D. Kết quả của một phép thử chỉ có hai khả năng.
27. Giá trị p (p-value) trong kiểm định giả thuyết thống kê biểu thị điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất quan sát được kết quả mẫu (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất giả thuyết đối thuyết là đúng.
28. Phương sai mẫu đo lường điều gì?
A. Độ tập trung của dữ liệu xung quanh trung vị.
B. Độ lệch tuyệt đối trung bình của dữ liệu.
C. Độ phân tán của dữ liệu xung quanh giá trị trung bình mẫu.
D. Sự khác biệt giữa giá trị lớn nhất và nhỏ nhất của dữ liệu.
29. Khi thiết kế một nghiên cứu, tăng kích thước mẫu thường có tác động gì đến lực kiểm định (statistical power)?
A. Lực kiểm định giảm.
B. Lực kiểm định không thay đổi.
C. Lực kiểm định tăng.
D. Tác động đến lực kiểm định là không xác định.
30. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ phụ thuộc phi tuyến tính giữa hai biến.
B. Mức độ biến thiên của một biến khi biến kia thay đổi.
C. Mức độ mạnh mẽ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
D. Độ dốc của đường hồi quy tuyến tính giữa hai biến.