1. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình nhóm đều khác nhau
B. Ít nhất một cặp trung bình nhóm khác nhau
C. Tất cả các trung bình nhóm đều bằng nhau
D. Phương sai giữa các nhóm lớn hơn phương sai trong nhóm
2. Biến ngẫu nhiên rời rạc là biến ngẫu nhiên có tập giá trị:
A. Liên tục trên một khoảng
B. Đếm được hoặc hữu hạn
C. Bất kỳ giá trị thực nào
D. Luôn là số nguyên dương
3. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng:
A. Trung bình mẫu luôn bằng trung bình quần thể
B. Phương sai mẫu luôn bằng phương sai quần thể
C. Phân phối của trung bình mẫu tiến tới phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể dạng phân phối của quần thể
D. Phân phối của mẫu luôn giống phân phối của quần thể
4. Trong hồi quy tuyến tính đơn giản, hệ số góc (slope) biểu thị:
A. Giá trị trung bình của biến phụ thuộc
B. Mức độ phân tán của dữ liệu quanh đường hồi quy
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị
D. Giá trị của biến phụ thuộc khi biến độc lập bằng 0
5. Công thức Bayes` Theorem được sử dụng để tính:
A. Xác suất biên
B. Xác suất đồng thời
C. Xác suất có điều kiện
D. Xác suất tích lũy
6. Khái niệm nào sau đây liên quan đến việc đo lường mức độ phù hợp của dữ liệu mẫu với một phân phối lý thuyết?
A. Hồi quy tuyến tính
B. Kiểm định giả thuyết
C. Kiểm định tính phù hợp (Goodness-of-fit test)
D. Phân tích phương sai
7. Hệ số tương quan Pearson đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
B. Mức độ phù hợp của mô hình hồi quy tuyến tính
C. Sự khác biệt giữa trung bình của hai mẫu
D. Độ phân tán của dữ liệu xung quanh trung bình
8. Độ đo nào sau đây thể hiện mức độ biến động tương đối của dữ liệu so với trung bình?
A. Phương sai
B. Độ lệch chuẩn
C. Hệ số biến thiên
D. Khoảng tứ phân vị
9. Trong phân tích thời gian sống (survival analysis), hàm sống (survival function) S(t) biểu thị:
A. Xác suất một cá nhân chết tại thời điểm t
B. Xác suất một cá nhân sống sót ít nhất đến thời điểm t
C. Thời gian sống trung bình của quần thể
D. Tỷ lệ tử vong tại thời điểm t
10. Trong một phân phối chuẩn, khoảng tin cậy 95% tương ứng với khoảng cách bao nhiêu độ lệch chuẩn so với trung bình?
A. Khoảng 1.645 độ lệch chuẩn
B. Khoảng 1.96 độ lệch chuẩn
C. Khoảng 2.576 độ lệch chuẩn
D. Khoảng 3 độ lệch chuẩn
11. Đại lượng nào sau đây **không** phải là một độ đo xu hướng trung tâm?
A. Trung bình cộng
B. Trung vị
C. Độ lệch chuẩn
D. Mốt
12. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến định lượng liên tục
B. Biến định lượng rời rạc
C. Biến định tính nhị phân (binary)
D. Biến định tính đa danh mục (categorical)
13. Loại biểu đồ nào thích hợp nhất để thể hiện phân phối tần số của một biến định lượng liên tục?
A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ histogram
D. Biểu đồ hộp
14. Biến định tính (categorical variable) còn được gọi là:
A. Biến liên tục
B. Biến định lượng
C. Biến phân loại
D. Biến thứ bậc
15. Trong phân tích cụm (cluster analysis), mục tiêu chính là:
A. Dự đoán giá trị của biến phụ thuộc
B. Phân loại dữ liệu vào các nhóm dựa trên tính tương đồng
C. Kiểm tra giả thuyết về trung bình quần thể
D. Đo lường mối quan hệ tuyến tính giữa các biến
16. Giá trị kỳ vọng (expected value) của một biến ngẫu nhiên rời rạc được tính bằng:
A. Tổng các giá trị có thể của biến
B. Giá trị có khả năng xảy ra cao nhất
C. Trung bình cộng của các giá trị
D. Tổng của tích mỗi giá trị với xác suất tương ứng của nó
17. Trong phân tích hồi quy bội (multiple regression), hệ số xác định R-bình phương (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy
C. Ý nghĩa thống kê của từng biến độc lập
D. Độ dốc của đường hồi quy đa chiều
18. Trong thống kê suy diễn, mục tiêu chính là:
A. Mô tả đặc điểm của mẫu dữ liệu
B. Thu thập dữ liệu từ quần thể
C. Đưa ra kết luận về quần thể dựa trên thông tin từ mẫu
D. Tính toán các độ đo thống kê mô tả
19. Phân phối nào sau đây là phân phối xác suất liên tục?
A. Phân phối nhị thức
B. Phân phối Poisson
C. Phân phối chuẩn
D. Phân phối Bernoulli
20. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) α thường được chọn là 0.05. Điều này có nghĩa là:
A. Xác suất mắc sai số loại II là 5%
B. Xác suất chấp nhận giả thuyết null khi nó đúng là 95%
C. Xác suất mắc sai số loại I là 5%
D. Xác suất bác bỏ giả thuyết null khi nó sai là 95%
21. Phương pháp thống kê nào thường được sử dụng để so sánh tỷ lệ giữa hai nhóm độc lập?
A. Kiểm định t cặp đôi
B. Kiểm định Chi-bình phương về tính độc lập
C. Kiểm định t độc lập
D. Phân tích phương sai hai yếu tố
22. Khi kích thước mẫu tăng lên, độ rộng của khoảng tin cậy (confidence interval) sẽ:
A. Tăng lên
B. Giảm xuống
C. Không đổi
D. Thay đổi không theo quy luật
23. Độ đo nào sau đây không bị ảnh hưởng bởi giá trị ngoại lai (outlier) trong tập dữ liệu?
A. Trung bình cộng
B. Độ lệch chuẩn
C. Trung vị
D. Phương sai
24. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện hiếm trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối nhị thức
B. Phân phối Poisson
C. Phân phối chuẩn
D. Phân phối mũ
25. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình mẫu với trung bình quần thể?
A. Khi kích thước mẫu lớn (n > 30)
B. Khi phương sai quần thể đã biết
C. Khi phương sai quần thể chưa biết và kích thước mẫu nhỏ (n < 30)
D. Khi dữ liệu tuân theo phân phối chuẩn
26. Phương pháp lấy mẫu nào đảm bảo mọi phần tử của quần thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu theo cụm
27. Khi nào thì trung bình mẫu (sample mean) là một ước lượng không chệch (unbiased estimator) của trung bình quần thể (population mean)?
A. Luôn luôn
B. Chỉ khi quần thể tuân theo phân phối chuẩn
C. Chỉ khi kích thước mẫu lớn
D. Khi mẫu được lấy ngẫu nhiên từ quần thể
28. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Không bác bỏ giả thuyết null khi nó thực sự sai
C. Chấp nhận giả thuyết đối khi nó thực sự sai
D. Không bác bỏ giả thuyết đối khi nó thực sự đúng
29. Phương pháp nào sau đây được sử dụng để giảm chiều dữ liệu (dimensionality reduction) và tìm ra các thành phần chính giải thích phương sai lớn nhất trong dữ liệu?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Phân tích cụm (Cluster Analysis)
30. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Xác suất quan sát được kết quả mẫu (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng
C. Xác suất giả thuyết đối là đúng
D. Xác suất bác bỏ giả thuyết null khi nó sai