1. Khi thực hiện kiểm định giả thuyết một phía (one-tailed test), chúng ta quan tâm đến điều gì?
A. Sự khác biệt theo cả hai hướng (lớn hơn hoặc nhỏ hơn) so với giả thuyết null.
B. Sự khác biệt theo một hướng cụ thể (chỉ lớn hơn hoặc chỉ nhỏ hơn) so với giả thuyết null.
C. Sự khác biệt về phương sai, không phải trung bình.
D. Sự khác biệt giữa hai mẫu độc lập.
2. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả và tóm tắt dữ liệu.
B. Thu thập dữ liệu từ quần thể.
C. Đưa ra kết luận về quần thể dựa trên dữ liệu mẫu.
D. Trình bày dữ liệu bằng biểu đồ và bảng biểu.
3. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ phi tuyến tính giữa các biến.
B. Mối tương quan cao giữa các biến độc lập.
C. Sự thiếu biến quan trọng trong mô hình.
D. Phương sai sai số thay đổi theo giá trị của biến độc lập.
4. Biểu đồ nào sau đây thích hợp nhất để thể hiện tần số của các khoảng giá trị liên tục?
A. Biểu đồ tròn
B. Biểu đồ cột
C. Biểu đồ hộp
D. Biểu đồ tần suất (Histogram)
5. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm định sự khác biệt giữa trung bình của hai quần thể.
B. Kiểm định sự khác biệt giữa phương sai của hai quần thể.
C. Kiểm định sự khác biệt giữa trung bình của ba hoặc nhiều hơn quần thể.
D. Đo lường mối quan hệ tuyến tính giữa các biến.
6. Trong thống kê mô tả, `mốt` (mode) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị chính giữa của tập dữ liệu đã sắp xếp.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
7. Trong phân tích thời gian (time series analysis), thành phần `xu hướng` (trend) mô tả điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên.
B. Mô hình biến động theo mùa lặp đi lặp lại.
C. Sự thay đổi dài hạn và có hệ thống trong dữ liệu theo thời gian.
D. Các sự kiện bất thường hoặc đột biến trong dữ liệu.
8. Sai số chuẩn (Standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số ngẫu nhiên trong quá trình đo lường.
9. Phân phối chuẩn (Normal distribution) còn được gọi là phân phối gì?
A. Phân phối Poisson
B. Phân phối nhị thức
C. Phân phối Gauss
D. Phân phối mũ
10. Phương pháp lấy mẫu phân tầng (stratified sampling) hiệu quả nhất khi nào?
A. Khi quần thể đồng nhất.
B. Khi quần thể được chia thành các nhóm (tầng) khác biệt rõ rệt.
C. Khi không có thông tin về cấu trúc quần thể.
D. Khi muốn lấy mẫu một cách nhanh chóng và dễ dàng.
11. Phương pháp lấy mẫu nào đảm bảo mọi phần tử của quần thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu phân tầng
B. Lấy mẫu cụm
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu thuận tiện
12. Trong kiểm định giả thuyết, mức ý nghĩa (α) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc lỗi loại II là 5%.
B. Xác suất mắc lỗi loại I là 5%.
C. Độ tin cậy của kiểm định là 95%.
D. Giá trị p phải nhỏ hơn 0.05 để bác bỏ giả thuyết null.
13. Hệ số xác định R² trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
14. Loại dữ liệu nào sau đây là dữ liệu định tính?
A. Chiều cao (cm)
B. Cân nặng (kg)
C. Màu sắc yêu thích
D. Thu nhập (VNĐ)
15. Hệ số tương quan Pearson đo lường điều gì giữa hai biến định lượng?
A. Mức độ khác biệt trung bình giữa hai biến.
B. Mức độ phụ thuộc tuyến tính giữa hai biến.
C. Mức độ biến động của một biến.
D. Mức độ phù hợp của mô hình hồi quy.
16. Chọn phát biểu SAI về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối lệch phải (skewed to the right).
A. Trung bình lớn hơn trung vị.
B. Trung vị lớn hơn mốt.
C. Mốt là giá trị lớn nhất.
D. Thứ tự thường là: Mốt < Trung vị < Trung bình.
17. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu rất lớn.
C. Khi các giả định của kiểm định tham số không được thỏa mãn (ví dụ: dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ).
D. Khi muốn ước lượng tham số quần thể.
18. Khoảng tin cậy (Confidence interval) cho trung bình quần thể được sử dụng để làm gì?
A. Tính toán chính xác giá trị trung bình quần thể.
B. Ước lượng một khoảng giá trị mà trung bình quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Kiểm định xem trung bình mẫu có khác biệt đáng kể so với một giá trị cho trước hay không.
D. Xác định độ lệch chuẩn của quần thể.
19. Trong kiểm định giả thuyết thống kê, lỗi loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Chấp nhận giả thuyết đối khi nó đúng.
20. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất giả thuyết đối là đúng.
C. Xác suất quan sát được kết quả thống kê, hoặc kết quả cực đoan hơn, nếu giả thuyết null là đúng.
D. Mức độ ý nghĩa thống kê của kết quả.
21. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với khoảng tin cậy cho trung bình quần thể (với cùng mức độ tin cậy)?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
22. Kiểm định Chi-bình phương (Chi-squared test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. Kiểm định tính độc lập giữa hai biến định tính.
D. Kiểm định sự khác biệt giữa trung bình của nhiều nhóm.
23. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Phương sai
C. Mốt
D. Trung bình
24. Biến ngẫu nhiên rời rạc (discrete random variable) là gì?
A. Biến có thể nhận bất kỳ giá trị nào trong một khoảng liên tục.
B. Biến chỉ có thể nhận một số lượng hữu hạn giá trị hoặc vô hạn đếm được các giá trị.
C. Biến luôn tuân theo phân phối chuẩn.
D. Biến được sử dụng trong hồi quy tuyến tính.
25. Trong thống kê Bayesian, khái niệm `prior` (tiền nghiệm) đề cập đến điều gì?
A. Dữ liệu mẫu thu thập được.
B. Phân phối xác suất của dữ liệu mẫu.
C. Niềm tin ban đầu về tham số quần thể trước khi xem xét dữ liệu mẫu.
D. Phân phối xác suất của tham số quần thể sau khi xem xét dữ liệu mẫu.
26. Giá trị nào sau đây KHÔNG phải là một độ đo của xu hướng trung tâm?
A. Trung bình
B. Trung vị
C. Mốt
D. Độ lệch chuẩn
27. Phương pháp nào sau đây giúp giảm thiểu ảnh hưởng của giá trị ngoại lai (outlier) trong dữ liệu?
A. Tính trung bình cộng.
B. Tính trung vị.
C. Tính mốt.
D. Tính phương sai.
28. Phân phối Poisson thường được sử dụng để mô hình hóa loại sự kiện nào?
A. Chiều cao của người trưởng thành.
B. Số lần tung được mặt ngửa khi tung đồng xu nhiều lần.
C. Số lượng cuộc gọi đến tổng đài trong một giờ.
D. Điểm kiểm tra của học sinh.
29. Trong phân tích dữ liệu, `ngoại suy` (extrapolation) đề cập đến hành động nào?
A. Ước lượng giá trị bên trong phạm vi dữ liệu đã quan sát.
B. Ước lượng giá trị bên ngoài phạm vi dữ liệu đã quan sát.
C. Loại bỏ giá trị ngoại lai khỏi dữ liệu.
D. Chuẩn hóa dữ liệu về thang đo chung.
30. Độ lệch chuẩn của một mẫu được ký hiệu là `s` và độ lệch chuẩn của quần thể được ký hiệu là `σ`. Sự khác biệt chính giữa chúng là gì?
A. Không có sự khác biệt, chúng là ký hiệu khác nhau cho cùng một khái niệm.
B. s là ước lượng của σ dựa trên dữ liệu mẫu.
C. σ luôn lớn hơn s.
D. s luôn lớn hơn σ.