1. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến:
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập với nhau.
C. Sự không tuyến tính trong mối quan hệ giữa các biến.
D. Sự thay đổi phương sai của sai số hồi quy.
2. Phương pháp lấy mẫu phân tầng (Stratified Sampling) được sử dụng khi:
A. Tổng thể quá lớn và không thể tiếp cận hết.
B. Muốn đảm bảo tính đại diện của các nhóm khác nhau trong tổng thể.
C. Không có danh sách đầy đủ các phần tử của tổng thể.
D. Chi phí lấy mẫu cần được giảm thiểu.
3. Biến định tính (Categorical variable) là loại biến:
A. Có thể đo lường bằng số và có thứ tự.
B. Có thể đo lường bằng số và không có thứ tự.
C. Mô tả các đặc điểm hoặc thuộc tính, không phải là số.
D. Luôn có giá trị liên tục.
4. Giá trị ngoại lệ (Outlier) là giá trị:
A. Luôn luôn sai và cần phải loại bỏ.
B. Nằm gần giá trị trung bình.
C. Khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Luôn là giá trị lớn nhất trong tập dữ liệu.
5. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
A. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
B. Mức độ thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên 1 đơn vị.
C. Mức độ phân tán của dữ liệu xung quanh đường hồi quy.
D. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
6. Độ tin cậy (Confidence level) của một khoảng tin cậy thể hiện điều gì?
A. Xác suất tham số tổng thể nằm trong khoảng tin cậy cụ thể đã tính được.
B. Tỷ lệ các khoảng tin cậy được xây dựng từ các mẫu khác nhau mà chứa tham số tổng thể thực sự.
C. Xác suất sai số loại I.
D. Xác suất sai số loại II.
7. Giá trị trung bình cộng (Mean) bị ảnh hưởng nhiều nhất bởi:
A. Số lượng quan sát trong mẫu.
B. Giá trị trung vị (Median).
C. Các giá trị ngoại lệ (Outliers).
D. Độ lệch chuẩn.
8. Chọn phát biểu ĐÚNG về giá trị trung vị (Median):
A. Luôn bằng giá trị trung bình cộng (Mean).
B. Là giá trị xuất hiện nhiều nhất trong dữ liệu.
C. Là giá trị nằm chính giữa tập dữ liệu đã sắp xếp.
D. Bị ảnh hưởng mạnh bởi các giá trị ngoại lệ.
9. Độ lệch chuẩn (Standard Deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung vị.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Vị trí trung tâm của dữ liệu.
D. Hình dạng phân phối của dữ liệu.
10. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với sai số chuẩn của trung bình mẫu?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không đổi.
D. Không có mối quan hệ rõ ràng.
11. Trong các loại thang đo sau, thang đo nào cho phép thực hiện đầy đủ các phép toán số học (cộng, trừ, nhân, chia) một cách có ý nghĩa?
A. Thang đo định danh (Nominal)
B. Thang đo thứ bậc (Ordinal)
C. Thang đo khoảng (Interval)
D. Thang đo tỷ lệ (Ratio)
12. Thống kê mô tả chủ yếu tập trung vào việc:
A. Đưa ra kết luận về tổng thể dựa trên mẫu.
B. Trình bày và tóm tắt dữ liệu.
C. Dự đoán các giá trị tương lai.
D. Kiểm định các giả thuyết về tổng thể.
13. Khi cỡ mẫu tăng lên rất lớn, theo định lý giới hạn trung tâm (Central Limit Theorem), phân phối của trung bình mẫu sẽ tiến gần đến:
A. Phân phối nhị thức.
B. Phân phối Poisson.
C. Phân phối chuẩn.
D. Phân phối đều.
14. Chọn phát biểu SAI về phương sai (Variance):
A. Luôn là một giá trị không âm.
B. Có cùng đơn vị đo với dữ liệu gốc.
C. Đo lường mức độ phân tán của dữ liệu.
D. Là bình phương của độ lệch chuẩn.
15. Sai số lấy mẫu (Sampling error) là:
A. Sai sót do nhập liệu dữ liệu.
B. Sai sót do thiết kế nghiên cứu không tốt.
C. Sự khác biệt tự nhiên giữa thống kê mẫu và tham số tổng thể.
D. Sai sót do tính toán sai.
16. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về phân phối chuẩn.
C. Đưa các biến số về cùng thang đo để so sánh.
D. Tăng kích thước mẫu.
17. Hệ số tương quan (Correlation Coefficient) đo lường điều gì?
A. Mức độ biến thiên của một biến số.
B. Mức độ phụ thuộc tuyến tính giữa hai biến số.
C. Độ mạnh của mối quan hệ nhân quả giữa hai biến số.
D. Sự khác biệt giữa trung bình của hai biến số.
18. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi H0 sai.
B. Bác bỏ giả thuyết H0 khi H0 đúng.
C. Chấp nhận giả thuyết H1 khi H1 sai.
D. Bác bỏ giả thuyết H1 khi H1 đúng.
19. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 đúng.
C. Chấp nhận giả thuyết H0 khi H0 sai.
D. Bác bỏ giả thuyết H1 khi H1 sai.
20. Khoảng tin cậy (Confidence Interval) cung cấp thông tin về:
A. Giá trị chính xác của tham số tổng thể.
B. Ước lượng khoảng cho tham số tổng thể.
C. Mức độ ý nghĩa của kiểm định giả thuyết.
D. Sai số chuẩn của trung bình mẫu.
21. Chọn phát biểu ĐÚNG về mối quan hệ giữa thống kê mẫu và tham số tổng thể:
A. Thống kê mẫu luôn bằng tham số tổng thể.
B. Tham số tổng thể được tính toán trực tiếp từ mẫu.
C. Thống kê mẫu là ước lượng cho tham số tổng thể.
D. Tham số tổng thể luôn được biết trước khi thu thập mẫu.
22. Phương pháp lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling) đảm bảo rằng:
A. Mỗi phần tử trong tổng thể có cơ hội được chọn vào mẫu như nhau.
B. Mẫu thu được chắc chắn đại diện cho tổng thể.
C. Sai số lấy mẫu được loại bỏ hoàn toàn.
D. Việc chọn mẫu dễ dàng và nhanh chóng.
23. Phân phối nhị thức (Binomial Distribution) mô tả số lần thành công trong:
A. Một chuỗi các thử nghiệm độc lập Bernoulli.
B. Một quá trình liên tục theo thời gian.
C. Một tổng thể có kích thước lớn.
D. Một mẫu ngẫu nhiên đơn giản.
24. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất giả thuyết H1 là đúng.
C. Xác suất quan sát được kết quả mẫu (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
D. Xác suất quan sát được kết quả mẫu (hoặc kết quả cực đoan hơn) nếu H1 là đúng.
25. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-squared test)?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để kiểm tra mối quan hệ giữa hai biến định lượng.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự đoán giá trị của một biến số dựa trên biến số khác.
26. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở:
A. Cả hai phía của phân phối.
B. Một phía của phân phối (hoặc phía bên trái hoặc phía bên phải).
C. Chính giữa phân phối.
D. Vùng có mật độ xác suất cao nhất.
27. Trong phân tích phương sai (ANOVA), mục tiêu chính là:
A. Ước lượng phương sai của tổng thể.
B. So sánh phương sai giữa các mẫu.
C. So sánh trung bình của nhiều hơn hai nhóm.
D. Phân tích mối quan hệ giữa hai biến số định lượng.
28. Histogram thường được sử dụng để biểu diễn loại dữ liệu nào?
A. Dữ liệu định tính.
B. Dữ liệu định lượng rời rạc.
C. Dữ liệu định lượng liên tục.
D. Dữ liệu thứ bậc.
29. Mức ý nghĩa (Significance level - α) thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.5
B. 0.1
C. 0.05
D. 1.0
30. Phân phối chuẩn (Normal Distribution) có đặc điểm nào sau đây?
A. Lệch trái.
B. Lệch phải.
C. Đối xứng và hình chuông.
D. Đa đỉnh.