1. Khoảng tin cậy (confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số tổng thể.
B. Một khoảng giá trị ước tính có khả năng chứa tham số tổng thể với một mức độ tin cậy nhất định.
C. Mức độ phân tán của dữ liệu mẫu.
D. Xác suất bác bỏ giả thuyết null khi nó đúng.
2. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn trung bình cộng (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lai (outliers).
C. Khi cần tính toán nhanh chóng.
D. Khi dữ liệu là định lượng liên tục.
3. Phân phối chuẩn (Normal distribution) có đặc điểm nào sau đây?
A. Lệch phải (skewed to the right).
B. Lệch trái (skewed to the left).
C. Đối xứng và hình chuông (symmetric and bell-shaped).
D. Dẹt và rộng (flat and wide).
4. Phương pháp lấy mẫu ngẫu nhiên phân tầng (Stratified random sampling) nhằm mục đích gì?
A. Đảm bảo mọi phần tử trong tổng thể đều có cơ hội được chọn như nhau.
B. Chia tổng thể thành các nhóm đồng nhất (strata) và sau đó lấy mẫu ngẫu nhiên từ mỗi nhóm.
C. Chọn mẫu một cách hệ thống theo một khoảng cách đều đặn.
D. Chọn mẫu dựa trên sự thuận tiện của nhà nghiên cứu.
5. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật thống kê mô tả?
A. Tính trung bình (Mean).
B. Vẽ biểu đồ tần số (Histogram).
C. Kiểm định giả thuyết (Hypothesis testing).
D. Tính độ lệch chuẩn (Standard deviation).
6. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Có sự khác biệt đáng kể giữa trung bình của tất cả các nhóm.
B. Tất cả các nhóm đều có phương sai bằng nhau.
C. Trung bình của ít nhất một nhóm khác biệt so với các nhóm còn lại.
D. Không có sự khác biệt đáng kể giữa trung bình của tất cả các nhóm.
7. Ứng dụng của thống kê Bayes (Bayesian statistics) trong kinh doanh là gì?
A. Chỉ giới hạn trong thống kê mô tả.
B. Không có ứng dụng thực tế trong kinh doanh.
C. Cho phép cập nhật niềm tin hoặc xác suất dựa trên dữ liệu mới, hữu ích trong dự báo và ra quyết định.
D. Chỉ phù hợp với dữ liệu định tính.
8. Biến định tính (Qualitative variable) khác với biến định lượng (Quantitative variable) ở điểm nào?
A. Biến định tính có thể đo lường được bằng số, biến định lượng thì không.
B. Biến định tính biểu thị thuộc tính hoặc phẩm chất, biến định lượng biểu thị số lượng.
C. Biến định tính luôn có giá trị lớn hơn biến định lượng.
D. Biến định tính được sử dụng trong thống kê mô tả, biến định lượng trong thống kê suy luận.
9. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó đúng.
D. Bác bỏ giả thuyết null khi nó sai.
10. Trong phân tích hồi quy đa biến (Multiple regression), hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh mẽ của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phần trăm phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Mức độ ý nghĩa thống kê của từng biến độc lập.
D. Độ dốc của đường hồi quy đa biến.
11. Trong phân tích cụm (Cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân loại các đối tượng thành các nhóm (cụm) sao cho các đối tượng trong cùng một cụm tương tự nhau hơn so với các đối tượng trong các cụm khác.
C. Kiểm tra mối quan hệ giữa hai biến.
D. Tóm tắt và mô tả dữ liệu.
12. Trong phân tích hồi quy logistic (Logistic regression), biến phụ thuộc thuộc loại nào?
A. Biến định lượng liên tục.
B. Biến định lượng rời rạc.
C. Biến định tính nhị phân (Binary categorical variable).
D. Biến định tính đa danh mục (Multi-categorical variable).
13. Phương pháp nào sau đây thường được sử dụng để kiểm tra tính độc lập giữa hai biến định tính?
A. Phân tích hồi quy tuyến tính.
B. Kiểm định t (t-test).
C. Kiểm định Chi bình phương (Chi-squared test).
D. Phân tích phương sai (ANOVA).
14. Phân tích chuỗi thời gian (Time series analysis) được sử dụng chủ yếu để làm gì trong kinh doanh?
A. So sánh hiệu quả hoạt động giữa các công ty khác nhau.
B. Dự báo các giá trị tương lai dựa trên dữ liệu quá khứ theo thời gian.
C. Xác định mối quan hệ nhân quả giữa các biến kinh tế.
D. Đo lường mức độ hài lòng của khách hàng.
15. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ thay đổi của một biến khi biến khác thay đổi.
B. Mức độ mạnh mẽ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt trung bình giữa các giá trị quan sát và giá trị dự đoán.
D. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
16. Ưu điểm chính của việc sử dụng biểu đồ hộp (boxplot) là gì?
A. Hiển thị tần số của từng giá trị dữ liệu.
B. Dễ dàng so sánh trung bình giữa các nhóm.
C. Trực quan hóa phân phối dữ liệu, xác định giá trị ngoại lai và các tứ phân vị.
D. Hiển thị xu hướng theo thời gian.
17. Khi nào thì sử dụng kiểm định t ghép cặp (Paired t-test) thay vì kiểm định t hai mẫu độc lập (Independent samples t-test)?
A. Khi so sánh trung bình của hai mẫu độc lập không liên quan đến nhau.
B. Khi so sánh trung bình của hai mẫu có liên quan đến nhau, ví dụ đo lường trước và sau can thiệp trên cùng một đối tượng.
C. Khi so sánh trung bình của nhiều hơn hai nhóm.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
18. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope coefficient) cho biết điều gì?
A. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
B. Mức độ phân tán của dữ liệu xung quanh đường hồi quy.
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
D. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
19. Mục đích của việc chuẩn hóa dữ liệu (data normalization) trước khi phân tích là gì?
A. Loại bỏ giá trị ngoại lai.
B. Chuyển đổi dữ liệu về cùng một thang đo, giúp so sánh và phân tích dữ liệu từ các biến có đơn vị đo khác nhau.
C. Tăng kích thước mẫu.
D. Đảm bảo dữ liệu tuân theo phân phối chuẩn.
20. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu (dimensionality reduction) trong phân tích dữ liệu lớn (Big Data)?
A. Phân tích phương sai (ANOVA).
B. Phân tích thành phần chính (Principal Component Analysis - PCA).
C. Hồi quy tuyến tính (Linear Regression).
D. Kiểm định t (t-test).
21. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả mẫu hoặc kết quả cực đoan hơn, giả định giả thuyết null là đúng.
C. Mức độ ý nghĩa thống kê mong muốn.
D. Xác suất mắc sai số loại II.
22. Khi nào thì sử dụng kiểm định phi tham số (Non-parametric test) thay vì kiểm định tham số (Parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số (ví dụ, phân phối chuẩn) không được đáp ứng, hoặc khi dữ liệu là thứ bậc hoặc thứ tự.
D. Khi cần tính toán nhanh chóng.
23. Phương pháp nào sau đây KHÔNG phải là một biện pháp đo lường xu hướng trung tâm?
A. Trung bình cộng (Mean)
B. Trung vị (Median)
C. Độ lệch chuẩn (Standard Deviation)
D. Mốt (Mode)
24. Trong phân tích rủi ro, độ lệch chuẩn của lợi nhuận đầu tư thường được dùng để đo lường điều gì?
A. Lợi nhuận trung bình kỳ vọng.
B. Rủi ro hoặc độ biến động của lợi nhuận.
C. Khả năng sinh lời của khoản đầu tư.
D. Giá trị hiện tại ròng của khoản đầu tư.
25. Mục đích chính của việc lấy mẫu thống kê trong kinh doanh là gì?
A. Thu thập dữ liệu từ toàn bộ tổng thể để đảm bảo tính chính xác tuyệt đối.
B. Tiết kiệm thời gian và chi phí trong khi vẫn thu được thông tin đáng tin cậy về tổng thể.
C. Tăng độ phức tạp của phân tích dữ liệu.
D. Loại bỏ hoàn toàn sai số trong quá trình nghiên cứu.
26. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy (confidence interval)?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm đi.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không có mối quan hệ nhất định giữa kích thước mẫu và độ rộng khoảng tin cậy.
27. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở đâu?
A. Chia đều ở cả hai đuôi của phân phối.
B. Chỉ ở một đuôi của phân phối (hoặc đuôi bên phải hoặc đuôi bên trái).
C. Nằm ở trung tâm của phân phối.
D. Vùng bác bỏ không tồn tại trong kiểm định một đuôi.
28. Sai số lấy mẫu (Sampling error) phát sinh do đâu?
A. Lỗi trong quá trình nhập liệu dữ liệu.
B. Việc chọn mẫu không đại diện cho tổng thể.
C. Lỗi trong thiết kế bảng câu hỏi.
D. Thiên vị của người phỏng vấn.
29. Trong kiểm định giả thuyết, mức ý nghĩa (significance level, α) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Có 5% xác suất giả thuyết null là đúng.
B. Có 5% xác suất mắc sai số loại II.
C. Chúng ta sẵn sàng chấp nhận 5% xác suất mắc sai số loại I (bác bỏ giả thuyết null đúng).
D. Có 95% xác suất giả thuyết null là sai.
30. Thống kê mô tả chủ yếu tập trung vào:
A. Dự đoán các giá trị tương lai.
B. Rút ra kết luận về tổng thể dựa trên mẫu.
C. Tóm tắt và trình bày dữ liệu.
D. Kiểm định các giả thuyết.