1. Khi nào thì nên sử dụng biểu đồ phân tán (scatter plot)?
A. Để so sánh tần số của các giá trị trong một biến.
B. Để hiển thị phân phối của một biến duy nhất.
C. Để khám phá mối quan hệ giữa hai biến định lượng.
D. Để so sánh trung bình của các nhóm.
2. Trong phân tích chuỗi thời gian, thành phần mùa vụ (seasonal component) thể hiện:
A. Xu hướng dài hạn của chuỗi thời gian.
B. Biến động ngẫu nhiên và không thể dự đoán được.
C. Sự biến động lặp đi lặp lại trong khoảng thời gian cố định (ví dụ: hàng năm, hàng quý, hàng tháng).
D. Sự biến động liên quan đến chu kỳ kinh tế dài hạn.
3. Giá trị P (P-value) trong kiểm định giả thuyết thể hiện:
A. Xác suất giả thuyết rỗng là đúng.
B. Mức ý nghĩa của kiểm định.
C. Xác suất quan sát được kết quả mẫu (hoặc kết quả cực đoan hơn) nếu giả thuyết rỗng là đúng.
D. Sai số loại I.
4. Trong thống kê, `độ tin cậy` (reliability) của một thước đo đề cập đến:
A. Mức độ thước đo đánh giá đúng khái niệm cần đo.
B. Tính nhất quán và ổn định của thước đo khi đo lường lặp lại.
C. Khả năng khái quát hóa kết quả nghiên cứu cho tổng thể.
D. Mức độ phù hợp của thước đo với văn hóa và bối cảnh nghiên cứu.
5. Trong phân tích hồi quy đa biến (multiple regression), hệ số xác định R-squared (R²) cho biết:
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
6. Phân phối chuẩn (Normal Distribution) có đặc điểm nào sau đây?
A. Bất đối xứng và có hai đỉnh.
B. Đối xứng, hình chuông và được xác định bởi trung bình và độ lệch chuẩn.
C. Luôn luôn có trung bình bằng 0 và độ lệch chuẩn bằng 1.
D. Chỉ áp dụng cho dữ liệu rời rạc.
7. Giá trị trung bình cộng (Mean) bị ảnh hưởng nhiều nhất bởi:
A. Số lượng quan sát trong mẫu.
B. Giá trị trung vị của dữ liệu.
C. Các giá trị ngoại lai (outliers).
D. Độ lệch chuẩn của dữ liệu.
8. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để:
A. Dự báo giá trị tương lai.
B. Xác định thành phần xu hướng.
C. Làm mịn chuỗi thời gian và loại bỏ nhiễu ngẫu nhiên.
D. Phân tích thành phần mùa vụ.
9. Trong phân tích dữ liệu, `làm sạch dữ liệu` (data cleaning) là bước:
A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Phân tích dữ liệu bằng các phương pháp thống kê.
C. Xử lý và sửa lỗi dữ liệu, loại bỏ dữ liệu không hợp lệ hoặc thiếu sót.
D. Trình bày kết quả phân tích dữ liệu bằng biểu đồ và báo cáo.
10. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết rỗng khi nó đúng.
B. Không bác bỏ giả thuyết rỗng khi nó sai.
C. Chọn mức ý nghĩa alpha quá cao.
D. Chọn kích thước mẫu quá nhỏ.
11. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) alpha (α) thường được chọn là 0.05. Điều này có nghĩa là:
A. Xác suất mắc sai số loại II là 5%.
B. Xác suất chấp nhận giả thuyết rỗng khi nó sai là 5%.
C. Chúng ta sẵn sàng chấp nhận 5% rủi ro mắc sai số loại I (bác bỏ giả thuyết rỗng khi nó đúng).
D. Xác suất giả thuyết rỗng là đúng là 5%.
12. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số (ví dụ: tính chuẩn) không được đáp ứng.
D. Khi muốn so sánh trung bình của các nhóm.
13. Phương pháp lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) phù hợp khi nào?
A. Khi tổng thể đồng nhất.
B. Khi tổng thể có thể chia thành các nhóm (strata) đồng nhất bên trong nhưng khác biệt giữa các nhóm.
C. Khi không có danh sách đầy đủ về tổng thể.
D. Khi muốn lấy mẫu nhanh chóng và tiện lợi.
14. Thống kê mô tả chủ yếu tập trung vào:
A. Dự báo các xu hướng tương lai.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định các giả thuyết về tổng thể.
D. Ước lượng các tham số của tổng thể.
15. Hệ số tương quan (Correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của một biến.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Độ dốc của đường hồi quy.
16. Biểu đồ hộp (Box plot) thường được sử dụng để:
A. Hiển thị tần số của các giá trị.
B. So sánh trung bình của các nhóm.
C. Tóm tắt và so sánh phân phối của một hoặc nhiều bộ dữ liệu.
D. Hiển thị mối quan hệ giữa hai biến định lượng.
17. Chọn phát biểu SAI về ứng dụng của thống kê trong kinh doanh.
A. Thống kê giúp dự báo doanh số và nhu cầu thị trường.
B. Thống kê hỗ trợ quyết định đầu tư và quản lý rủi ro tài chính.
C. Thống kê chỉ hữu ích cho các doanh nghiệp lớn, không cần thiết cho doanh nghiệp nhỏ.
D. Thống kê được dùng để đánh giá hiệu quả các chiến dịch marketing.
18. Biến định tính (qualitative variable) được chia thành mấy loại chính?
A. Một loại.
B. Hai loại.
C. Ba loại.
D. Bốn loại.
19. Trong phân tích chuỗi thời gian (time series analysis), thành phần xu hướng (trend) thể hiện:
A. Biến động ngắn hạn và ngẫu nhiên.
B. Sự biến động theo mùa.
C. Sự biến động dài hạn và có hệ thống theo thời gian.
D. Sự biến động theo chu kỳ kinh tế.
20. Độ lệch chuẩn (Standard Deviation) đo lường:
A. Giá trị trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mức độ tin cậy của ước lượng.
21. Ưu điểm chính của việc sử dụng dữ liệu thứ cấp (secondary data) là gì?
A. Độ chính xác và phù hợp cao với mục tiêu nghiên cứu cụ thể.
B. Chi phí thu thập thấp và thời gian thu thập nhanh chóng.
C. Kiểm soát hoàn toàn quá trình thu thập dữ liệu.
D. Khả năng khám phá các thông tin mới và độc đáo.
22. Trong phân tích hồi quy tuyến tính đơn, hệ số góc (slope coefficient) cho biết:
A. Giá trị trung bình của biến phụ thuộc.
B. Mức độ phù hợp của mô hình với dữ liệu.
C. Mức thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
D. Sai số chuẩn của ước lượng.
23. Trong phân tích phương sai (ANOVA), mục đích chính là:
A. Kiểm tra mối quan hệ tuyến tính giữa hai biến định lượng.
B. So sánh trung bình của hai tổng thể.
C. So sánh trung bình của ba hoặc nhiều hơn tổng thể.
D. Ước lượng phương sai của một tổng thể.
24. Phương pháp nào sau đây KHÔNG phải là một phương pháp thu thập dữ liệu sơ cấp?
A. Phỏng vấn trực tiếp.
B. Khảo sát bằng bảng hỏi.
C. Quan sát.
D. Nghiên cứu tài liệu đã công bố.
25. Phương pháp hồi quy nào phù hợp nhất khi biến phụ thuộc là biến định tính nhị phân (binary)?
A. Hồi quy tuyến tính đa biến.
B. Hồi quy Logistic.
C. Hồi quy đa thức.
D. Phân tích phương sai (ANOVA).
26. Khoảng tin cậy (Confidence Interval) cung cấp:
A. Một giá trị điểm duy nhất cho tham số tổng thể.
B. Một khoảng giá trị mà trong đó tham số tổng thể có khả năng nằm trong, với một độ tin cậy nhất định.
C. Xác suất tham số tổng thể nằm trong khoảng ước lượng.
D. Sai số chuẩn của ước lượng.
27. Khi kiểm định sự độc lập giữa hai biến định tính, kiểm định nào sau đây thường được sử dụng?
A. Kiểm định t (t-test).
B. Kiểm định F (F-test).
C. Kiểm định Chi bình phương (Chi-square test).
D. Phân tích phương sai (ANOVA).
28. Ý nghĩa của việc kiểm định giả thuyết thống kê là gì?
A. Chắc chắn bác bỏ giả thuyết rỗng.
B. Chắc chắn chấp nhận giả thuyết rỗng.
C. Đưa ra quyết định dựa trên bằng chứng mẫu để bác bỏ hoặc không bác bỏ giả thuyết rỗng.
D. Tìm ra giá trị chính xác của tham số tổng thể.
29. Khi kích thước mẫu (sample size) tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm xuống.
C. Độ rộng khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi của độ rộng khoảng tin cậy.
30. Sai số chuẩn của trung bình mẫu (Standard Error of the Mean) giảm khi:
A. Độ lệch chuẩn của tổng thể tăng.
B. Kích thước mẫu giảm.
C. Kích thước mẫu tăng.
D. Giá trị trung bình mẫu tăng.