1. Phương pháp thống kê nào sau đây thích hợp để kiểm tra xem có mối liên hệ giữa hai biến định tính hay không?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương (Chi-squared test).
D. Phân tích hồi quy tuyến tính.
2. Trong phân tích rủi ro kinh doanh, phân phối xác suất nào sau đây thường được sử dụng để mô hình hóa tần suất xuất hiện của các sự kiện?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối đều.
3. Chỉ số giá tiêu dùng (CPI) là một ví dụ về:
A. Số trung bình cộng giản đơn.
B. Số chỉ số tổng hợp gia quyền.
C. Số chỉ số giá trị.
D. Số tương đối.
4. Giá trị trung bình cộng của một mẫu dữ liệu kinh doanh bị ảnh hưởng mạnh nhất bởi:
A. Kích thước mẫu lớn.
B. Các giá trị ngoại lệ (outliers).
C. Phương sai nhỏ.
D. Dữ liệu phân phối chuẩn.
5. Độ lệch chuẩn (standard deviation) đo lường:
A. Xu hướng trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Mối quan hệ tuyến tính giữa hai biến.
6. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện:
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả mẫu, hoặc kết quả cực đoan hơn, nếu giả thuyết null là đúng.
C. Xác suất mắc sai số loại I.
D. Mức ý nghĩa của kiểm định.
7. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật lấy mẫu xác suất?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu thuận tiện.
8. Trong kinh tế lượng, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi:
A. Có mối tương quan cao giữa biến phụ thuộc và biến độc lập.
B. Có mối tương quan cao giữa các biến độc lập với nhau.
C. Phương sai của sai số thay đổi theo giá trị của biến độc lập.
D. Sai số không tuân theo phân phối chuẩn.
9. Trong phân tích phương sai (ANOVA), mục đích chính là:
A. Ước lượng phương sai của tổng thể.
B. So sánh trung bình của hai tổng thể.
C. So sánh trung bình của ba hoặc nhiều tổng thể.
D. Kiểm tra tính độc lập giữa hai biến định tính.
10. Trong kiểm định giả thuyết về trung bình tổng thể, khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi phương sai tổng thể đã biết.
B. Khi cỡ mẫu lớn (n > 30).
C. Khi cỡ mẫu nhỏ (n < 30) và phương sai tổng thể chưa biết.
D. Khi dữ liệu có phân phối chuẩn.
11. Sai số loại I trong kiểm định giả thuyết thống kê xảy ra khi:
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện.
D. Tính toán sai giá trị p.
12. Trong thống kê suy diễn, mục tiêu chính là:
A. Mô tả đặc điểm của mẫu dữ liệu.
B. Tổng hợp dữ liệu thành bảng và biểu đồ.
C. Đưa ra kết luận về tổng thể dựa trên thông tin từ mẫu.
D. Tính toán các số đo tóm tắt như trung bình và độ lệch chuẩn.
13. Loại biểu đồ nào sau đây thích hợp nhất để hiển thị sự phân phối tần suất của một biến định lượng liên tục?
A. Biểu đồ cột.
B. Biểu đồ tròn.
C. Biểu đồ histogram.
D. Biểu đồ phân tán.
14. Phương pháp nào sau đây KHÔNG phù hợp để xử lý dữ liệu bị thiếu (missing data)?
A. Loại bỏ các quan sát có dữ liệu bị thiếu.
B. Thay thế bằng giá trị trung bình của biến.
C. Thay thế bằng giá trị ngẫu nhiên.
D. Giữ nguyên dữ liệu bị thiếu và tiến hành phân tích.
15. Trong phân tích hồi quy tuyến tính đơn, hệ số góc (slope coefficient) cho biết:
A. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
B. Mức độ biến thiên của biến phụ thuộc khi biến độc lập tăng lên 1 đơn vị.
C. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
D. Sai số chuẩn của các ước lượng hệ số.
16. Phương pháp thống kê nào sau đây thường được sử dụng để dự báo doanh số bán hàng trong tương lai dựa trên dữ liệu doanh số quá khứ?
A. Phân tích hồi quy đa biến.
B. Phân tích chuỗi thời gian.
C. Kiểm định giả thuyết.
D. Thống kê mô tả.
17. Loại biến nào sau đây là biến định tính?
A. Thu nhập hàng tháng (VNĐ).
B. Số lượng sản phẩm bán được.
C. Màu sắc sản phẩm.
D. Chiều cao nhân viên (cm).
18. Ưu điểm chính của việc sử dụng thống kê phi tham số (non-parametric statistics) là gì?
A. Đòi hỏi cỡ mẫu lớn hơn.
B. Giả định ít nghiêm ngặt hơn về phân phối dữ liệu.
C. Luôn có độ mạnh kiểm định cao hơn thống kê tham số.
D. Dễ dàng tính toán bằng tay hơn.
19. Phương pháp nào sau đây thường được sử dụng để khám phá mối quan hệ giữa một biến phụ thuộc định lượng và nhiều biến độc lập (cả định lượng và định tính)?
A. Phân tích tương quan.
B. Phân tích hồi quy tuyến tính đa biến.
C. Kiểm định t (t-test).
D. Phân tích tần suất.
20. Giả sử một công ty muốn khảo sát mức độ hài lòng của khách hàng. Phương pháp lấy mẫu nào sau đây có thể dẫn đến sai lệch chọn mẫu (selection bias) cao nhất?
A. Lấy mẫu ngẫu nhiên đơn giản từ danh sách tất cả khách hàng.
B. Lấy mẫu phân tầng theo nhóm khách hàng (ví dụ: khách hàng mới, khách hàng thân thiết).
C. Lấy mẫu thuận tiện bằng cách phỏng vấn khách hàng tại cửa hàng vào giờ cao điểm.
D. Lấy mẫu hệ thống bằng cách chọn mỗi khách hàng thứ 10 trong danh sách.
21. Nếu hệ số xác định R-squared trong mô hình hồi quy tuyến tính là 0.85, điều này có nghĩa là:
A. 85% biến thiên của biến độc lập được giải thích bởi mô hình.
B. 85% biến thiên của biến phụ thuộc được giải thích bởi mô hình.
C. Mô hình giải thích được 85% tổng biến thiên trong dữ liệu.
D. Sai số chuẩn của mô hình là 85%.
22. Biểu đồ nào sau đây thích hợp nhất để so sánh tỷ lệ phần trăm của các hạng mục trong một tổng thể?
A. Biểu đồ đường.
B. Biểu đồ cột.
C. Biểu đồ tròn.
D. Biểu đồ tần suất.
23. Trong phân tích chuỗi thời gian, thành phần nào sau đây KHÔNG phải là một thành phần chính?
A. Xu hướng (trend).
B. Tính mùa vụ (seasonality).
C. Tính ngẫu nhiên (randomness).
D. Tính đồng nhất (homogeneity).
24. Thống kê mô tả chủ yếu tập trung vào:
A. Dự báo các giá trị tương lai.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định các giả thuyết về tổng thể.
D. Ước lượng các tham số của tổng thể.
25. Khi cỡ mẫu tăng lên, độ rộng của khoảng tin cậy cho trung bình tổng thể (với độ tin cậy không đổi) sẽ:
A. Tăng lên.
B. Giảm xuống.
C. Không đổi.
D. Thay đổi không theo quy luật.
26. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường:
A. Mức độ biến thiên của một biến so với chính nó.
B. Mức độ phụ thuộc tuyến tính giữa hai biến định lượng.
C. Mức độ khác biệt giữa trung bình mẫu và trung bình tổng thể.
D. Mức độ phù hợp của phân phối chuẩn với dữ liệu.
27. Khái niệm nào sau đây liên quan đến việc đo lường độ nhạy của một biến kinh tế đối với sự thay đổi của một biến kinh tế khác?
A. Phương sai.
B. Độ co giãn (elasticity).
C. Độ lệch chuẩn.
D. Tương quan.
28. Khi nào thì trung vị (median) là thước đo xu hướng trung tâm phù hợp hơn trung bình cộng (mean)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có nhiều giá trị ngoại lệ.
C. Khi kích thước mẫu lớn.
D. Khi dữ liệu là dữ liệu định tính.
29. Trong kinh tế học, loại dữ liệu nào sau đây thường được thu thập theo thời gian định kỳ?
A. Dữ liệu chuỗi thời gian.
B. Dữ liệu chéo.
C. Dữ liệu thứ cấp.
D. Dữ liệu định tính.
30. Biến giả (dummy variable) thường được sử dụng trong hồi quy để:
A. Mã hóa các biến định lượng.
B. Mã hóa các biến định tính.
C. Giảm phương sai của sai số.
D. Tăng độ mạnh của tương quan.