1. Trong kiểm định khi bình phương (Chi-squared test), kiểm định tính độc lập được sử dụng để làm gì?
A. Kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết.
B. Kiểm tra sự khác biệt giữa trung bình của hai nhóm.
C. Kiểm tra xem có mối liên hệ giữa hai biến định tính hay không.
D. Ước lượng khoảng tin cậy cho một tham số.
2. Trong phân tích dữ liệu lớn (Big Data), kỹ thuật `khai phá dữ liệu` (data mining) thường sử dụng thống kê để làm gì?
A. Mô tả đặc điểm cơ bản của dữ liệu.
B. Ước lượng tham số tổng thể.
C. Phát hiện các mẫu, xu hướng và tri thức ẩn trong lượng lớn dữ liệu.
D. Kiểm định giả thuyết thống kê.
3. Trong thống kê kinh doanh, `nghiên cứu thị trường` chủ yếu sử dụng loại thống kê nào?
A. Thống kê mô tả và thống kê suy luận
B. Chỉ thống kê mô tả
C. Chỉ thống kê suy luận
D. Không sử dụng thống kê
4. Loại dữ liệu nào sau đây là dữ liệu định tính?
A. Doanh thu hàng tháng của một công ty.
B. Mức độ hài lòng của khách hàng (rất hài lòng, hài lòng, không hài lòng).
C. Số lượng nhân viên trong một bộ phận.
D. Giá cổ phiếu của một công ty niêm yết.
5. Trong phân tích hồi quy tuyến tính đơn giản, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh yếu của mối quan hệ nhân quả giữa biến độc lập và biến phụ thuộc.
B. Tỷ lệ phần trăm phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ dốc của đường hồi quy tuyến tính.
D. Sai số chuẩn của các hệ số hồi quy.
6. Thống kê mô tả KHÔNG bao gồm loại phép đo lường nào sau đây?
A. Trung bình cộng
B. Độ lệch chuẩn
C. Khoảng tin cậy
D. Trung vị
7. Một nhà quản lý muốn so sánh mức độ hài lòng trung bình của khách hàng đối với ba sản phẩm khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t hai mẫu
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính
D. Tương quan Pearson
8. Khi nào thì kiểm định t (t-test) một mẫu được sử dụng?
A. So sánh trung bình của hai mẫu độc lập.
B. So sánh trung bình của một mẫu với một giá trị đã biết của tổng thể.
C. Kiểm tra mối quan hệ giữa hai biến định lượng.
D. Phân tích phương sai giữa nhiều nhóm.
9. Trong phân tích bảng chéo (crosstabulation), chúng ta thường sử dụng thống kê nào để đo lường mối liên hệ giữa các biến định tính?
A. Hệ số tương quan Pearson
B. Hệ số Cramer`s V
C. Độ lệch chuẩn
D. Trung bình cộng
10. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
C. Mức độ ý nghĩa thống kê của kết quả kiểm định.
D. Sai số loại I (bác bỏ giả thuyết null khi nó đúng).
11. Trong phân tích độ tin cậy của thang đo (scale reliability analysis), hệ số Cronbach`s Alpha được sử dụng để đánh giá điều gì?
A. Độ giá trị nội dung của thang đo.
B. Độ giá trị tiêu chuẩn của thang đo.
C. Độ tin cậy nội tại (internal consistency) của thang đo.
D. Độ ổn định theo thời gian (test-retest reliability) của thang đo.
12. Biến ngẫu nhiên rời rạc khác với biến ngẫu nhiên liên tục ở điểm nào?
A. Biến rời rạc chỉ nhận giá trị nguyên, biến liên tục nhận giá trị thập phân.
B. Biến rời rạc có thể đếm được số giá trị có thể, biến liên tục có vô số giá trị trong một khoảng.
C. Biến rời rạc thường biểu diễn dữ liệu định tính, biến liên tục biểu diễn dữ liệu định lượng.
D. Biến rời rạc tuân theo phân phối nhị thức, biến liên tục tuân theo phân phối chuẩn.
13. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ mạnh yếu của mối quan hệ nhân quả giữa hai biến.
B. Độ dốc của đường hồi quy tuyến tính.
C. Mức độ liên kết tuyến tính giữa hai biến định lượng.
D. Tỷ lệ phần trăm phương sai chung giữa hai biến.
14. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi cỡ mẫu lớn (n > 30).
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ, dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ).
D. Khi cần tính toán khoảng tin cậy.
15. Trong phân tích chuỗi thời gian, thành phần nào sau đây KHÔNG được xem xét?
A. Xu hướng (Trend)
B. Tính mùa vụ (Seasonality)
C. Tính ngẫu nhiên (Randomness)
D. Tính đồng biến (Collinearity)
16. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Trung bình của tất cả các nhóm là khác nhau.
B. Phương sai của tất cả các nhóm là bằng nhau.
C. Trung bình của ít nhất một cặp nhóm khác nhau.
D. Trung bình của tất cả các nhóm là bằng nhau.
17. Mục đích chính của việc chuẩn hóa dữ liệu (standardization) trong phân tích thống kê là gì?
A. Chuyển đổi dữ liệu định tính thành dữ liệu định lượng.
B. Loại bỏ giá trị ngoại lai khỏi dữ liệu.
C. Đưa các biến có đơn vị đo lường khác nhau về cùng một thang đo để so sánh và phân tích.
D. Đảm bảo dữ liệu tuân theo phân phối chuẩn.
18. Khi báo cáo kết quả kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là bao nhiêu trong kinh tế và kinh doanh?
A. 0.1
B. 0.05
C. 0.01
D. Tùy thuộc vào kích thước mẫu
19. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán hoặc biến động của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
D. Vị trí trung tâm của dữ liệu.
20. Giả sử bạn muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp thống kê nào sau đây sẽ hữu ích nhất?
A. Thống kê mô tả
B. Phân tích hồi quy
C. Kiểm định giả thuyết
D. Phân tích phương sai
21. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật lấy mẫu xác suất?
A. Lấy mẫu ngẫu nhiên đơn giản
B. Lấy mẫu phân tầng
C. Lấy mẫu cụm
D. Lấy mẫu thuận tiện
22. Sai số loại II (Type II error) trong kiểm định giả thuyết thống kê xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện cho tổng thể.
D. Tính toán sai giá trị thống kê kiểm định.
23. Biểu đồ hộp (boxplot) thường được sử dụng để làm gì?
A. Hiển thị tần số của các giá trị trong dữ liệu.
B. So sánh trung bình giữa các nhóm.
C. Tóm tắt phân phối của một biến định lượng, bao gồm trung vị, tứ phân vị và giá trị ngoại lai.
D. Hiển thị mối quan hệ giữa hai biến định lượng.
24. Trong phân tích rủi ro tài chính, `Giá trị chịu rủi ro` (Value at Risk - VaR) là một ví dụ về ứng dụng của thống kê nào?
A. Thống kê mô tả
B. Thống kê suy luận
C. Phân tích hồi quy
D. Phân tích chuỗi thời gian
25. Chọn phát biểu ĐÚNG về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối lệch phải.
A. Trung bình = Trung vị = Mốt
B. Trung bình < Trung vị < Mốt
C. Mốt < Trung vị < Trung bình
D. Trung vị < Mốt < Trung bình
26. Ưu điểm chính của việc sử dụng cỡ mẫu lớn trong nghiên cứu thống kê là gì?
A. Giảm chi phí và thời gian thu thập dữ liệu.
B. Tăng độ chính xác và độ tin cậy của ước lượng thống kê.
C. Luôn đảm bảo dữ liệu tuân theo phân phối chuẩn.
D. Loại bỏ hoàn toàn sai số ngẫu nhiên.
27. Phân phối chuẩn (Normal distribution) có đặc điểm quan trọng nào sau đây?
A. Dữ liệu luôn tập trung hoàn toàn ở giá trị trung bình.
B. Có dạng bất đối xứng và lệch về bên phải.
C. Có dạng hình chuông đối xứng, trung bình, trung vị và mốt bằng nhau.
D. Phù hợp nhất cho dữ liệu định tính.
28. Phương pháp nào sau đây thường được sử dụng để dự báo chuỗi thời gian ngắn hạn khi có tính mùa vụ?
A. Mô hình ARMA
B. Trung bình trượt theo mùa vụ (Seasonal Moving Average)
C. Hồi quy tuyến tính
D. Phân tích hồi quy đa biến
29. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh mẽ giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập với nhau.
C. Phương sai của sai số không đồng nhất.
D. Mô hình hồi quy không phù hợp với dữ liệu.
30. Khi nào thì nên sử dụng phân tích hồi quy logistic thay vì hồi quy tuyến tính thông thường?
A. Khi biến độc lập là định tính.
B. Khi biến phụ thuộc là định tính và có hai giá trị (nhị phân).
C. Khi dữ liệu không tuân theo phân phối chuẩn.
D. Khi có hiện tượng đa cộng tuyến.