1. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi kích thước mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi muốn ước lượng tham số tổng thể.
2. Thống kê mô tả chủ yếu tập trung vào:
A. Dự báo các xu hướng tương lai.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định các giả thuyết về tổng thể.
D. Ước lượng các tham số của tổng thể.
3. Phương pháp nào sau đây KHÔNG phải là một phương pháp lấy mẫu xác suất?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu phán đoán (judgment sampling).
4. Kiểm định Chi-square thường được sử dụng để kiểm tra:
A. Sự khác biệt giữa trung bình của hai mẫu.
B. Sự phù hợp của dữ liệu với một phân phối lý thuyết.
C. Mối quan hệ tuyến tính giữa hai biến định lượng.
D. Phương sai của một tổng thể.
5. Trong thống kê kinh doanh, `phân khúc thị trường` thường liên quan đến việc:
A. Tổng hợp tất cả khách hàng thành một nhóm duy nhất.
B. Chia thị trường thành các nhóm nhỏ hơn, đồng nhất hơn dựa trên các đặc điểm chung.
C. Phân tích dữ liệu tài chính của doanh nghiệp.
D. Dự báo doanh số bán hàng trong tương lai.
6. Hệ số tương quan Pearson đo lường:
A. Mức độ biến động của dữ liệu.
B. Mức độ quan hệ tuyến tính giữa hai biến định lượng.
C. Mức độ phụ thuộc phi tuyến tính giữa hai biến.
D. Mức độ khác biệt giữa trung bình mẫu và trung bình tổng thể.
7. Phân tích SWOT (Điểm mạnh, Điểm yếu, Cơ hội, Thách thức) là một ví dụ của:
A. Thống kê mô tả.
B. Thống kê suy diễn.
C. Thống kê ứng dụng trong quản trị chiến lược.
D. Phân tích hồi quy.
8. Trong marketing, thống kê được sử dụng để phân tích dữ liệu nào sau đây?
A. Dữ liệu tài chính của công ty.
B. Dữ liệu khách hàng, dữ liệu thị trường, dữ liệu quảng cáo.
C. Dữ liệu sản xuất và vận hành.
D. Dữ liệu nhân sự.
9. Biểu đồ hộp (boxplot) thích hợp nhất để:
A. Hiển thị tần số của các giá trị.
B. So sánh phân phối của một biến số giữa các nhóm khác nhau.
C. Hiển thị mối quan hệ giữa hai biến định lượng.
D. Theo dõi sự thay đổi của dữ liệu theo thời gian.
10. Sai số loại I trong kiểm định giả thuyết xảy ra khi:
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Chấp nhận giả thuyết đối khi nó sai.
11. Trong kiểm định giả thuyết, `mức ý nghĩa` (significance level) thường được ký hiệu là:
A. β (beta).
B. p (p-value).
C. α (alpha).
D. R² (R-squared).
12. Giá trị trung bình (mean) của một biến số là thước đo:
A. Độ phân tán của dữ liệu.
B. Vị trí trung tâm của dữ liệu.
C. Hình dạng phân phối của dữ liệu.
D. Mức độ tương quan với biến số khác.
13. `Phương sai` (variance) đo lường điều gì về một tập dữ liệu?
A. Vị trí trung tâm.
B. Độ lệch chuẩn.
C. Độ phân tán hoặc sự biến động của dữ liệu xung quanh giá trị trung bình.
D. Mức độ bất đối xứng của phân phối.
14. Phân tích phương sai (ANOVA) thường được sử dụng để:
A. Kiểm tra mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm độc lập.
C. So sánh trung bình của ba hoặc nhiều hơn nhóm độc lập.
D. Đo lường độ phân tán của dữ liệu.
15. Mục tiêu chính của phân tích hồi quy đa biến là:
A. Dự đoán một biến phụ thuộc dựa trên một biến độc lập.
B. Dự đoán một biến phụ thuộc dựa trên nhiều biến độc lập.
C. Mô tả phân phối của một biến số.
D. So sánh trung bình của các nhóm khác nhau.
16. Giá trị trung vị (median) của một tập dữ liệu không bị ảnh hưởng bởi:
A. Các giá trị ngoại lệ (outliers).
B. Số lượng quan sát trong tập dữ liệu.
C. Sắp xếp thứ tự của dữ liệu.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
17. Khoảng tin cậy 95% cho trung bình tổng thể có nghĩa là:
A. 95% các giá trị dữ liệu nằm trong khoảng này.
B. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
C. Chúng ta tin tưởng 95% rằng trung bình tổng thể nằm trong khoảng này.
D. Khoảng này chứa 95% trung bình mẫu có thể.
18. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là:
A. Loại bỏ các giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh.
C. Tăng kích thước mẫu.
D. Mã hóa dữ liệu định tính.
19. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của tổng thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu cụm.
20. Khi cỡ mẫu tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm xuống.
C. Độ rộng khoảng tin cậy không đổi.
D. Không có mối quan hệ rõ ràng.
21. Trong phân tích dữ liệu định tính, mã hóa (coding) là quá trình:
A. Chuyển đổi dữ liệu định tính thành dữ liệu định lượng.
B. Phân tích dữ liệu số bằng phần mềm thống kê.
C. Gắn nhãn và phân loại các đoạn văn bản hoặc dữ liệu định tính khác.
D. Thu thập dữ liệu định tính từ phỏng vấn và khảo sát.
22. Khi mức ý nghĩa (alpha) giảm từ 0.05 xuống 0.01, điều gì xảy ra với khả năng mắc sai số loại I?
A. Khả năng mắc sai số loại I tăng lên.
B. Khả năng mắc sai số loại I giảm xuống.
C. Khả năng mắc sai số loại I không đổi.
D. Không thể xác định được sự thay đổi.
23. Trong phân tích hồi quy tuyến tính đơn giản, biến độc lập còn được gọi là:
A. Biến phụ thuộc.
B. Biến giải thích.
C. Biến kiểm soát.
D. Biến trung gian.
24. Sai số loại II trong kiểm định giả thuyết còn được gọi là:
A. Lỗi dương tính giả.
B. Lỗi âm tính giả.
C. Lỗi ngẫu nhiên.
D. Lỗi hệ thống.
25. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend) mô tả:
A. Sự biến động ngắn hạn trong dữ liệu.
B. Mô hình biến động theo mùa.
C. Sự thay đổi dài hạn và có hệ thống trong dữ liệu.
D. Các sự kiện bất thường hoặc ngẫu nhiên.
26. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để:
A. Phát hiện xu hướng dài hạn.
B. Làm mịn dữ liệu và loại bỏ nhiễu ngắn hạn.
C. Dự báo giá trị tương lai dựa trên dữ liệu lịch sử.
D. Xác định các thành phần mùa vụ.
27. Phương pháp phân tích nào thường được sử dụng để khám phá cấu trúc ẩn bên trong một tập dữ liệu đa biến, ví dụ như giảm số chiều dữ liệu?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định Chi-square.
28. Đa cộng tuyến (multicollinearity) trong hồi quy đa biến đề cập đến:
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập với nhau.
C. Sự biến động lớn trong biến phụ thuộc.
D. Sự thiếu tương quan giữa các biến.
29. Trong mô hình hồi quy, hệ số xác định R-squared đo lường:
A. Độ mạnh của mối quan hệ tuyến tính.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình.
C. Mức độ ý nghĩa thống kê của mô hình.
D. Sai số chuẩn của các hệ số hồi quy.
30. Giá trị P (p-value) trong kiểm định giả thuyết biểu thị:
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả mẫu hoặc kết quả cực đoan hơn nếu giả thuyết null là đúng.
C. Xác suất mắc sai số loại I.
D. Mức ý nghĩa của kiểm định.