1. Trong hồi quy tuyến tính đơn giản, R-bình phương (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa biến độc lập và biến phụ thuộc.
B. Tỷ lệ phương sai trong biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ dốc của đường hồi quy.
D. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
2. Hệ số biến thiên (Coefficient of Variation - CV) là gì?
A. Một thước đo độ lệch trung bình.
B. Một thước đo độ phân tán tương đối, được biểu thị bằng tỷ lệ giữa độ lệch chuẩn và trung bình.
C. Một thước đo độ xiên của phân phối.
D. Một thước đo độ nhọn của phân phối.
3. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Độ dốc của đường hồi quy tuyến tính
B. Mức độ mạnh mẽ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Sự khác biệt giữa trung bình của hai nhóm
D. Tỷ lệ phương sai được giải thích bởi mô hình hồi quy
4. Trong phân tích chuỗi thời gian, thành phần `xu hướng` (trend) đề cập đến điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên.
B. Mô hình biến động lặp đi lặp lại trong khoảng thời gian cố định.
C. Sự thay đổi dài hạn và chung trong dữ liệu theo thời gian.
D. Sự biến động do yếu tố mùa vụ.
5. Sai số Loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Chúng ta bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chúng ta chấp nhận giả thuyết null khi nó thực sự sai.
C. Chúng ta không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Chúng ta bác bỏ giả thuyết null khi nó thực sự sai.
6. Phương pháp nào KHÔNG phải là một kỹ thuật lấy mẫu xác suất?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu theo cụm.
D. Lấy mẫu định mức (Quota sampling).
7. Trong thống kê, `phương sai` (variance) đo lường điều gì?
A. Giá trị trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình, được tính bằng bình phương độ lệch chuẩn.
C. Hình dạng của phân phối dữ liệu.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
8. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh mẽ giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ tuyến tính mạnh mẽ giữa hai hoặc nhiều biến độc lập.
C. Sự không tuyến tính trong mối quan hệ giữa biến độc lập và biến phụ thuộc.
D. Sự tồn tại của giá trị ngoại lai trong dữ liệu.
9. Giá trị tứ phân vị thứ nhất (Q1) phân chia bao nhiêu phần trăm dữ liệu thấp hơn nó?
A. 25%
B. 50%
C. 75%
D. 100%
10. Khi nào thì lấy mẫu phân tầng (Stratified sampling) được ưu tiên sử dụng hơn lấy mẫu ngẫu nhiên đơn giản?
A. Khi quần thể đồng nhất.
B. Khi muốn đảm bảo đại diện cho các nhóm con khác nhau trong quần thể.
C. Khi kích thước quần thể nhỏ.
D. Khi không có danh sách đầy đủ của quần thể.
11. Giá trị trung vị (Median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
12. Khi nào thì trung bình mẫu được coi là một ước tính không chệch (unbiased estimator) của trung bình quần thể?
A. Khi kích thước mẫu đủ lớn.
B. Khi phương sai của quần thể đã biết.
C. Khi giá trị kỳ vọng (expected value) của trung bình mẫu bằng trung bình quần thể.
D. Khi dữ liệu tuân theo phân phối chuẩn.
13. Khi nào thì chúng ta sử dụng kiểm định Chi-bình phương (Chi-squared test) cho tính độc lập?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra mối quan hệ tuyến tính giữa hai biến định lượng.
C. Để kiểm tra xem có mối quan hệ giữa hai biến định tính hay không.
D. Để ước tính khoảng tin cậy cho trung bình quần thể.
14. Phương pháp thống kê nào phù hợp để so sánh trung bình của ba nhóm độc lập trở lên?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính (Linear regression)
D. Kiểm định Chi-bình phương (Chi-squared test)
15. Mục đích chính của thống kê suy diễn (Inferential statistics) là gì?
A. Mô tả và tóm tắt dữ liệu mẫu.
B. Thu thập và tổ chức dữ liệu.
C. Rút ra kết luận về quần thể dựa trên dữ liệu mẫu.
D. Tính toán các thống kê mô tả như trung bình và độ lệch chuẩn.
16. Trong kiểm định giả thuyết, lỗi Loại I (Type I error) xảy ra khi nào?
A. Chúng ta bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chúng ta chấp nhận giả thuyết null khi nó thực sự sai.
C. Chúng ta không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Chúng ta bác bỏ giả thuyết null khi nó thực sự sai.
17. Phương pháp lấy mẫu nào đảm bảo rằng mỗi thành viên của quần thể có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling)
B. Lấy mẫu phân tầng (Stratified sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu theo cụm (Cluster sampling)
18. Chọn phát biểu ĐÚNG về Định lý Giới hạn Trung tâm (Central Limit Theorem).
A. Định lý chỉ áp dụng cho phân phối chuẩn.
B. Định lý nói rằng phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu lớn, bất kể hình dạng phân phối gốc của quần thể.
C. Định lý nói rằng phương sai của mẫu sẽ bằng phương sai của quần thể.
D. Định lý chỉ áp dụng cho kích thước mẫu nhỏ.
19. Phân phối Poisson mô hình hóa điều gì?
A. Số lần thành công trong một số lần thử cố định.
B. Thời gian cho đến sự kiện thành công đầu tiên.
C. Số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Phân phối của trung bình mẫu khi kích thước mẫu lớn.
20. Phân phối chuẩn (Normal distribution) còn được gọi là phân phối nào?
A. Phân phối Poisson
B. Phân phối nhị thức
C. Phân phối Gaussian
D. Phân phối mũ
21. Trong một phân phối lệch phải (skewed to the right), mối quan hệ giữa trung bình, trung vị và mode thường như thế nào?
A. Trung bình < Trung vị < Mode
B. Mode < Trung vị < Trung bình
C. Trung bình ≈ Trung vị ≈ Mode
D. Trung vị < Mode < Trung bình
22. Đơn vị đo lường nào sau đây KHÔNG phải là thước đo độ phân tán?
A. Độ lệch chuẩn.
B. Phương sai.
C. Khoảng tứ phân vị (IQR).
D. Trung vị.
23. Loại biểu đồ nào thích hợp nhất để hiển thị phân phối tần số của dữ liệu định lượng liên tục?
A. Biểu đồ cột (Bar chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ hộp (Box plot)
24. Chọn phát biểu SAI về thống kê mô tả (Descriptive statistics).
A. Thống kê mô tả tóm tắt và mô tả các đặc điểm chính của tập dữ liệu.
B. Thống kê mô tả bao gồm các thước đo như trung bình, trung vị, mode, độ lệch chuẩn.
C. Thống kê mô tả được sử dụng để đưa ra kết luận về quần thể dựa trên mẫu.
D. Biểu đồ tần suất và biểu đồ hộp là các công cụ thống kê mô tả.
25. Độ lệch chuẩn đo lường điều gì?
A. Vị trí trung tâm của dữ liệu
B. Hình dạng phân phối dữ liệu
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
D. Giá trị lớn nhất trong tập dữ liệu
26. Giá trị P (P-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất thu được kết quả quan sát hoặc cực đoan hơn, giả sử giả thuyết null là đúng.
C. Xác suất giả thuyết đối (alternative hypothesis) là đúng.
D. Mức độ quan trọng thực tế của kết quả.
27. Thước đo vị trí trung tâm nào bị ảnh hưởng nhiều nhất bởi các giá trị ngoại lai trong một tập dữ liệu?
A. Trung bình số học
B. Trung vị
C. Mode (Mốt)
D. Trung bình hình học
28. Khoảng tin cậy (Confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số quần thể
B. Một phạm vi giá trị có khả năng chứa tham số quần thể thực sự
C. Xác suất giả thuyết null là đúng
D. Mức độ ý nghĩa thống kê của kết quả
29. Sai số chuẩn (Standard error) của trung bình mẫu ước tính điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số lớn nhất có thể có trong ước tính trung bình mẫu.
30. Kiểm định giả thuyết một đuôi (one-tailed test) được sử dụng khi nào?
A. Khi chúng ta quan tâm đến sự khác biệt theo cả hai hướng (lớn hơn hoặc nhỏ hơn).
B. Khi chúng ta chỉ quan tâm đến sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
C. Khi chúng ta không có giả thuyết cụ thể về hướng của sự khác biệt.
D. Khi kích thước mẫu nhỏ.