1. Thống kê suy luận (Inferential statistics) chủ yếu tập trung vào:
A. Tóm tắt dữ liệu mẫu.
B. Trình bày dữ liệu bằng biểu đồ.
C. Đưa ra kết luận hoặc dự đoán về quần thể dựa trên dữ liệu mẫu.
D. Tính toán các thống kê mô tả.
2. Trong thống kê mô tả, `tứ phân vị` được sử dụng để:
A. Đo lường xu hướng trung tâm của dữ liệu.
B. Chia dữ liệu thành bốn phần bằng nhau.
C. Tính tổng các giá trị lớn nhất và nhỏ nhất.
D. Xác định giá trị trung bình cộng.
3. Chọn phát biểu ĐÚNG về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối lệch phải (skewed to the right):
A. Trung bình < Trung vị < Mốt
B. Trung bình = Trung vị = Mốt
C. Mốt < Trung vị < Trung bình
D. Trung vị < Mốt < Trung bình
4. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện.
D. Tính toán sai giá trị p.
5. Thang đo thứ bậc (Ordinal scale) là loại thang đo:
A. Không có thứ tự giữa các giá trị.
B. Chỉ ra thứ tự hoặc xếp hạng, nhưng không có khoảng cách bằng nhau giữa các bậc.
C. Có khoảng cách bằng nhau và điểm gốc 0 tuyệt đối.
D. Chỉ dùng cho dữ liệu định lượng.
6. Phân phối Poisson thường được sử dụng để mô hình hóa:
A. Số lần thành công trong một số lần thử cố định.
B. Số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Biến liên tục có dạng hình chuông.
D. Xác suất của hai kết quả có thể xảy ra.
7. Giả thuyết null (Null hypothesis) trong kiểm định giả thuyết thường là:
A. Giả thuyết mà nhà nghiên cứu muốn chứng minh là đúng.
B. Giả thuyết về sự khác biệt hoặc mối quan hệ.
C. Giả thuyết về sự không khác biệt hoặc không có mối quan hệ.
D. Giả thuyết luôn luôn đúng.
8. Biến định tính (Qualitative variable) là loại biến:
A. Có thể đo lường bằng số.
B. Biểu thị đặc điểm hoặc thuộc tính.
C. Luôn có giá trị liên tục.
D. Chỉ được sử dụng trong thống kê mô tả.
9. Phân phối chuẩn (Normal distribution) còn được gọi là:
A. Phân phối Poisson
B. Phân phối nhị thức (Binomial distribution)
C. Phân phối hình chuông (Bell curve)
D. Phân phối đều (Uniform distribution)
10. Phương pháp lấy mẫu nào đảm bảo mỗi cá thể trong quần thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling)
B. Lấy mẫu phân tầng (Stratified sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu cụm (Cluster sampling)
11. Chọn phát biểu ĐÚNG về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối đối xứng (symmetrical distribution):
A. Trung bình < Trung vị < Mốt
B. Trung bình = Trung vị = Mốt
C. Mốt < Trung vị < Trung bình
D. Trung vị < Mốt < Trung bình
12. Khi kích thước mẫu tăng lên, độ rộng của khoảng tin cậy (với độ tin cậy không đổi) thường:
A. Tăng lên
B. Giảm xuống
C. Không đổi
D. Thay đổi không theo quy luật
13. Thống kê mô tả (Descriptive statistics) chủ yếu tập trung vào:
A. Đưa ra kết luận về quần thể dựa trên mẫu.
B. Tóm tắt và trình bày dữ liệu.
C. Kiểm định giả thuyết về quần thể.
D. Dự đoán giá trị tương lai.
14. Thang đo tỷ lệ (Ratio scale) là loại thang đo:
A. Không có thứ tự và điểm gốc 0 tuyệt đối.
B. Có thứ tự, khoảng cách bằng nhau và có điểm gốc 0 tuyệt đối.
C. Chỉ có thứ tự, không có khoảng cách bằng nhau.
D. Không có điểm gốc 0.
15. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị (Median)
B. Giá trị trung bình (Mean)
C. Độ lệch chuẩn (Standard Deviation)
D. Mốt (Mode)
16. Trong kiểm định giả thuyết, mức ý nghĩa (significance level, α) thường được chọn là 0.05. Điều này có nghĩa là:
A. Có 5% xác suất giả thuyết null là đúng.
B. Có 5% xác suất mắc sai số loại II.
C. Chúng ta sẵn sàng chấp nhận 5% xác suất mắc sai số loại I (bác bỏ giả thuyết null khi nó đúng).
D. Có 95% xác suất giả thuyết null là sai.
17. Giá trị ngoại lệ (Outlier) là:
A. Giá trị xuất hiện thường xuyên nhất trong dữ liệu.
B. Giá trị trung bình của dữ liệu.
C. Giá trị dữ liệu khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Giá trị nằm ở chính giữa của dữ liệu.
18. Sai số chuẩn của trung bình mẫu (Standard error of the mean) đo lường:
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Phương sai của mẫu.
19. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình mẫu với trung bình quần thể đã biết?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn quần thể đã biết.
C. Khi độ lệch chuẩn quần thể chưa biết và phải ước lượng từ mẫu.
D. Khi muốn so sánh trung bình của hai mẫu độc lập.
20. Phân tích hồi quy (Regression analysis) được sử dụng để:
A. Mô tả dữ liệu bằng các thống kê tóm tắt.
B. Ước lượng và kiểm định sự khác biệt giữa các nhóm.
C. Mô hình hóa mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập.
D. Phân loại dữ liệu vào các nhóm khác nhau.
21. Khoảng tin cậy (Confidence interval) cung cấp:
A. Một giá trị điểm ước lượng cho tham số quần thể.
B. Một khoảng giá trị mà chúng ta tin rằng tham số quần thể nằm trong đó với một độ tin cậy nhất định.
C. Xác suất tham số quần thể bằng với giá trị ước lượng.
D. Kích thước mẫu cần thiết cho nghiên cứu.
22. Phương sai (Variance) đo lường:
A. Giá trị trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình, bình phương độ lệch chuẩn.
C. Giá trị lớn nhất trừ giá trị nhỏ nhất.
D. Số lần một giá trị xuất hiện trong dữ liệu.
23. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện:
A. Xác suất giả thuyết null là đúng.
B. Ngưỡng ý nghĩa thống kê.
C. Xác suất quan sát được kết quảExtreme ít nhất bằng kết quả đã quan sát, giả sử giả thuyết null là đúng.
D. Mức độ tin cậy của kết quả.
24. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng:
A. Phân phối của quần thể luôn là phân phối chuẩn.
B. Với kích thước mẫu đủ lớn, phân phối lấy mẫu của trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể hình dạng phân phối của quần thể.
C. Trung bình mẫu luôn bằng trung bình quần thể.
D. Phương sai mẫu luôn bằng phương sai quần thể.
25. Thang đo khoảng (Interval scale) là loại thang đo:
A. Không có thứ tự và khoảng cách bằng nhau.
B. Có thứ tự, khoảng cách bằng nhau, nhưng không có điểm gốc 0 tuyệt đối.
C. Có thứ tự, khoảng cách không bằng nhau.
D. Chỉ dùng cho dữ liệu định tính.
26. Phân phối nhị thức (Binomial distribution) mô tả:
A. Số lần sự kiện xảy ra trong một khoảng thời gian liên tục.
B. Xác suất thành công trong một thử nghiệm duy nhất.
C. Số lần thành công trong một số lượng thử nghiệm Bernoulli độc lập.
D. Dữ liệu liên tục tuân theo hình chuông.
27. Độ tin cậy (Confidence level) của khoảng tin cậy thể hiện:
A. Xác suất khoảng tin cậy chứa giá trị thực của tham số quần thể.
B. Xác suất tham số quần thể nằm ngoài khoảng tin cậy.
C. Độ chính xác của ước lượng điểm.
D. Kích thước mẫu cần thiết.
28. Phân tích ANOVA (Analysis of Variance) được sử dụng để:
A. Kiểm tra mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Phân tích tần số của biến định tính.
29. Thang đo định danh (Nominal scale) là loại thang đo:
A. Có thứ tự và khoảng cách bằng nhau giữa các giá trị.
B. Chỉ phân loại dữ liệu vào các nhóm không có thứ tự.
C. Có điểm gốc 0 tuyệt đối.
D. Cho phép so sánh tỷ lệ giữa các giá trị.
30. Hệ số tương quan (Correlation coefficient) đo lường:
A. Mức độ biến thiên của dữ liệu.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số.
C. Giá trị trung bình của hai biến số.
D. Độ lệch chuẩn của hai biến số.