1. Giá trị Z-score cho biết điều gì về một điểm dữ liệu?
A. Vị trí phần trăm của điểm dữ liệu trong tập dữ liệu.
B. Điểm dữ liệu đó là giá trị ngoại lệ hay không.
C. Điểm dữ liệu đó cách giá trị trung bình bao nhiêu độ lệch chuẩn.
D. Xác suất để quan sát được điểm dữ liệu đó.
2. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc sai lầm Loại II.
C. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả quan sát được, giả sử giả thuyết null là đúng.
D. Mức ý nghĩa thống kê của kiểm định.
3. Khi mức ý nghĩa (alpha, α) trong kiểm định giả thuyết giảm xuống, điều gì xảy ra với xác suất mắc sai lầm Loại II (beta, β)?
A. Xác suất mắc sai lầm Loại II cũng giảm xuống.
B. Xác suất mắc sai lầm Loại II tăng lên.
C. Xác suất mắc sai lầm Loại II không thay đổi.
D. Không có mối quan hệ rõ ràng giữa alpha và beta.
4. Khoảng tin cậy 95% có nghĩa là:
A. Có 95% khả năng giá trị tham số thực tế nằm ngoài khoảng tin cậy.
B. Có 95% khả năng mẫu nghiên cứu là đại diện cho quần thể.
C. Nếu lặp lại quá trình lấy mẫu và tính toán khoảng tin cậy nhiều lần, khoảng 95% các khoảng tin cậy được tạo ra sẽ chứa giá trị tham số thực tế của quần thể.
D. Khoảng tin cậy này chứa 95% dữ liệu mẫu.
5. Giá trị trung vị (median) là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình cộng của tất cả các giá trị trong tập dữ liệu.
C. Giá trị ở giữa của tập dữ liệu khi được sắp xếp theo thứ tự.
D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất trong tập dữ liệu.
6. Thống kê suy luận (inferential statistics) khác biệt với thống kê mô tả chủ yếu ở điểm nào?
A. Thống kê suy luận chỉ sử dụng dữ liệu định lượng, trong khi thống kê mô tả chỉ sử dụng dữ liệu định tính.
B. Thống kê suy luận đưa ra kết luận về quần thể dựa trên mẫu, trong khi thống kê mô tả chỉ mô tả dữ liệu mẫu.
C. Thống kê suy luận luôn chính xác hơn thống kê mô tả.
D. Thống kê suy luận sử dụng các phương pháp toán học phức tạp hơn thống kê mô tả.
7. Phân phối chuẩn (Normal distribution) có hình dạng như thế nào?
A. Lệch trái.
B. Lệch phải.
C. Hình chuông đối xứng.
D. Hình chữ nhật.
8. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm tra mối quan hệ tuyến tính giữa hai biến định lượng.
B. So sánh phương sai của hai quần thể.
C. So sánh trung bình của ba hoặc nhiều nhóm (quần thể).
D. Đo lường độ phân tán của dữ liệu.
9. Phương sai (variance) là gì?
A. Giá trị trung bình của dữ liệu.
B. Căn bậc hai của độ lệch chuẩn.
C. Trung bình của bình phương độ lệch của mỗi giá trị so với giá trị trung bình.
D. Khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất trong dữ liệu.
10. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Sai số chuẩn của ước lượng hồi quy.
D. Mức ý nghĩa thống kê của mô hình.
11. Trong phân tích hồi quy tuyến tính, đường hồi quy biểu diễn điều gì?
A. Mối quan hệ nhân quả chắc chắn giữa biến độc lập và biến phụ thuộc.
B. Giá trị trung bình của biến phụ thuộc cho mỗi giá trị của biến độc lập.
C. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Sai số ngẫu nhiên trong dữ liệu.
12. Phân phối Poisson thường được sử dụng để mô hình hóa:
A. Thời gian sống của các thiết bị điện tử.
B. Số lượng sự kiện hiếm xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Chiều cao trung bình của người trưởng thành.
D. Kết quả của việc tung đồng xu nhiều lần.
13. Sai lầm Loại II (Type II error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết đối khi nó thực sự sai.
C. Không bác bỏ giả thuyết null khi nó thực sự sai.
D. Chấp nhận giả thuyết null khi nó thực sự đúng.
14. Thống kê mô tả tập trung vào việc:
A. Dự đoán giá trị tương lai dựa trên dữ liệu quá khứ.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định giả thuyết về tổng thể dựa trên mẫu.
D. Xây dựng mô hình toán học để giải thích mối quan hệ giữa các biến.
15. Trong thống kê, `quần thể` (population) đề cập đến:
A. Một nhóm nhỏ các cá thể được chọn để nghiên cứu.
B. Tất cả các cá thể hoặc đối tượng mà chúng ta quan tâm nghiên cứu.
C. Chỉ những cá thể có thể tiếp cận được để thu thập dữ liệu.
D. Các cá thể được chọn ngẫu nhiên từ một nhóm lớn hơn.
16. Độ lệch chuẩn đo lường điều gì?
A. Xu hướng tập trung của dữ liệu.
B. Hình dạng phân phối của dữ liệu.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Vị trí trung tâm của dữ liệu.
17. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả giữa hai biến.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa giá trị trung bình của hai biến.
D. Độ phân tán của dữ liệu xung quanh đường hồi quy.
18. Phân loại dữ liệu nào sau đây là định tính?
A. Nhiệt độ (°C).
B. Thu nhập (VNĐ).
C. Màu sắc (Đỏ, Xanh, Vàng).
D. Chiều cao (cm).
19. Phương pháp lấy mẫu phân tầng (stratified sampling) được sử dụng khi nào?
A. Khi quần thể đồng nhất.
B. Khi quần thể có thể được chia thành các nhóm (tầng) khác nhau và muốn đảm bảo sự đại diện từ mỗi tầng.
C. Khi chi phí lấy mẫu cần được giảm thiểu.
D. Khi thời gian thu thập dữ liệu bị hạn chế.
20. Phương pháp lấy mẫu cụm (cluster sampling) thường được sử dụng khi:
A. Quần thể đồng nhất và dễ tiếp cận.
B. Quần thể được chia thành các cụm tự nhiên và việc lấy mẫu toàn bộ cụm hiệu quả hơn.
C. Cần đảm bảo sự đại diện từ các tầng khác nhau của quần thể.
D. Muốn giảm thiểu sai số lấy mẫu.
21. Giá trị trung bình (mean) bị ảnh hưởng mạnh nhất bởi:
A. Số lượng quan sát trong tập dữ liệu.
B. Giá trị trung vị (median).
C. Các giá trị ngoại lệ (outliers).
D. Độ lệch chuẩn của dữ liệu.
22. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ nằm ở:
A. Cả hai đuôi của phân phối mẫu.
B. Chỉ một đuôi của phân phối mẫu.
C. Trung tâm của phân phối mẫu.
D. Vùng giữa của phân phối mẫu.
23. Phương pháp lấy mẫu ngẫu nhiên đơn giản đảm bảo điều gì?
A. Mỗi phần tử trong quần thể có xác suất chọn khác nhau.
B. Mẫu thu được chắc chắn đại diện hoàn hảo cho quần thể.
C. Mỗi phần tử trong quần thể có xác suất chọn bằng nhau.
D. Chỉ các phần tử dễ tiếp cận mới được chọn.
24. Trong kiểm định giả thuyết, sai lầm Loại I (Type I error) xảy ra khi:
A. Chấp nhận giả thuyết null khi nó thực sự sai.
B. Bác bỏ giả thuyết null khi nó thực sự đúng.
C. Không bác bỏ giả thuyết null khi nó thực sự sai.
D. Bác bỏ giả thuyết null khi nó thực sự đúng và chấp nhận giả thuyết đối khi nó sai.
25. Biến `thứ hạng trong cuộc thi` thuộc loại dữ liệu nào?
A. Định danh (Nominal).
B. Thứ bậc (Ordinal).
C. Khoảng (Interval).
D. Tỷ lệ (Ratio).
26. Chọn phát biểu SAI về dữ liệu tỷ lệ (ratio data).
A. Dữ liệu tỷ lệ có một điểm gốc 0 tuyệt đối.
B. Tỷ lệ giữa hai giá trị có ý nghĩa.
C. Dữ liệu nhiệt độ đo bằng độ Celsius là dữ liệu tỷ lệ.
D. Chiều cao và cân nặng là ví dụ về dữ liệu tỷ lệ.
27. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng:
A. Phân phối của quần thể luôn là phân phối chuẩn.
B. Kích thước mẫu càng lớn, phương sai của mẫu càng nhỏ.
C. Phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể hình dạng phân phối của quần thể gốc.
D. Trung bình của mẫu luôn bằng trung bình của quần thể.
28. Biểu đồ hộp (boxplot) đặc biệt hữu ích để:
A. Hiển thị tần suất của dữ liệu định tính.
B. So sánh trung bình của nhiều nhóm.
C. Xác định giá trị ngoại lệ và phân phối của dữ liệu định lượng.
D. Hiển thị mối quan hệ giữa hai biến định lượng.
29. Khi nào nên sử dụng trung vị (median) thay vì giá trị trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi dữ liệu có dạng phân phối đối xứng.
D. Khi cần tính toán nhanh chóng.
30. Chọn câu phát biểu ĐÚNG về mối quan hệ giữa cỡ mẫu và sai số chuẩn của trung bình mẫu.
A. Cỡ mẫu càng lớn, sai số chuẩn của trung bình mẫu càng lớn.
B. Cỡ mẫu càng nhỏ, sai số chuẩn của trung bình mẫu càng nhỏ.
C. Cỡ mẫu càng lớn, sai số chuẩn của trung bình mẫu càng nhỏ.
D. Cỡ mẫu không ảnh hưởng đến sai số chuẩn của trung bình mẫu.