1. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?
A. Độ rộng khoảng tin cậy tăng lên
B. Độ rộng khoảng tin cậy giảm xuống
C. Độ rộng khoảng tin cậy không thay đổi
D. Độ rộng khoảng tin cậy có thể tăng hoặc giảm, tùy thuộc vào dữ liệu
2. Giả sử bạn tung một đồng xu cân đối 3 lần. Xác suất để được ít nhất một mặt ngửa là bao nhiêu?
A. 1/8
B. 3/8
C. 7/8
D. 1/2
3. Loại biểu đồ nào sau đây phù hợp nhất để hiển thị phân phối tần số của dữ liệu liên tục?
A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ đường
4. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả dữ liệu mẫu
B. Thu thập dữ liệu mẫu
C. Đưa ra suy luận về quần thể dựa trên dữ liệu mẫu
D. Tính toán các thống kê mô tả
5. Phương pháp lấy mẫu nào sau đây đảm bảo rằng mỗi thành viên của quần thể có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu theo cụm
6. Giá trị p trong kiểm định giả thuyết đại diện cho điều gì?
A. Xác suất giả thuyết null là đúng
B. Xác suất quan sát được kết quả cực đoan như mẫu, giả định giả thuyết null là đúng
C. Xác suất giả thuyết thay thế là đúng
D. Mức ý nghĩa của kiểm định
7. Lỗi loại II (sai sót β) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Không bác bỏ giả thuyết null khi nó thực sự sai
C. Chấp nhận giả thuyết thay thế khi nó sai
D. Chấp nhận giả thuyết null khi nó đúng
8. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
A. Kiểm định sự khác biệt giữa hai trung bình quần thể
B. Kiểm định sự khác biệt giữa phương sai của hai quần thể
C. Kiểm định sự khác biệt giữa trung bình của ba hoặc nhiều hơn quần thể
D. Đo lường mối quan hệ tuyến tính giữa hai biến
9. Phân tích hồi quy tuyến tính được sử dụng để làm gì?
A. Mô tả dữ liệu
B. Dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập
C. So sánh trung bình của hai nhóm
D. Đo lường độ phân tán của dữ liệu
10. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập
C. Sai số chuẩn của ước lượng
D. Giá trị p của mô hình hồi quy
11. Trong kiểm định giả thuyết, lỗi loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Không bác bỏ giả thuyết null khi nó thực sự sai
C. Chấp nhận giả thuyết thay thế khi nó sai
D. Chấp nhận giả thuyết null khi nó đúng
12. Phân phối nào sau đây thường được sử dụng để kiểm định về trung bình quần thể khi độ lệch chuẩn quần thể chưa biết và kích thước mẫu nhỏ?
A. Phân phối chuẩn Z
B. Phân phối t-Student
C. Phân phối Chi-bình phương
D. Phân phối F
13. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Giá trị trung bình của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Giá trị lớn nhất trong dữ liệu
D. Giá trị nhỏ nhất trong dữ liệu
14. Điều gì sẽ xảy ra với công suất của một kiểm định thống kê khi mức ý nghĩa (alpha) tăng lên?
A. Công suất giảm xuống
B. Công suất tăng lên
C. Công suất không thay đổi
D. Không thể xác định được sự thay đổi của công suất
15. Trong phân tích dữ liệu, `ngoại lệ` (outlier) là gì?
A. Giá trị trung bình của dữ liệu
B. Giá trị xuất hiện nhiều nhất trong dữ liệu
C. Giá trị cực đoan khác biệt đáng kể so với các giá trị khác trong dữ liệu
D. Giá trị ở giữa của dữ liệu đã sắp xếp
16. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Giá trị trung bình của biến ngẫu nhiên
B. Mức độ phân tán của biến ngẫu nhiên xung quanh giá trị trung bình
C. Giá trị lớn nhất mà biến ngẫu nhiên có thể nhận
D. Giá trị nhỏ nhất mà biến ngẫu nhiên có thể nhận
17. Hệ số tương quan Pearson đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa hai biến
B. Độ mạnh của mối quan hệ phi tuyến tính giữa hai biến
C. Sự khác biệt giữa trung bình của hai biến
D. Phương sai của một biến
18. Nếu P(A) = 0.4 và P(B) = 0.5, và A và B là hai biến cố độc lập, thì P(A và B) bằng bao nhiêu?
A. 0.9
B. 0.2
C. 0.1
D. 0.45
19. Khái niệm nào sau đây mô tả tập hợp tất cả các kết quả có thể có của một thí nghiệm ngẫu nhiên?
A. Biến cố sơ cấp
B. Không gian mẫu
C. Biến cố hợp
D. Xác suất
20. Khoảng tin cậy 95% có nghĩa là gì?
A. 95% dữ liệu nằm trong khoảng này
B. Có 95% khả năng tham số thực của quần thể nằm trong khoảng này
C. Khoảng này chứa 95% các giá trị mẫu có thể có
D. Xác suất sai số là 5%
21. Tính chất nào sau đây KHÔNG phải là tính chất của xác suất?
A. Xác suất của một biến cố bất kỳ luôn nằm trong khoảng từ 0 đến 1
B. Tổng xác suất của tất cả các biến cố sơ cấp trong không gian mẫu bằng 1
C. Xác suất của biến cố không thể xảy ra là -1
D. Xác suất của biến cố chắc chắn xảy ra là 1
22. Trong một hộp có 5 bi đỏ và 3 bi xanh. Nếu bạn rút ngẫu nhiên 2 bi mà không hoàn lại, xác suất để cả hai bi đều đỏ là bao nhiêu?
A. 5/8
B. 25/64
C. 10/56
D. 10/28
23. Biến ngẫu nhiên liên tục khác với biến ngẫu nhiên rời rạc như thế nào?
A. Biến liên tục chỉ nhận giá trị nguyên, biến rời rạc nhận giá trị bất kỳ
B. Biến liên tục có thể nhận bất kỳ giá trị nào trong một khoảng, biến rời rạc chỉ nhận giá trị đếm được
C. Biến liên tục có phân phối xác suất rời rạc, biến rời rạc có phân phối xác suất liên tục
D. Biến liên tục không có hàm mật độ xác suất, biến rời rạc có hàm khối lượng xác suất
24. Phân phối xác suất nào sau đây thường được sử dụng để mô hình hóa số lần một sự kiện hiếm gặp xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
25. Định lý giới hạn trung tâm (CLT) nói rằng điều gì sẽ xảy ra với phân phối của trung bình mẫu khi kích thước mẫu tăng lên?
A. Phân phối trung bình mẫu tiến tới phân phối đều
B. Phân phối trung bình mẫu tiến tới phân phối Poisson
C. Phân phối trung bình mẫu tiến tới phân phối chuẩn
D. Phân phối trung bình mẫu không thay đổi
26. Trong thống kê phi tham số, khi nào thì sử dụng kiểm định Mann-Whitney U thay vì kiểm định t độc lập?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn hơn 30
C. Khi các giả định về phân phối chuẩn không được đáp ứng
D. Khi muốn kiểm định phương sai
27. Trong thống kê, `trung vị` là gì?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
C. Giá trị ở giữa của tập dữ liệu đã được sắp xếp
D. Tổng của tất cả các giá trị trong tập dữ liệu
28. Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc được tính bằng công thức nào?
A. Tổng của tất cả các giá trị có thể có
B. Trung bình cộng của các giá trị có thể có
C. Tổng của (giá trị * xác suất của giá trị đó) cho tất cả các giá trị có thể có
D. Giá trị trung vị của các giá trị có thể có
29. Khi nào thì sử dụng kiểm định một đuôi thay vì kiểm định hai đuôi?
A. Khi không có giả thuyết thay thế
B. Khi giả thuyết thay thế chỉ ra hướng cụ thể của sự khác biệt
C. Khi muốn tăng khả năng bác bỏ giả thuyết null
D. Khi kích thước mẫu lớn
30. Khi hai biến có hệ số tương quan bằng 0, điều đó có nghĩa là gì?
A. Có một mối quan hệ tuyến tính mạnh mẽ giữa hai biến
B. Không có mối quan hệ tuyến tính giữa hai biến
C. Hai biến hoàn toàn phụ thuộc nhau
D. Chỉ có một biến ảnh hưởng đến biến còn lại