1. Trong lý thuyết xác suất, tập hợp tất cả các kết quả có thể có của một thí nghiệm ngẫu nhiên được gọi là gì?
A. Biến cố
B. Không gian mẫu
C. Xác suất
D. Phân phối xác suất
2. Điều kiện nào sau đây là cần thiết để áp dụng Định lý giới hạn trung tâm (Central Limit Theorem)?
A. Kích thước mẫu nhỏ (n < 30)
B. Quần thể phải có phân phối chuẩn
C. Kích thước mẫu đủ lớn (thường n ≥ 30)
D. Phương sai quần thể phải được biết
3. Phân phối chuẩn có những đặc điểm chính nào?
A. Đối xứng, đơn đỉnh, hình chuông
B. Lệch phải, đa đỉnh
C. Lệch trái, đơn đỉnh
D. Phân phối đều
4. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?
A. Xác suất giả thuyết không là đúng
B. Xác suất quan sát được dữ liệu cực đoan như dữ liệu đã cho (hoặc cực đoan hơn) nếu giả thuyết không là đúng
C. Xác suất giả thuyết thay thế là đúng
D. Mức ý nghĩa của kiểm định
5. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) của đường hồi quy thể hiện điều gì?
A. Giá trị trung bình của biến phụ thuộc
B. Giá trị của biến phụ thuộc khi biến độc lập bằng 0
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên một đơn vị
D. Mức độ tương quan giữa hai biến
6. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh trung bình của hai nhóm
B. So sánh phương sai của hai nhóm
C. So sánh trung bình của ba nhóm trở lên
D. Đo lường mối quan hệ tuyến tính giữa hai biến
7. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần một sự kiện hiếm gặp xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
8. Khoảng tin cậy 95% có nghĩa là gì?
A. Xác suất tham số quần thể nằm trong khoảng là 95%
B. 95% mẫu từ quần thể sẽ cho khoảng tin cậy chứa tham số quần thể thực sự
C. 5% mẫu từ quần thể sẽ cho khoảng tin cậy không chứa tham số quần thể thực sự
D. Cả đáp án 2 và 3 đều đúng
9. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của một biến
B. Mức độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Sự khác biệt giữa trung bình của hai nhóm
D. Xác suất của một sự kiện xảy ra
10. Tỷ lệ (proportion) khác với trung bình (mean) ở điểm nào?
A. Tỷ lệ là một tham số quần thể, trung bình là một thống kê mẫu
B. Tỷ lệ áp dụng cho biến định tính, trung bình áp dụng cho biến định lượng
C. Tỷ lệ luôn nằm giữa 0 và 1, trung bình có thể nhận bất kỳ giá trị nào
D. Cả đáp án 2 và 3 đều đúng
11. Mục đích của hồi quy đa biến (multiple regression) là gì?
A. Dự đoán một biến phụ thuộc từ một biến độc lập
B. Dự đoán một biến phụ thuộc từ hai hoặc nhiều biến độc lập
C. So sánh trung bình của nhiều nhóm
D. Kiểm tra mối quan hệ giữa hai biến định tính
12. Khi nào thì nên sử dụng thống kê phi tham số (non-parametric statistics) thay vì thống kê tham số (parametric statistics)?
A. Khi dữ liệu có phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ
D. Thống kê phi tham số luôn tốt hơn thống kê tham số
13. Sai số chuẩn của trung bình mẫu (standard error of the mean - SEM) đo lường điều gì?
A. Độ lệch chuẩn của quần thể
B. Độ lệch chuẩn của mẫu
C. Độ lệch chuẩn của phân phối trung bình mẫu
D. Phương sai của mẫu
14. Phương pháp lấy mẫu nào mà mỗi thành viên của quần thể có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu theo cụm
15. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Giá trị trung bình của biến
B. Độ lệch chuẩn của biến
C. Mức độ phân tán trung bình của các giá trị của biến so với giá trị kỳ vọng
D. Giá trị lớn nhất của biến
16. Trong thống kê suy luận, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó thực sự đúng
B. Không bác bỏ giả thuyết không khi nó thực sự sai
C. Chấp nhận giả thuyết thay thế khi nó thực sự sai
D. Bác bỏ giả thuyết thay thế khi nó thực sự đúng
17. Công thức Bayes được sử dụng để tính toán loại xác suất nào?
A. Xác suất biên
B. Xác suất đồng thời
C. Xác suất có điều kiện
D. Xác suất tích lũy
18. Trong thống kê, `độ mạnh kiểm định` (statistical power) đề cập đến điều gì?
A. Xác suất mắc lỗi Loại I
B. Xác suất mắc lỗi Loại II
C. Xác suất bác bỏ đúng giả thuyết không khi nó thực sự sai
D. Xác suất không bác bỏ giả thuyết không khi nó thực sự đúng
19. Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng của tất cả các giá trị có thể có của biến
B. Giá trị trung bình của các giá trị có thể có của biến
C. Tổng của tích của mỗi giá trị có thể có và xác suất của nó
D. Giá trị có khả năng xảy ra cao nhất của biến
20. Biến định tính (qualitative variable) khác với biến định lượng (quantitative variable) ở điểm nào?
A. Biến định tính có giá trị số, biến định lượng có giá trị phi số
B. Biến định tính đo lường thuộc tính hoặc phẩm chất, biến định lượng đo lường số lượng hoặc lượng
C. Biến định tính luôn rời rạc, biến định lượng luôn liên tục
D. Không có sự khác biệt, hai thuật ngữ này có thể hoán đổi cho nhau
21. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính
B. Phần trăm phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy
C. Độ dốc của đường hồi quy
D. Mức độ ý nghĩa thống kê của mô hình
22. Nếu P(A) = 0.6 và P(B) = 0.7, và A và B là hai biến cố độc lập, thì P(A và B) bằng bao nhiêu?
A. 1.3
B. 0.9
C. 0.42
D. 0.1
23. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu độc lập
B. Kiểm tra tính độc lập của hai biến định tính
C. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không
D. Đo lường mối tương quan giữa hai biến
24. Giá trị trung vị (median) là gì?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
C. Giá trị ở giữa của tập dữ liệu đã được sắp xếp
D. Tổng của tất cả các giá trị trong tập dữ liệu
25. Thống kê mô tả và thống kê suy luận khác nhau chủ yếu ở điểm nào?
A. Thống kê mô tả sử dụng số liệu, thống kê suy luận sử dụng đồ thị
B. Thống kê mô tả tóm tắt và mô tả dữ liệu, thống kê suy luận đưa ra kết luận về quần thể dựa trên mẫu
C. Thống kê mô tả dễ hơn thống kê suy luận
D. Thống kê mô tả luôn chính xác, thống kê suy luận có thể sai
26. Khi nào thì nên sử dụng kiểm định Chi-bình phương (Chi-squared test)?
A. Để so sánh trung bình của hai quần thể
B. Để kiểm tra mối quan hệ giữa hai biến định lượng
C. Để kiểm tra mối quan hệ giữa hai biến định tính
D. Để ước lượng trung bình quần thể
27. Hàm mật độ xác suất (probability density function - PDF) được sử dụng cho loại biến ngẫu nhiên nào?
A. Biến ngẫu nhiên rời rạc
B. Biến ngẫu nhiên liên tục
C. Cả biến rời rạc và liên tục
D. Không biến nào trong hai loại trên
28. Trong phân tích dữ liệu chuỗi thời gian (time series analysis), thành phần xu hướng (trend component) đề cập đến điều gì?
A. Biến động ngắn hạn trong dữ liệu
B. Mô hình lặp lại trong khoảng thời gian cố định
C. Sự thay đổi dài hạn hoặc hướng đi chung của dữ liệu theo thời gian
D. Các sự kiện bất thường hoặc ngẫu nhiên
29. Trong kiểm định một đuôi (one-tailed test) và kiểm định hai đuôi (two-tailed test), sự khác biệt chính là gì?
A. Kiểm định một đuôi dễ thực hiện hơn kiểm định hai đuôi
B. Kiểm định một đuôi kiểm tra sự khác biệt theo một hướng cụ thể, kiểm định hai đuôi kiểm tra sự khác biệt theo cả hai hướng
C. Kiểm định một đuôi luôn cho kết quả chính xác hơn kiểm định hai đuôi
D. Kiểm định một đuôi chỉ dùng cho mẫu nhỏ, kiểm định hai đuôi dùng cho mẫu lớn
30. Độ lệch chuẩn đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu
B. Mức độ phân tán hoặc biến động của dữ liệu xung quanh giá trị trung bình
C. Hình dạng của phân phối dữ liệu
D. Giá trị lớn nhất trong tập dữ liệu