1. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả dữ liệu mẫu một cách chi tiết.
B. Rút ra kết luận hoặc đưa ra quyết định về tổng thể dựa trên dữ liệu mẫu.
C. Tính toán các giá trị trung bình và độ lệch chuẩn của dữ liệu.
D. Trực quan hóa dữ liệu bằng biểu đồ và đồ thị.
2. Phân tích hồi quy (regression analysis) được sử dụng chủ yếu để làm gì?
A. Mô tả đặc điểm của một biến số duy nhất.
B. Xác định mối quan hệ giữa các biến số và dự đoán giá trị của một biến số dựa trên các biến số khác.
C. So sánh trung bình của hai nhóm độc lập.
D. Phân loại dữ liệu vào các nhóm khác nhau.
3. Trong phân tích dữ liệu phân loại (categorical data), phép kiểm định nào sau đây thường được sử dụng để kiểm tra tính độc lập giữa hai biến phân loại?
A. Kiểm định t (t-test).
B. Kiểm định Chi-bình phương (Chi-squared test).
C. Phân tích hồi quy tuyến tính.
D. Hệ số tương quan Pearson.
4. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm định sự khác biệt giữa phương sai của hai tổng thể.
B. Kiểm định sự khác biệt giữa trung bình của ba nhóm trở lên.
C. Đo lường mối quan hệ tuyến tính giữa các biến số.
D. Mô tả phân phối của một biến số.
5. Ứng dụng nào sau đây KHÔNG thuộc về lĩnh vực thống kê ứng dụng?
A. Phân tích dữ liệu thí nghiệm trong khoa học tự nhiên.
B. Chứng minh các định lý toán học trong lý thuyết xác suất.
C. Dự báo doanh số bán hàng cho một công ty.
D. Đánh giá rủi ro tín dụng trong ngân hàng.
6. Ứng dụng nào sau đây thể hiện rõ nhất việc sử dụng thống kê mô tả trong thực tế?
A. Dự đoán xu hướng giá cổ phiếu trong tương lai.
B. Phân tích dữ liệu khảo sát mức độ hài lòng của khách hàng và trình bày kết quả bằng biểu đồ.
C. Ước lượng tỷ lệ cử tri ủng hộ một ứng cử viên dựa trên kết quả thăm dò.
D. Xây dựng mô hình hồi quy để dự báo doanh số bán hàng.
7. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
D. Hình dạng phân phối của dữ liệu.
8. Khi nào việc sử dụng giá trị trung bình (mean) KHÔNG phải là thước đo trung tâm phù hợp nhất cho một tập dữ liệu?
A. Khi dữ liệu phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi dữ liệu có dạng rời rạc.
D. Khi cỡ mẫu lớn.
9. Trong phân tích chuỗi thời gian (time series analysis), mục tiêu chính là gì?
A. So sánh dữ liệu từ các nhóm khác nhau tại cùng một thời điểm.
B. Phân tích dữ liệu được thu thập theo thời gian để tìm kiếm xu hướng, mùa vụ, và các thành phần khác, và dự báo giá trị tương lai.
C. Mô tả phân phối của dữ liệu.
D. Đo lường mối quan hệ giữa các biến số tĩnh.
10. Phương pháp `cross-validation` (kiểm định chéo) trong thống kê ứng dụng thường được dùng để làm gì?
A. Tăng kích thước tập dữ liệu huấn luyện mô hình.
B. Đánh giá hiệu năng của mô hình dự đoán trên dữ liệu mới (dữ liệu chưa từng được dùng để huấn luyện mô hình).
C. Giảm thiểu sai số trong quá trình thu thập dữ liệu.
D. Làm sạch và tiền xử lý dữ liệu.
11. Trong phân tích dữ liệu lớn (big data analytics), thống kê ứng dụng đóng vai trò như thế nào?
A. Không còn quan trọng vì dữ liệu quá lớn.
B. Cung cấp các công cụ và phương pháp để xử lý, phân tích và rút ra thông tin giá trị từ lượng dữ liệu khổng lồ.
C. Chỉ giới hạn ở việc mô tả dữ liệu.
D. Chỉ được sử dụng trong giai đoạn thu thập dữ liệu.
12. Trong tài chính, thống kê ứng dụng thường được sử dụng để làm gì?
A. Thiết kế giao diện người dùng cho ứng dụng ngân hàng.
B. Phân tích rủi ro đầu tư, dự báo thị trường chứng khoán, và xây dựng mô hình định giá tài sản.
C. Quản lý hệ thống thanh toán trực tuyến.
D. Tuyển dụng nhân viên ngân hàng.
13. Biểu đồ hộp (boxplot) thường được sử dụng để thể hiện điều gì về một tập dữ liệu?
A. Tần số xuất hiện của các giá trị.
B. Mối quan hệ giữa hai biến số.
C. Phân phối, độ lệch, và giá trị ngoại lệ của dữ liệu.
D. Xu hướng thay đổi của dữ liệu theo thời gian.
14. Sai lầm phổ biến khi diễn giải hệ số tương quan là gì?
A. Cho rằng tương quan bằng 0 nghĩa là không có mối quan hệ nào.
B. Cho rằng tương quan cao (gần 1 hoặc -1) luôn chỉ ra mối quan hệ nhân quả.
C. Cho rằng tương quan âm là mối quan hệ mạnh hơn tương quan dương.
D. Cho rằng hệ số tương quan chỉ áp dụng cho dữ liệu phân phối chuẩn.
15. Khi dữ liệu không tuân theo phân phối chuẩn, phép kiểm định nào sau đây thường được sử dụng để so sánh trung bình của hai nhóm độc lập?
A. Kiểm định t (t-test) cho hai mẫu độc lập.
B. Kiểm định Z (Z-test).
C. Kiểm định Mann-Whitney U.
D. Phân tích phương sai (ANOVA).
16. Sai lầm loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện cho tổng thể.
D. Tính toán sai giá trị thống kê kiểm định.
17. Khái niệm `khoảng tin cậy` (confidence interval) trong thống kê suy diễn dùng để làm gì?
A. Đo lường độ chính xác của ước lượng điểm.
B. Ước lượng một khoảng giá trị mà tham số tổng thể có khả năng nằm trong đó.
C. Kiểm định xem giả thuyết thống kê có đúng hay không.
D. Xác định kích thước mẫu cần thiết cho nghiên cứu.
18. Khi nào thì việc sử dụng thống kê phi tham số (non-parametric statistics) được ưu tiên hơn thống kê tham số (parametric statistics)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu rất lớn.
C. Khi các giả định của thống kê tham số (ví dụ, phân phối chuẩn) không được đáp ứng.
D. Khi muốn tính toán giá trị trung bình.
19. Khi nào thì kiểm định giả thuyết một phía (one-tailed test) phù hợp hơn kiểm định giả thuyết hai phía (two-tailed test)?
A. Khi không có giả định về hướng của sự khác biệt.
B. Khi chỉ quan tâm đến sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
C. Khi muốn tăng khả năng bác bỏ giả thuyết null.
D. Khi cỡ mẫu nhỏ.
20. Để giảm thiểu sai số trong nghiên cứu thống kê, biện pháp nào sau đây là quan trọng nhất?
A. Sử dụng phần mềm thống kê phức tạp.
B. Tăng cỡ mẫu.
C. Thu thập dữ liệu từ nhiều nguồn khác nhau.
D. Trình bày kết quả bằng nhiều loại biểu đồ.
21. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật thống kê mô tả?
A. Tính trung bình cộng
B. Tính độ lệch chuẩn
C. Kiểm định giả thuyết
D. Vẽ biểu đồ tần số
22. Ứng dụng của thống kê trong lĩnh vực Y tế thường tập trung vào điều gì?
A. Dự báo giá thuốc trong tương lai.
B. Đánh giá hiệu quả của các phương pháp điều trị, nghiên cứu dịch tễ học, và phân tích dữ liệu bệnh nhân.
C. Quản lý kho dược phẩm.
D. Thiết kế bệnh viện thông minh.
23. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất quan sát được kết quả mẫu cực đoan như (hoặc cực đoan hơn) kết quả đã quan sát, giả định giả thuyết null là đúng.
D. Mức độ tin cậy của kết quả kiểm định.
24. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của một biến số.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số.
C. Giá trị trung bình của hai biến số.
D. Mức độ phân tán của dữ liệu.
25. Phương pháp `bootstrap` trong thống kê ứng dụng được sử dụng để làm gì?
A. Tăng cường độ tin cậy của kiểm định giả thuyết bằng cách tăng cỡ mẫu thực tế.
B. Ước lượng độ tin cậy của thống kê mẫu (ví dụ, sai số chuẩn, khoảng tin cậy) bằng cách lấy mẫu lại có hoàn lại từ dữ liệu mẫu ban đầu.
C. Giảm thiểu ảnh hưởng của giá trị ngoại lệ trong dữ liệu.
D. Trực quan hóa dữ liệu chuỗi thời gian.
26. Trong lĩnh vực Marketing, thống kê ứng dụng để làm gì?
A. Thiết kế logo và bộ nhận diện thương hiệu.
B. Phân tích hành vi khách hàng, đánh giá hiệu quả chiến dịch quảng cáo, và phân khúc thị trường.
C. Quản lý nhân sự phòng Marketing.
D. Lập kế hoạch sự kiện ra mắt sản phẩm.
27. Trong thống kê Bayes, điều gì khác biệt so với thống kê tần suất (frequentist statistics) truyền thống?
A. Thống kê Bayes không sử dụng dữ liệu mẫu.
B. Thống kê Bayes sử dụng khái niệm `xác suất tiên nghiệm` (prior probability) để kết hợp thông tin trước đó với dữ liệu hiện tại.
C. Thống kê Bayes chỉ áp dụng cho dữ liệu định tính.
D. Thống kê Bayes không thể sử dụng trong thống kê suy diễn.
28. Hạn chế chính của việc chỉ sử dụng thống kê mô tả là gì?
A. Không thể tóm tắt dữ liệu một cách hiệu quả.
B. Không thể đưa ra kết luận hoặc khái quát hóa cho tổng thể lớn hơn dữ liệu mẫu.
C. Không thể trực quan hóa dữ liệu.
D. Không thể tính toán các giá trị trung bình và độ lệch chuẩn.
29. Trong thống kê ứng dụng, loại thống kê nào tập trung vào việc mô tả và tóm tắt dữ liệu?
A. Thống kê suy diễn
B. Thống kê mô tả
C. Thống kê toán học
D. Thống kê Bayes
30. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?
A. Mẫu thu được chắc chắn đại diện hoàn hảo cho tổng thể.
B. Mỗi thành viên của tổng thể có cơ hội được chọn vào mẫu như nhau.
C. Mẫu thu được có kích thước bằng một nửa tổng thể.
D. Mẫu thu được chỉ bao gồm các thành viên có đặc điểm quan tâm.