1. Thống kê ứng dụng tập trung chủ yếu vào:
A. Phát triển các công thức và định lý toán học thống kê thuần túy.
B. Thu thập, phân tích, diễn giải và trình bày dữ liệu để giải quyết vấn đề thực tế.
C. Nghiên cứu lịch sử phát triển của ngành thống kê.
D. Xây dựng các mô hình toán học phức tạp mà không cần dữ liệu thực tế.
2. Giả sử bạn muốn kiểm tra xem có sự khác biệt về mức độ hài lòng của khách hàng giữa ba chi nhánh cửa hàng khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t cặp đôi.
B. Phân tích phương sai một yếu tố (One-way ANOVA).
C. Hồi quy tuyến tính đơn.
D. Kiểm định Chi-bình phương độc lập.
3. Ứng dụng của thống kê trong lĩnh vực khoa học môi trường bao gồm:
A. Dự đoán giá cổ phiếu.
B. Phân tích dữ liệu ô nhiễm để đánh giá chất lượng không khí và nước.
C. Thiết kế logo thương hiệu.
D. Quản lý chuỗi cung ứng.
4. Giả sử bạn có dữ liệu về doanh thu của cửa hàng trong 12 tháng qua. Để phân tích tính mùa vụ trong doanh thu, bạn có thể sử dụng phương pháp nào?
A. Phân tích hồi quy tuyến tính.
B. Phân tích chuỗi thời gian với mô hình ARIMA hoặc phân tích phổ.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương.
5. Chọn phát biểu SAI về thống kê ứng dụng:
A. Thống kê ứng dụng có thể giúp đưa ra quyết định dựa trên dữ liệu.
B. Thống kê ứng dụng chỉ giới hạn trong lĩnh vực kinh tế và kinh doanh.
C. Thống kê ứng dụng sử dụng các phương pháp thống kê để giải quyết vấn đề thực tế.
D. Thống kê ứng dụng bao gồm cả thống kê mô tả và thống kê suy luận.
6. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến:
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập.
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập với nhau.
C. Sự vi phạm giả định về tính tuyến tính trong mô hình hồi quy.
D. Sự hiện diện của các giá trị ngoại lệ trong dữ liệu.
7. Trong thống kê ứng dụng, `dân số` (population) đề cập đến:
A. Tổng số người dân của một quốc gia.
B. Toàn bộ tập hợp các đối tượng hoặc đơn vị quan tâm nghiên cứu.
C. Một nhóm nhỏ được chọn ngẫu nhiên từ tổng thể.
D. Các mẫu dữ liệu thu thập được.
8. Giá trị trung bình (mean) bị ảnh hưởng NHIỀU NHẤT bởi:
A. Số lượng quan sát trong mẫu.
B. Giá trị trung vị (median).
C. Các giá trị ngoại lệ (outliers).
D. Phương sai (variance).
9. Khi nào thì kiểm định phi tham số (non-parametric test) được ưu tiên sử dụng hơn kiểm định tham số (parametric test)?
A. Khi dữ liệu có kích thước mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn tăng cường độ mạnh của kiểm định.
10. Phương pháp thống kê nào sau đây phù hợp nhất để dự đoán doanh số bán hàng dựa trên chi phí quảng cáo?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính.
C. Kiểm định Chi-bình phương.
D. Thống kê mô tả.
11. Phương pháp nào sau đây KHÔNG thuộc thống kê suy luận?
A. Ước lượng khoảng tin cậy.
B. Kiểm định giả thuyết.
C. Tính giá trị trung bình mẫu.
D. Phân tích hồi quy.
12. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với khoảng tin cậy?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
13. Một nhà nghiên cứu muốn so sánh hiệu quả của hai loại thuốc giảm đau khác nhau. Thiết kế nghiên cứu nào sau đây là phù hợp nhất?
A. Nghiên cứu quan sát (Observational study).
B. Thử nghiệm đối chứng ngẫu nhiên (Randomized controlled trial).
C. Nghiên cứu cắt ngang (Cross-sectional study).
D. Nghiên cứu hồi cứu (Retrospective study).
14. Loại lỗi nào thường gặp khi trình bày dữ liệu thống kê bằng biểu đồ?
A. Tính toán sai các giá trị trung bình.
B. Chọn loại biểu đồ không phù hợp với loại dữ liệu hoặc mục đích trình bày.
C. Sử dụng sai công thức thống kê.
D. Diễn giải sai kết quả kiểm định giả thuyết.
15. Trong nghiên cứu thị trường, thống kê ứng dụng giúp doanh nghiệp:
A. Tăng cường độ phức tạp của báo cáo tài chính.
B. Dự đoán doanh thu chính xác tuyệt đối trong mọi trường hợp.
C. Phân tích dữ liệu khảo sát khách hàng để hiểu hành vi và sở thích của họ.
D. Loại bỏ hoàn toàn rủi ro trong quyết định kinh doanh.
16. Khi dữ liệu có phân phối lệch (skewed), độ đo trung tâm nào thường được ưu tiên sử dụng hơn giá trị trung bình?
A. Giá trị trung bình (mean).
B. Mốt (mode).
C. Trung vị (median).
D. Độ lệch chuẩn (standard deviation).
17. Điều gì KHÔNG phải là một bước quan trọng trong quy trình phân tích thống kê ứng dụng?
A. Xác định câu hỏi nghiên cứu hoặc vấn đề cần giải quyết.
B. Thu thập và chuẩn bị dữ liệu.
C. Phát triển lý thuyết thống kê mới.
D. Phân tích dữ liệu và diễn giải kết quả.
18. Trong phân tích phương sai (ANOVA), chúng ta so sánh sự khác biệt giữa:
A. Trung bình của hai mẫu độc lập.
B. Phương sai của hai mẫu độc lập.
C. Trung bình của ba hoặc nhiều nhóm.
D. Tần số của các biến định tính.
19. Sai số loại I trong kiểm định giả thuyết xảy ra khi:
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Chấp nhận giả thuyết null khi nó đúng.
20. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của thống kê trong lĩnh vực y tế?
A. Đánh giá hiệu quả của các phương pháp điều trị mới.
B. Dự báo thời tiết.
C. Nghiên cứu dịch tễ học để xác định nguyên nhân và phân bố bệnh tật.
D. Phân tích dữ liệu lâm sàng để cải thiện chăm sóc bệnh nhân.
21. Hệ số tương quan (correlation coefficient) đo lường:
A. Mức độ phân tán của dữ liệu.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Tỷ lệ phần trăm của một biến trong tổng thể.
22. Độ lệch chuẩn (standard deviation) đo lường:
A. Giá trị trung bình của dữ liệu.
B. Mức độ tập trung của dữ liệu xung quanh trung vị.
C. Mức độ phân tán hoặc biến động của dữ liệu xung quanh giá trị trung bình.
D. Vị trí trung tâm của dữ liệu.
23. Trong bối cảnh đạo đức thống kê, điều gì quan trọng nhất khi thu thập và phân tích dữ liệu?
A. Sử dụng các phương pháp thống kê phức tạp nhất có thể.
B. Đảm bảo tính bảo mật, riêng tư của dữ liệu và tránh thiên vị trong phân tích.
C. Chỉ tập trung vào việc đạt được kết quả có ý nghĩa thống kê.
D. Công bố dữ liệu cá nhân để tăng tính minh bạch.
24. Loại biểu đồ nào sau đây KHÔNG phù hợp để so sánh tỷ lệ phần trăm của các phần trong một tổng thể?
A. Biểu đồ tròn.
B. Biểu đồ cột chồng (100%).
C. Biểu đồ đường.
D. Biểu đồ thanh ngang chồng (100%).
25. Trong phân tích dữ liệu định tính, phương pháp nào sau đây thường được sử dụng để mã hóa và phân loại dữ liệu?
A. Hồi quy tuyến tính.
B. Phân tích nội dung (Content analysis).
C. Phân tích phương sai (ANOVA).
D. Kiểm định t.
26. Trong phân tích chuỗi thời gian, mục đích chính là:
A. So sánh trung bình giữa các nhóm khác nhau.
B. Dự đoán giá trị tương lai dựa trên dữ liệu quá khứ theo thời gian.
C. Xác định mối quan hệ giữa hai biến định lượng tại một thời điểm.
D. Phân tích dữ liệu văn bản.
27. Biểu đồ hộp (boxplot) thường được sử dụng để:
A. Hiển thị xu hướng theo thời gian.
B. So sánh tỷ lệ phần trăm.
C. Tóm tắt phân phối của một biến định lượng và xác định giá trị ngoại lệ.
D. Hiển thị mối quan hệ giữa hai biến định tính.
28. Khi nào thì việc sử dụng thống kê mô tả là phù hợp nhất?
A. Khi muốn đưa ra kết luận về tổng thể dựa trên mẫu.
B. Khi muốn tóm tắt và mô tả các đặc điểm chính của một tập dữ liệu.
C. Khi muốn dự đoán giá trị tương lai.
D. Khi muốn xác định mối quan hệ nhân quả giữa các biến.
29. Trong kiểm định giả thuyết, `giá trị p` (p-value) thể hiện:
A. Xác suất giả thuyết null là đúng.
B. Mức ý nghĩa thống kê (alpha) được chọn.
C. Xác suất quan sát được kết quả thống kê (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Sai số loại II (Beta).
30. Mục đích chính của việc lấy mẫu ngẫu nhiên là:
A. Đảm bảo mẫu có kích thước lớn nhất có thể.
B. Giảm thiểu chi phí thu thập dữ liệu.
C. Tăng tính đại diện của mẫu cho tổng thể và giảm thiểu thiên vị.
D. Làm cho phân tích thống kê đơn giản hơn.