Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng – Đề 6

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Đề 6 - Bài tập, đề thi trắc nghiệm online Thống kê ứng dụng

1. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu (Dimensionality reduction)?

A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định t (t-test).

2. Khi báo cáo kết quả kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?

A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc sai số loại I.
C. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả quan sát được, nếu giả thuyết null là đúng.
D. Xác suất mắc sai số loại II.

3. Trong phân tích hồi quy tuyến tính, hệ số R-squared đo lường điều gì?

A. Mức độ mạnh của mối quan hệ tuyến tính giữa các biến.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của ước lượng hồi quy.
D. Ý nghĩa thống kê của các hệ số hồi quy.

4. Khi nào thì phép kiểm định Chi-bình phương (Chi-square test) được sử dụng?

A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. Kiểm tra sự độc lập giữa hai biến định tính hoặc so sánh phân phối tần số quan sát được với phân phối kỳ vọng.
D. Đo lường mối quan hệ tuyến tính giữa hai biến định lượng.

5. Trong phân tích chuỗi thời gian, thành phần `xu hướng` (Trend) mô tả điều gì?

A. Biến động ngắn hạn và ngẫu nhiên trong chuỗi thời gian.
B. Sự biến động theo mùa hoặc chu kỳ cố định.
C. Sự thay đổi dài hạn và có hệ thống của chuỗi thời gian theo thời gian.
D. Các sự kiện bất thường hoặc đột biến trong chuỗi thời gian.

6. Trong thống kê ứng dụng, thuật ngữ `ngoại suy` (Extrapolation) đề cập đến điều gì?

A. Ước tính giá trị bên trong phạm vi dữ liệu đã quan sát.
B. Ước tính giá trị bên ngoài phạm vi dữ liệu đã quan sát.
C. Loại bỏ giá trị ngoại lệ khỏi dữ liệu.
D. Chia dữ liệu thành các nhóm nhỏ hơn để phân tích.

7. Tương quan (Correlation) đo lường điều gì giữa hai biến số?

A. Mức độ biến thiên của một biến khi biến kia thay đổi.
B. Mức độ quan hệ nhân quả giữa hai biến.
C. Mức độ quan hệ tuyến tính và hướng của mối quan hệ tuyến tính giữa hai biến.
D. Sự khác biệt trung bình giữa hai biến.

8. Giá trị trung vị (Median) thể hiện điều gì về một tập dữ liệu?

A. Giá trị trung bình cộng của tất cả các số liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm chính giữa tập dữ liệu khi đã được sắp xếp.
D. Độ lệch chuẩn của tập dữ liệu.

9. Trong phân tích sống còn (Survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?

A. Ước tính tỷ lệ rủi ro (Hazard ratio).
B. Ước tính hàm sống còn (Survival function) theo thời gian.
C. So sánh thời gian sống trung bình giữa các nhóm.
D. Xác định các yếu tố tiên lượng ảnh hưởng đến thời gian sống.

10. Khi nào thì kiểm định phi tham số (Non-parametric test) được ưu tiên sử dụng hơn kiểm định tham số (Parametric test)?

A. Khi dữ liệu có kích thước mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn tính toán khoảng tin cậy.

11. Phương pháp thống kê nào thường được sử dụng để kiểm định giả thuyết về sự khác biệt giữa trung bình của hai nhóm độc lập?

A. Phân tích phương sai (ANOVA)
B. Kiểm định t (t-test) độc lập
C. Hồi quy tuyến tính
D. Tương quan Pearson

12. Khi so sánh hai thuật toán phân loại, độ đo F1-score hữu ích hơn độ chính xác (Accuracy) trong trường hợp nào?

A. Khi dữ liệu có phân lớp cân bằng (balanced classes).
B. Khi chi phí của sai số dương tính giả (false positive) và âm tính giả (false negative) là như nhau.
C. Khi dữ liệu có phân lớp không cân bằng (imbalanced classes).
D. Khi chỉ quan tâm đến số lượng dự đoán đúng.

13. Chọn phát biểu SAI về thống kê ứng dụng.

A. Thống kê ứng dụng sử dụng các phương pháp thống kê để giải quyết các vấn đề thực tế trong nhiều lĩnh vực.
B. Thống kê ứng dụng chỉ tập trung vào lý thuyết thống kê, ít quan tâm đến ứng dụng thực tế.
C. Thống kê ứng dụng bao gồm cả thống kê mô tả và thống kê suy diễn.
D. Thống kê ứng dụng có thể hỗ trợ ra quyết định dựa trên dữ liệu.

14. Trong thống kê Bayesian, `phân phối tiên nghiệm` (Prior distribution) thể hiện điều gì?

A. Phân phối của dữ liệu quan sát được.
B. Phân phối của tham số sau khi quan sát dữ liệu.
C. Niềm tin ban đầu về phân phối của tham số trước khi quan sát dữ liệu.
D. Phân phối của sai số ngẫu nhiên.

15. Đa cộng tuyến (Multicollinearity) là vấn đề thường gặp trong loại phân tích thống kê nào?

A. Phân tích phương sai (ANOVA)
B. Kiểm định t (t-test)
C. Hồi quy đa biến (Multiple regression)
D. Phân tích tương quan (Correlation analysis)

16. Trong thống kê, `biến định tính` (Qualitative variable) khác với `biến định lượng` (Quantitative variable) ở điểm nào?

A. Biến định tính có thể đo lường bằng số, biến định lượng thì không.
B. Biến định tính biểu thị thuộc tính hoặc phẩm chất, biến định lượng biểu thị số lượng.
C. Biến định tính luôn có ít giá trị hơn biến định lượng.
D. Biến định tính được sử dụng trong thống kê mô tả, biến định lượng trong thống kê suy diễn.

17. Trong phân tích dữ liệu khảo sát, `tỷ lệ phản hồi` (Response rate) thấp có thể dẫn đến vấn đề gì?

A. Tăng độ chính xác của ước tính.
B. Giảm chi phí thu thập dữ liệu.
C. Sai lệch do không phản hồi (Non-response bias), làm giảm tính đại diện của mẫu.
D. Khó khăn trong việc phân tích thống kê.

18. Khi phân tích dữ liệu tỷ lệ (Ratio data), phép đo trung tâm nào là phù hợp nhất nếu muốn bảo toàn tính tỷ lệ?

A. Trung bình cộng (Mean)
B. Trung vị (Median)
C. Trung bình hình học (Geometric Mean)
D. Mode (Mode)

19. Sai số loại I trong kiểm định giả thuyết là gì?

A. Chấp nhận giả thuyết null khi nó thực sự đúng.
B. Bác bỏ giả thuyết null khi nó thực sự đúng.
C. Chấp nhận giả thuyết null khi nó thực sự sai.
D. Bác bỏ giả thuyết null khi nó thực sự sai.

20. Mục đích chính của việc lấy mẫu ngẫu nhiên trong nghiên cứu thống kê là gì?

A. Để giảm chi phí thu thập dữ liệu.
B. Để đảm bảo mẫu có kích thước lớn nhất có thể.
C. Để mẫu đại diện cho tổng thể, giảm thiểu sai lệch.
D. Để dễ dàng phân tích dữ liệu hơn.

21. Biểu đồ hộp (Box plot) thường được sử dụng để thể hiện điều gì về phân phối dữ liệu?

A. Xu hướng trung tâm (Mean, Median).
B. Mối quan hệ giữa hai biến số.
C. Độ phân tán, khoảng tứ phân vị (IQR), và giá trị ngoại lệ.
D. Tần số xuất hiện của các giá trị.

22. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật lấy mẫu xác suất (Probability sampling)?

A. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
B. Lấy mẫu phân tầng (Stratified sampling)
C. Lấy mẫu cụm (Cluster sampling)
D. Lấy mẫu thuận tiện (Convenience sampling)

23. Phân tích phương sai (ANOVA) được sử dụng để làm gì?

A. Kiểm tra sự khác biệt giữa trung bình của hai nhóm.
B. Kiểm tra sự khác biệt giữa phương sai của hai nhóm.
C. Kiểm tra sự khác biệt giữa trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.

24. Trong thống kê ứng dụng, loại biểu đồ nào thường được sử dụng để thể hiện sự phân bố tần số của dữ liệu liên tục?

A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ đường
D. Biểu đồ tần suất (Histogram)

25. Chọn phát biểu ĐÚNG về độ lệch chuẩn (Standard Deviation).

A. Độ lệch chuẩn càng nhỏ, dữ liệu càng phân tán rộng.
B. Độ lệch chuẩn đo lường vị trí trung tâm của dữ liệu.
C. Độ lệch chuẩn là căn bậc hai của phương sai.
D. Độ lệch chuẩn luôn có giá trị âm.

26. Khi nào thì việc sử dụng giá trị trung bình (Mean) làm thước đo trung tâm không phù hợp?

A. Khi dữ liệu có dạng phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers) đáng kể.
C. Khi kích thước mẫu lớn.
D. Khi muốn tính toán độ lệch chuẩn.

27. Ý nghĩa thực tiễn của kết quả thống kê khác với ý nghĩa thống kê ở điểm nào?

A. Ý nghĩa thống kê quan trọng hơn ý nghĩa thực tiễn.
B. Ý nghĩa thực tiễn đề cập đến tầm quan trọng hoặc tác động của kết quả trong thực tế, trong khi ý nghĩa thống kê chỉ ra tính không ngẫu nhiên của kết quả.
C. Ý nghĩa thống kê luôn đảm bảo ý nghĩa thực tiễn.
D. Ý nghĩa thực tiễn được xác định bởi giá trị p, ý nghĩa thống kê thì không.

28. Trong phân tích dữ liệu lớn (Big Data), kỹ thuật `lấy mẫu` (Sampling) vẫn quan trọng vì lý do chính nào?

A. Dữ liệu lớn luôn chứa nhiều lỗi.
B. Phân tích toàn bộ dữ liệu lớn thường tốn kém thời gian và tài nguyên tính toán.
C. Các phương pháp thống kê truyền thống không áp dụng được cho dữ liệu lớn.
D. Lấy mẫu giúp tăng độ chính xác của kết quả phân tích.

29. Khoảng tin cậy (Confidence interval) cho biết điều gì?

A. Xác suất giá trị tham số tổng thể nằm trong khoảng đó.
B. Khoảng giá trị mà chúng ta chắc chắn tham số tổng thể nằm trong đó.
C. Khoảng giá trị ước tính chứa tham số tổng thể với một độ tin cậy nhất định.
D. Sai số chuẩn của ước lượng điểm.

30. Trong kiểm định giả thuyết, mức ý nghĩa (Significance level - alpha) thường được chọn là 0.05. Điều này có nghĩa là gì?

A. Có 5% khả năng giả thuyết null là đúng.
B. Có 5% khả năng mắc sai số loại II.
C. Chúng ta chấp nhận 5% rủi ro bác bỏ giả thuyết null khi nó thực sự đúng (sai số loại I).
D. Có 95% khả năng giả thuyết null là đúng.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

1. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu (Dimensionality reduction)?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

2. Khi báo cáo kết quả kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

3. Trong phân tích hồi quy tuyến tính, hệ số R-squared đo lường điều gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

4. Khi nào thì phép kiểm định Chi-bình phương (Chi-square test) được sử dụng?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

5. Trong phân tích chuỗi thời gian, thành phần 'xu hướng' (Trend) mô tả điều gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

6. Trong thống kê ứng dụng, thuật ngữ 'ngoại suy' (Extrapolation) đề cập đến điều gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

7. Tương quan (Correlation) đo lường điều gì giữa hai biến số?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

8. Giá trị trung vị (Median) thể hiện điều gì về một tập dữ liệu?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

9. Trong phân tích sống còn (Survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

10. Khi nào thì kiểm định phi tham số (Non-parametric test) được ưu tiên sử dụng hơn kiểm định tham số (Parametric test)?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

11. Phương pháp thống kê nào thường được sử dụng để kiểm định giả thuyết về sự khác biệt giữa trung bình của hai nhóm độc lập?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

12. Khi so sánh hai thuật toán phân loại, độ đo F1-score hữu ích hơn độ chính xác (Accuracy) trong trường hợp nào?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

13. Chọn phát biểu SAI về thống kê ứng dụng.

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

14. Trong thống kê Bayesian, 'phân phối tiên nghiệm' (Prior distribution) thể hiện điều gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

15. Đa cộng tuyến (Multicollinearity) là vấn đề thường gặp trong loại phân tích thống kê nào?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

16. Trong thống kê, 'biến định tính' (Qualitative variable) khác với 'biến định lượng' (Quantitative variable) ở điểm nào?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

17. Trong phân tích dữ liệu khảo sát, 'tỷ lệ phản hồi' (Response rate) thấp có thể dẫn đến vấn đề gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

18. Khi phân tích dữ liệu tỷ lệ (Ratio data), phép đo trung tâm nào là phù hợp nhất nếu muốn bảo toàn tính tỷ lệ?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

19. Sai số loại I trong kiểm định giả thuyết là gì?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

20. Mục đích chính của việc lấy mẫu ngẫu nhiên trong nghiên cứu thống kê là gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

21. Biểu đồ hộp (Box plot) thường được sử dụng để thể hiện điều gì về phân phối dữ liệu?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

22. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật lấy mẫu xác suất (Probability sampling)?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

23. Phân tích phương sai (ANOVA) được sử dụng để làm gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

24. Trong thống kê ứng dụng, loại biểu đồ nào thường được sử dụng để thể hiện sự phân bố tần số của dữ liệu liên tục?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

25. Chọn phát biểu ĐÚNG về độ lệch chuẩn (Standard Deviation).

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

26. Khi nào thì việc sử dụng giá trị trung bình (Mean) làm thước đo trung tâm không phù hợp?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

27. Ý nghĩa thực tiễn của kết quả thống kê khác với ý nghĩa thống kê ở điểm nào?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

28. Trong phân tích dữ liệu lớn (Big Data), kỹ thuật 'lấy mẫu' (Sampling) vẫn quan trọng vì lý do chính nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

29. Khoảng tin cậy (Confidence interval) cho biết điều gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 7

30. Trong kiểm định giả thuyết, mức ý nghĩa (Significance level - alpha) thường được chọn là 0.05. Điều này có nghĩa là gì?