Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng – Đề 13

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Đề 13 - Bài tập, đề thi trắc nghiệm online Thống kê ứng dụng

1. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) là gì?

A. Loại bỏ giá trị ngoại lệ
B. Chuyển đổi dữ liệu về một thang đo chung để so sánh
C. Làm cho dữ liệu tuân theo phân phối chuẩn
D. Tăng kích thước tập dữ liệu

2. Hệ số tương quan Pearson đo lường điều gì giữa hai biến số định lượng?

A. Sự khác biệt trung bình giữa hai biến
B. Mức độ và hướng của mối quan hệ tuyến tính
C. Mối quan hệ phi tuyến tính
D. Mức độ phân tán của dữ liệu

3. Lỗi `đa cộng tuyến` (multicollinearity) trong hồi quy đa biến đề cập đến vấn đề gì?

A. Sai số trong việc thu thập dữ liệu
B. Mối tương quan cao giữa các biến độc lập
C. Mối tương quan thấp giữa biến độc lập và biến phụ thuộc
D. Số lượng biến độc lập quá nhiều

4. Ước lượng khoảng tin cậy cho phép chúng ta ước lượng điều gì về tham số quần thể?

A. Giá trị chính xác của tham số quần thể
B. Một khoảng giá trị mà tham số quần thể có khả năng nằm trong đó với một độ tin cậy nhất định
C. Độ lệch chuẩn của quần thể
D. Phương sai của quần thể

5. Khi nào việc sử dụng số trung vị (median) thích hợp hơn so với số trung bình (mean) để đo lường xu hướng trung tâm của dữ liệu?

A. Khi dữ liệu phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ
C. Khi dữ liệu có tính đối xứng
D. Khi dữ liệu không có giá trị ngoại lệ

6. Trong phân tích dữ liệu khảo sát, `thiên vị phản hồi` (response bias) đề cập đến điều gì?

A. Lỗi do kích thước mẫu quá nhỏ
B. Xu hướng người trả lời đưa ra câu trả lời không chính xác hoặc không trung thực
C. Lỗi trong quá trình nhập dữ liệu
D. Lỗi do chọn mẫu không ngẫu nhiên

7. Phương pháp thống kê nào thường được sử dụng để mô tả và tóm tắt các đặc điểm chính của một tập dữ liệu?

A. Thống kê suy diễn
B. Thống kê mô tả
C. Hồi quy tuyến tính
D. Kiểm định giả thuyết

8. Trong thống kê ứng dụng, `ngoại suy` (extrapolation) có nghĩa là gì?

A. Ước tính giá trị bên trong phạm vi dữ liệu quan sát
B. Ước tính giá trị bên ngoài phạm vi dữ liệu quan sát
C. Tính trung bình của dữ liệu
D. Loại bỏ giá trị ngoại lệ

9. Biến `gây nhiễu` (confounding variable) là gì trong nghiên cứu quan sát?

A. Biến không được đo lường trong nghiên cứu
B. Biến gây ra mối quan hệ giả tạo giữa biến độc lập và biến phụ thuộc
C. Biến độc lập chính trong nghiên cứu
D. Biến phụ thuộc trong nghiên cứu

10. Mục đích của việc `kiểm định hậu nghiệm` (post-hoc test) sau ANOVA là gì?

A. Xác định xem có sự khác biệt giữa các nhóm hay không
B. Xác định cụ thể cặp nhóm nào có sự khác biệt đáng kể sau khi ANOVA đã bác bỏ giả thuyết null về trung bình bằng nhau
C. Tăng độ mạnh của kiểm định ANOVA
D. Điều chỉnh giá trị p để giảm sai số loại I

11. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) thể hiện điều gì?

A. Độ dốc của đường hồi quy
B. Giá trị dự đoán của biến phụ thuộc khi tất cả biến độc lập bằng 0
C. Mức độ phù hợp của mô hình
D. Sai số của mô hình

12. Biểu đồ hộp (boxplot) thường được sử dụng để làm gì trong thống kê mô tả?

A. Thể hiện tần suất của các giá trị
B. So sánh trung bình giữa các nhóm
C. Hiển thị phân phối và các giá trị ngoại lệ của một biến định lượng
D. Thể hiện mối quan hệ giữa hai biến định lượng

13. Trong thống kê Bayesian, `xác suất tiên nghiệm` (prior probability) là gì?

A. Xác suất được tính toán từ dữ liệu mẫu
B. Xác suất ban đầu về một giả thuyết trước khi có dữ liệu
C. Xác suất sau khi đã cập nhật thông tin từ dữ liệu
D. Xác suất của dữ liệu quan sát

14. Phương pháp `bootstrap` trong thống kê ứng dụng được sử dụng để làm gì?

A. Kiểm định giả thuyết về trung bình quần thể
B. Ước tính sai số chuẩn và khoảng tin cậy bằng cách lấy mẫu lại có hoàn lại từ dữ liệu mẫu
C. Phân tích phương sai
D. Phân tích hồi quy

15. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?

A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo các giả định của kiểm định tham số (ví dụ: phân phối không chuẩn)
D. Khi muốn tăng độ mạnh của kiểm định

16. Phương pháp lấy mẫu nào đảm bảo rằng mỗi cá thể trong quần thể có cơ hội được chọn vào mẫu như nhau?

A. Lấy mẫu phân tầng
B. Lấy mẫu cụm
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu thuận tiện

17. Trong phân tích chuỗi thời gian, `tính dừng` (stationarity) của chuỗi thời gian có nghĩa là gì?

A. Chuỗi thời gian luôn tăng hoặc giảm
B. Các đặc tính thống kê của chuỗi (ví dụ: trung bình, phương sai) không thay đổi theo thời gian
C. Chuỗi thời gian có tính chu kỳ rõ ràng
D. Chuỗi thời gian không có xu hướng và tính mùa vụ

18. Phân phối chuẩn (Normal distribution) có đặc điểm quan trọng nào?

A. Dữ liệu luôn đối xứng
B. Đường cong hình chuông, đối xứng qua giá trị trung bình
C. Luôn có trung bình bằng 0 và độ lệch chuẩn bằng 1
D. Chỉ áp dụng cho dữ liệu rời rạc

19. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?

A. Xu hướng trung tâm của dữ liệu
B. Mức độ phân tán của dữ liệu quanh giá trị trung bình
C. Giá trị lớn nhất của dữ liệu
D. Giá trị nhỏ nhất của dữ liệu

20. Trong thống kê ứng dụng, loại dữ liệu nào cho phép thực hiện các phép toán số học (cộng, trừ, nhân, chia) một cách có ý nghĩa?

A. Dữ liệu định danh
B. Dữ liệu thứ bậc
C. Dữ liệu khoảng
D. Dữ liệu định tính

21. Phân tích phương sai (ANOVA) được sử dụng để làm gì?

A. So sánh trung bình của hai nhóm
B. So sánh phương sai của hai nhóm
C. So sánh trung bình của ba nhóm trở lên
D. Đo lường mối quan hệ tuyến tính giữa hai biến

22. Sai số loại I trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết null khi nó thực sự sai
B. Không bác bỏ giả thuyết null khi nó thực sự đúng
C. Bác bỏ giả thuyết null khi nó thực sự đúng
D. Không bác bỏ giả thuyết null khi nó thực sự sai

23. Trong thiết kế thí nghiệm, `nguyên tắc ngẫu nhiên hóa` (randomization) quan trọng như thế nào?

A. Giảm kích thước mẫu cần thiết
B. Đảm bảo tính đồng nhất của nhóm can thiệp
C. Giảm thiểu thiên vị và đảm bảo tính so sánh giữa các nhóm
D. Tăng độ chính xác của đo lường

24. Phương pháp phân tích nhân tố (factor analysis) được sử dụng để làm gì?

A. Dự báo giá trị tương lai của biến
B. Giảm số lượng biến bằng cách xác định các nhân tố ẩn chung
C. So sánh trung bình giữa các nhóm
D. Phân loại đối tượng vào các nhóm khác nhau

25. Phân tích trung gian (mediation analysis) được sử dụng để khám phá điều gì?

A. Mối quan hệ trực tiếp giữa biến độc lập và biến phụ thuộc
B. Cơ chế hoặc con đường mà qua đó biến độc lập ảnh hưởng đến biến phụ thuộc thông qua một biến trung gian
C. Mối quan hệ tương tác giữa các biến độc lập
D. Ảnh hưởng của biến gây nhiễu

26. Trong thống kê ứng dụng, thuật ngữ `overfitting` (quá khớp) trong mô hình hóa có nghĩa là gì?

A. Mô hình quá đơn giản và không nắm bắt được các mẫu trong dữ liệu
B. Mô hình quá phức tạp và khớp quá sát với dữ liệu huấn luyện, dẫn đến kém hiệu quả trên dữ liệu mới
C. Mô hình phù hợp hoàn hảo với dữ liệu huấn luyện và dữ liệu kiểm tra
D. Mô hình không thể hội tụ trong quá trình huấn luyện

27. Khi thực hiện kiểm định t-test độc lập, giả định quan trọng về phương sai của hai nhóm là gì?

A. Phương sai phải khác nhau
B. Phương sai phải bằng nhau hoặc có thể khác nhau (tùy phiên bản t-test)
C. Phương sai phải bằng 0
D. Phương sai không liên quan đến kiểm định t-test

28. Trong kiểm định giả thuyết, `giá trị p` (p-value) thể hiện điều gì?

A. Xác suất giả thuyết null là đúng
B. Xác suất quan sát được kết quảExtreme hoặc hơn, giả sử giả thuyết null là đúng
C. Mức ý nghĩa thống kê
D. Sai số loại I

29. Phân tích cụm (cluster analysis) nhằm mục đích gì?

A. Dự đoán giá trị của biến phụ thuộc
B. Phân nhóm các đối tượng tương tự thành các cụm dựa trên đặc điểm của chúng
C. Kiểm định sự khác biệt giữa các nhóm
D. Đo lường mối quan hệ tuyến tính giữa các biến

30. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) S(t) biểu thị điều gì?

A. Thời gian trung bình sống sót
B. Xác suất một cá nhân sống sót ít nhất đến thời điểm t
C. Tỷ lệ tử vong tại thời điểm t
D. Thời gian sống sót dài nhất quan sát được

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

1. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) là gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

2. Hệ số tương quan Pearson đo lường điều gì giữa hai biến số định lượng?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

3. Lỗi 'đa cộng tuyến' (multicollinearity) trong hồi quy đa biến đề cập đến vấn đề gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

4. Ước lượng khoảng tin cậy cho phép chúng ta ước lượng điều gì về tham số quần thể?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

5. Khi nào việc sử dụng số trung vị (median) thích hợp hơn so với số trung bình (mean) để đo lường xu hướng trung tâm của dữ liệu?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

6. Trong phân tích dữ liệu khảo sát, 'thiên vị phản hồi' (response bias) đề cập đến điều gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

7. Phương pháp thống kê nào thường được sử dụng để mô tả và tóm tắt các đặc điểm chính của một tập dữ liệu?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

8. Trong thống kê ứng dụng, 'ngoại suy' (extrapolation) có nghĩa là gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

9. Biến 'gây nhiễu' (confounding variable) là gì trong nghiên cứu quan sát?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

10. Mục đích của việc 'kiểm định hậu nghiệm' (post-hoc test) sau ANOVA là gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

11. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) thể hiện điều gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

12. Biểu đồ hộp (boxplot) thường được sử dụng để làm gì trong thống kê mô tả?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

13. Trong thống kê Bayesian, 'xác suất tiên nghiệm' (prior probability) là gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

14. Phương pháp 'bootstrap' trong thống kê ứng dụng được sử dụng để làm gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

15. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

16. Phương pháp lấy mẫu nào đảm bảo rằng mỗi cá thể trong quần thể có cơ hội được chọn vào mẫu như nhau?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

17. Trong phân tích chuỗi thời gian, 'tính dừng' (stationarity) của chuỗi thời gian có nghĩa là gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

18. Phân phối chuẩn (Normal distribution) có đặc điểm quan trọng nào?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

19. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

20. Trong thống kê ứng dụng, loại dữ liệu nào cho phép thực hiện các phép toán số học (cộng, trừ, nhân, chia) một cách có ý nghĩa?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

21. Phân tích phương sai (ANOVA) được sử dụng để làm gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

22. Sai số loại I trong kiểm định giả thuyết xảy ra khi nào?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

23. Trong thiết kế thí nghiệm, 'nguyên tắc ngẫu nhiên hóa' (randomization) quan trọng như thế nào?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

24. Phương pháp phân tích nhân tố (factor analysis) được sử dụng để làm gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

25. Phân tích trung gian (mediation analysis) được sử dụng để khám phá điều gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

26. Trong thống kê ứng dụng, thuật ngữ 'overfitting' (quá khớp) trong mô hình hóa có nghĩa là gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

27. Khi thực hiện kiểm định t-test độc lập, giả định quan trọng về phương sai của hai nhóm là gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

28. Trong kiểm định giả thuyết, 'giá trị p' (p-value) thể hiện điều gì?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

29. Phân tích cụm (cluster analysis) nhằm mục đích gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 13

30. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) S(t) biểu thị điều gì?