Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng – Đề 3

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Đề 3 - Bài tập, đề thi trắc nghiệm online Thống kê ứng dụng

1. Khi nào thì nên sử dụng phân tích tương quan Spearman thay vì Pearson?

A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi muốn đo lường mối quan hệ tuyến tính
C. Khi dữ liệu không phân phối chuẩn hoặc có thứ bậc
D. Khi kích thước mẫu lớn

2. Ưu điểm chính của việc sử dụng phương pháp lấy mẫu phân tầng (stratified sampling) so với lấy mẫu ngẫu nhiên đơn giản là gì?

A. Dễ thực hiện hơn
B. Giảm sai số chuẩn của ước lượng và tăng tính đại diện của mẫu, đặc biệt khi tổng thể có các nhóm con khác biệt
C. Không yêu cầu danh sách tổng thể đầy đủ
D. Luôn cho kết quả chính xác hơn

3. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu thiếu (missing data)?

A. Phân tích hồi quy
B. Phân tích phương sai
C. Điền giá trị trung bình (mean imputation)
D. Kiểm định T-test

4. Bootstrap là phương pháp thống kê được sử dụng chủ yếu để làm gì?

A. Kiểm định giả thuyết về trung bình tổng thể
B. Ước tính độ chính xác của các ước lượng mẫu (ví dụ, sai số chuẩn, khoảng tin cậy) bằng cách lấy mẫu lại có hoàn lại từ dữ liệu mẫu ban đầu
C. Phân tích phương sai
D. Phân tích hồi quy tuyến tính

5. Hệ số tương quan (correlation coefficient) đo lường điều gì giữa hai biến định lượng?

A. Sự khác biệt trung bình giữa hai biến
B. Độ mạnh và hướng của mối quan hệ tuyến tính
C. Mức độ phụ thuộc phi tuyến tính
D. Tỷ lệ biến thiên của một biến so với biến kia

6. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?

A. Xác suất giả thuyết null là đúng
B. Xác suất dữ liệu quan sát được xảy ra nếu giả thuyết null là đúng
C. Mức độ ý nghĩa thống kê của kết quả
D. Sai số loại I

7. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Không bác bỏ giả thuyết null khi nó thực sự sai
C. Chấp nhận giả thuyết thay thế khi nó sai
D. Tính toán sai giá trị p

8. Phương pháp thống kê nào được sử dụng để ước lượng giá trị trung bình của một tổng thể dựa trên dữ liệu từ một mẫu?

A. Thống kê mô tả
B. Kiểm định giả thuyết
C. Hồi quy tuyến tính
D. Ước lượng khoảng tin cậy

9. Trong thống kê ứng dụng, `overfitting` (quá khớp) trong mô hình hóa có nghĩa là gì?

A. Mô hình quá đơn giản và không nắm bắt được các mối quan hệ quan trọng trong dữ liệu
B. Mô hình quá phức tạp và khớp quá sát với dữ liệu huấn luyện, dẫn đến hiệu suất kém trên dữ liệu mới
C. Mô hình không đủ dữ liệu để huấn luyện
D. Mô hình không hội tụ trong quá trình huấn luyện

10. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?

A. Đo lường sự phân tán của dữ liệu
B. So sánh trung bình của hai nhóm
C. So sánh trung bình của ba nhóm trở lên
D. Xác định mối quan hệ tuyến tính giữa các biến

11. Khi thực hiện kiểm định Chi-square cho tính độc lập, giả thuyết null (H0) thường là gì?

A. Các biến có liên quan đến nhau
B. Các biến không có liên quan đến nhau (độc lập)
C. Trung bình của các nhóm bằng nhau
D. Phương sai của các nhóm khác nhau

12. Biểu đồ hộp (boxplot) thường được sử dụng để thể hiện điều gì về phân phối của một tập dữ liệu?

A. Tần số của từng giá trị
B. Xu hướng theo thời gian
C. Sự phân tán, trung vị và tứ phân vị
D. Mối quan hệ giữa hai biến

13. Trong phân tích dữ liệu lớn (big data), thuật ngữ `volume`, `velocity`, `variety`, và `veracity` thường được dùng để mô tả điều gì?

A. Các loại lỗi dữ liệu phổ biến
B. Các giai đoạn trong quy trình phân tích dữ liệu
C. Các đặc điểm chính của dữ liệu lớn (4Vs)
D. Các phương pháp trực quan hóa dữ liệu

14. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?

A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi các giả định về phân phối của dữ liệu không được đáp ứng
D. Khi muốn tính toán khoảng tin cậy

15. Trong thống kê Bayesian, `prior probability` (xác suất tiên nghiệm) là gì?

A. Xác suất của dữ liệu quan sát được
B. Xác suất của giả thuyết sau khi xem xét dữ liệu
C. Xác suất ban đầu của giả thuyết trước khi xem xét dữ liệu
D. Xác suất của giả thuyết null

16. Độ lệch chuẩn (standard deviation) đo lường điều gì?

A. Xu hướng trung tâm của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Hình dạng phân phối của dữ liệu
D. Giá trị lớn nhất và nhỏ nhất trong dữ liệu

17. Biến `confounding variable` (biến gây nhiễu) gây ra vấn đề gì trong nghiên cứu quan sát?

A. Làm giảm kích thước mẫu hiệu quả
B. Gây khó khăn trong việc xác định mối quan hệ nhân quả thực sự giữa biến độc lập và biến phụ thuộc
C. Làm tăng độ lệch chuẩn của ước lượng
D. Làm cho dữ liệu trở nên không phân phối chuẩn

18. Phương pháp nào sau đây là một kỹ thuật lấy mẫu xác suất?

A. Lấy mẫu thuận tiện
B. Lấy mẫu phán đoán
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu theo hạn ngạch

19. Phương pháp nào sau đây được sử dụng để giảm chiều dữ liệu trong học máy và thống kê, bằng cách tìm ra các thành phần chính?

A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích thành phần chính (PCA)
D. Kiểm định Chi-square

20. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?

A. Ước tính tỷ lệ rủi ro
B. Ước tính hàm sống sót
C. So sánh thời gian sống sót trung bình giữa các nhóm
D. Mô hình hóa mối quan hệ giữa các yếu tố tiên lượng và thời gian sống sót

21. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) trong tiền xử lý dữ liệu là gì?

A. Loại bỏ giá trị ngoại lệ
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh và phân tích hiệu quả hơn
C. Thay thế giá trị thiếu
D. Tăng kích thước tập dữ liệu

22. Trong thống kê, `power` của một kiểm định giả thuyết là gì?

A. Xác suất mắc sai số loại I
B. Xác suất mắc sai số loại II
C. Xác suất bác bỏ đúng giả thuyết null khi nó thực sự sai
D. Xác suất không bác bỏ giả thuyết null khi nó thực sự đúng

23. Trong thống kê ứng dụng, loại biến nào thường được sử dụng để phân loại dữ liệu thành các nhóm hoặc danh mục mà không có thứ tự tự nhiên?

A. Biến định lượng
B. Biến định tính thứ bậc
C. Biến định tính danh nghĩa
D. Biến tỷ lệ

24. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với trung bình cộng (mean) để đo lường xu hướng trung tâm của dữ liệu?

A. Khi dữ liệu phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ (outliers)
C. Khi dữ liệu có tính đối xứng
D. Khi kích thước mẫu lớn

25. Phân tích hồi quy tuyến tính được sử dụng chủ yếu để làm gì?

A. Mô tả đặc điểm của một biến duy nhất
B. Kiểm tra sự khác biệt giữa hai nhóm
C. Dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập
D. Phân loại dữ liệu vào các nhóm khác nhau

26. Ý nghĩa của `khoảng tin cậy 95%` là gì?

A. Có 95% khả năng giá trị tham số thực sự nằm trong khoảng này
B. Nếu lặp lại quá trình lấy mẫu và tính toán khoảng tin cậy nhiều lần, khoảng 95% các khoảng tin cậy này sẽ chứa giá trị tham số thực sự của tổng thể
C. Sai số chuẩn của ước lượng là 5%
D. Có 95% dữ liệu nằm trong khoảng này

27. Trong phân tích Bayesian, `posterior probability` (xác suất hậu nghiệm) được tính toán như thế nào?

A. Chỉ dựa vào dữ liệu quan sát được
B. Chỉ dựa vào xác suất tiên nghiệm
C. Kết hợp xác suất tiên nghiệm và hàm правдоподобия (likelihood function) từ dữ liệu quan sát được
D. Bằng cách lấy trung bình của xác suất tiên nghiệm và xác suất правдоподобия

28. Trong thiết kế thử nghiệm, `randomization` (ngẫu nhiên hóa) quan trọng vì lý do chính nào?

A. Giảm kích thước mẫu cần thiết
B. Đảm bảo tính đại diện của mẫu cho tổng thể
C. Giảm thiểu ảnh hưởng của các yếu tố gây nhiễu (confounding variables) và tăng tính giá trị bên trong của nghiên cứu
D. Tăng độ chính xác của đo lường

29. Trong phân tích chuỗi thời gian, `tính dừng` (stationarity) của chuỗi có nghĩa là gì?

A. Chuỗi có xu hướng tăng hoặc giảm rõ rệt
B. Các đặc tính thống kê của chuỗi (như trung bình và phương sai) không thay đổi theo thời gian
C. Chuỗi có tính mùa vụ mạnh mẽ
D. Chuỗi có biến động rất lớn

30. Phương pháp thống kê nào thích hợp để phân tích mối quan hệ giữa hai biến phân loại?

A. Hồi quy tuyến tính
B. T-test
C. Kiểm định Chi-square
D. Phân tích phương sai (ANOVA)

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

1. Khi nào thì nên sử dụng phân tích tương quan Spearman thay vì Pearson?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

2. Ưu điểm chính của việc sử dụng phương pháp lấy mẫu phân tầng (stratified sampling) so với lấy mẫu ngẫu nhiên đơn giản là gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

3. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu thiếu (missing data)?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

4. Bootstrap là phương pháp thống kê được sử dụng chủ yếu để làm gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

5. Hệ số tương quan (correlation coefficient) đo lường điều gì giữa hai biến định lượng?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

6. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

7. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

8. Phương pháp thống kê nào được sử dụng để ước lượng giá trị trung bình của một tổng thể dựa trên dữ liệu từ một mẫu?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

9. Trong thống kê ứng dụng, 'overfitting' (quá khớp) trong mô hình hóa có nghĩa là gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

10. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

11. Khi thực hiện kiểm định Chi-square cho tính độc lập, giả thuyết null (H0) thường là gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

12. Biểu đồ hộp (boxplot) thường được sử dụng để thể hiện điều gì về phân phối của một tập dữ liệu?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

13. Trong phân tích dữ liệu lớn (big data), thuật ngữ 'volume', 'velocity', 'variety', và 'veracity' thường được dùng để mô tả điều gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

14. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

15. Trong thống kê Bayesian, 'prior probability' (xác suất tiên nghiệm) là gì?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

16. Độ lệch chuẩn (standard deviation) đo lường điều gì?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

17. Biến 'confounding variable' (biến gây nhiễu) gây ra vấn đề gì trong nghiên cứu quan sát?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

18. Phương pháp nào sau đây là một kỹ thuật lấy mẫu xác suất?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

19. Phương pháp nào sau đây được sử dụng để giảm chiều dữ liệu trong học máy và thống kê, bằng cách tìm ra các thành phần chính?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

20. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

21. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) trong tiền xử lý dữ liệu là gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

22. Trong thống kê, 'power' của một kiểm định giả thuyết là gì?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

23. Trong thống kê ứng dụng, loại biến nào thường được sử dụng để phân loại dữ liệu thành các nhóm hoặc danh mục mà không có thứ tự tự nhiên?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

24. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với trung bình cộng (mean) để đo lường xu hướng trung tâm của dữ liệu?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

25. Phân tích hồi quy tuyến tính được sử dụng chủ yếu để làm gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

26. Ý nghĩa của 'khoảng tin cậy 95%' là gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

27. Trong phân tích Bayesian, 'posterior probability' (xác suất hậu nghiệm) được tính toán như thế nào?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

28. Trong thiết kế thử nghiệm, 'randomization' (ngẫu nhiên hóa) quan trọng vì lý do chính nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

29. Trong phân tích chuỗi thời gian, 'tính dừng' (stationarity) của chuỗi có nghĩa là gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê ứng dụng

Tags: Bộ đề 3

30. Phương pháp thống kê nào thích hợp để phân tích mối quan hệ giữa hai biến phân loại?