Đề thi, bài tập trắc nghiệm online Thống kê học – Đề 14

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Thống kê học

Đề 14 - Bài tập, đề thi trắc nghiệm online Thống kê học

1. Giá trị P (p-value) trong kiểm định giả thuyết biểu thị điều gì?

A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả kiểm định hoặc kết quả cực đoan hơn nếu giả thuyết null là đúng.
C. Xác suất giả thuyết đối là đúng.
D. Ngưỡng ý nghĩa α.

2. Trong phân tích chuỗi thời gian (time series analysis), thành phần `tính mùa vụ` (seasonality) đề cập đến điều gì?

A. Xu hướng dài hạn của chuỗi thời gian.
B. Biến động ngắn hạn và ngẫu nhiên.
C. Mô hình biến động lặp lại trong khoảng thời gian cố định, thường là một năm.
D. Sự thay đổi đột ngột và không lường trước được.

3. Thống kê mô tả (descriptive statistics) được sử dụng để làm gì?

A. Đưa ra kết luận về quần thể dựa trên mẫu.
B. Mô tả và tóm tắt các đặc điểm chính của một tập dữ liệu.
C. Dự đoán giá trị tương lai của biến.
D. Kiểm định giả thuyết về quần thể.

4. Trong thống kê sinh học (biostatistics), `nghiên cứu когорт` (cohort study) là gì?

A. Một nghiên cứu can thiệp trong đó các đối tượng được phân ngẫu nhiên vào nhóm can thiệp và nhóm chứng.
B. Một nghiên cứu quan sát theo dõi một nhóm người theo thời gian để xem sự phát triển của một bệnh hoặc tình trạng cụ thể.
C. Một nghiên cứu cắt ngang (cross-sectional study) thu thập dữ liệu tại một thời điểm duy nhất.
D. Một nghiên cứu hồi cứu (retrospective study) xem xét dữ liệu đã thu thập trong quá khứ.

5. Trong phân tích hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?

A. Độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên 1 đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả biến độc lập bằng 0.
C. Độ mạnh của mối quan hệ tuyến tính.
D. Sai số chuẩn của ước lượng.

6. Phân phối nào sau đây là nền tảng cho nhiều kiểm định giả thuyết tham số, đặc biệt khi kích thước mẫu lớn?

A. Phân phối nhị thức.
B. Phân phối Poisson.
C. Phân phối chuẩn (phân phối Gaussian).
D. Phân phối đều.

7. Phương pháp lấy mẫu nào mà mỗi thành viên của quần thể có cơ hội được chọn như nhau?

A. Lấy mẫu phân tầng
B. Lấy mẫu cụm
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu thuận tiện

8. Hệ số tương quan (correlation coefficient) đo lường điều gì?

A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
B. Độ mạnh và hướng của mối quan hệ phi tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Mức độ phân tán của dữ liệu.

9. Ma trận hiệp phương sai (covariance matrix) mô tả điều gì?

A. Trung bình và độ lệch chuẩn của từng biến.
B. Hiệp phương sai giữa tất cả các cặp biến trong một tập hợp các biến.
C. Tương quan giữa tất cả các cặp biến trong một tập hợp các biến.
D. Phương sai của từng biến riêng lẻ.

10. Biểu đồ nào sau đây thích hợp nhất để thể hiện tần số của dữ liệu định tính?

A. Biểu đồHistogram
B. Biểu đồ hộp (Box plot)
C. Biểu đồ tròn (Pie chart)
D. Biểu đồ phân tán (Scatter plot)

11. Trong thống kê Bayesian, khái niệm `prior` (tiền nghiệm) đề cập đến điều gì?

A. Dữ liệu mẫu thu thập được.
B. Phân phối xác suất của tham số quần thể trước khi xem xét dữ liệu mẫu.
C. Phân phối xác suất của dữ liệu mẫu.
D. Ngưỡng ý nghĩa α.

12. Kỹ thuật `bootstrap` trong thống kê là gì?

A. Một phương pháp để tăng kích thước mẫu dữ liệu.
B. Một phương pháp lấy mẫu lại (resampling) để ước tính phân phối lấy mẫu của một thống kê hoặc xây dựng khoảng tin cậy.
C. Một phương pháp để chuẩn hóa dữ liệu.
D. Một phương pháp để kiểm tra sự khác biệt giữa trung bình của hai nhóm.

13. Phương pháp nào sau đây thường được sử dụng để đánh giá độ tin cậy nội tại (internal consistency reliability) của một thang đo trong nghiên cứu khảo sát?

A. Độ tin cậy kiểm tra-lại (test-retest reliability).
B. Độ tin cậy giữa người đánh giá (inter-rater reliability).
C. Cronbach`s Alpha.
D. Giá trị P (p-value).

14. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?

A. Ước tính thời gian sống trung bình.
B. Ước tính hàm sống sót (survival function), tức là xác suất sống sót sau một thời điểm nhất định.
C. So sánh thời gian sống trung bình giữa hai nhóm.
D. Xác định các yếu tố tiên lượng ảnh hưởng đến thời gian sống.

15. Giá trị ngoại lệ (outlier) là gì?

A. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị nằm xa so với phần lớn các giá trị khác trong tập dữ liệu.
D. Giá trị trung vị của tập dữ liệu.

16. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần một sự kiện hiếm gặp xảy ra trong một khoảng thời gian hoặc không gian nhất định?

A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều

17. Mục đích của việc sử dụng trọng số (weights) trong thống kê là gì?

A. Để làm cho dữ liệu dễ hiểu hơn.
B. Để điều chỉnh cho sự khác biệt về tầm quan trọng hoặc tần suất xuất hiện của các quan sát trong mẫu.
C. Để loại bỏ giá trị ngoại lệ.
D. Để đơn giản hóa tính toán.

18. Trong phân tích dữ liệu lớn (big data analytics), `Hadoop` là gì?

A. Một ngôn ngữ lập trình thống kê.
B. Một hệ quản trị cơ sở dữ liệu quan hệ.
C. Một framework phần mềm mã nguồn mở để lưu trữ và xử lý dữ liệu lớn phân tán.
D. Một phương pháp trực quan hóa dữ liệu.

19. Khái niệm `độ mạnh kiểm định` (statistical power) trong kiểm định giả thuyết đề cập đến điều gì?

A. Xác suất mắc sai lầm Loại I.
B. Xác suất mắc sai lầm Loại II.
C. Xác suất bác bỏ đúng giả thuyết null khi nó thực sự sai.
D. Xác suất không bác bỏ giả thuyết null khi nó thực sự đúng.

20. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?

A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ biến động của trung bình mẫu từ mẫu này sang mẫu khác.
D. Trung bình của các sai số trong mẫu.

21. Trong học máy (machine learning), kỹ thuật `kiểm định chéo` (cross-validation) được sử dụng để làm gì?

A. Để tăng kích thước tập dữ liệu huấn luyện.
B. Để đánh giá hiệu suất của mô hình trên dữ liệu chưa từng thấy và tránh hiện tượng quá khớp (overfitting).
C. Để chọn các biến quan trọng nhất cho mô hình.
D. Để trực quan hóa dữ liệu.

22. Phương pháp nào sau đây được sử dụng để phân tích dữ liệu phân loại (categorical data) và kiểm tra mối quan hệ giữa các biến phân loại?

A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Phân tích tương quan Pearson.

23. Trong phân tích phương sai (ANOVA), mục đích chính là gì?

A. Kiểm tra sự khác biệt giữa trung bình của hai nhóm.
B. Kiểm tra sự khác biệt giữa trung bình của ba nhóm trở lên.
C. Đo lường mối quan hệ tuyến tính giữa hai biến.
D. Mô tả phân phối của một biến duy nhất.

24. Biến định lượng (quantitative variable) khác với biến định tính (qualitative variable) ở điểm nào?

A. Biến định lượng có thể được đo bằng số, còn biến định tính thì không.
B. Biến định tính có thể được đo bằng số, còn biến định lượng thì không.
C. Biến định lượng chỉ có thể có hai giá trị.
D. Biến định tính chỉ có thể có hai giá trị.

25. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?

A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu rất lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ, dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ).
D. Khi muốn tính toán khoảng tin cậy.

26. Phương pháp nào sau đây được sử dụng để giảm số chiều dữ liệu (dimensionality reduction) trong thống kê?

A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (PCA - Principal Component Analysis).
D. Kiểm định t-test.

27. Ý nghĩa của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?

A. Để loại bỏ giá trị ngoại lệ.
B. Để chuyển đổi dữ liệu về cùng một thang đo, giúp so sánh và phân tích dễ dàng hơn.
C. Để thay đổi hình dạng phân phối dữ liệu thành phân phối chuẩn.
D. Để tăng kích thước mẫu dữ liệu.

28. Trong kiểm định giả thuyết, sai lầm Loại I xảy ra khi nào?

A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Bác bỏ giả thuyết đối khi nó thực sự đúng.
D. Không bác bỏ giả thuyết đối khi nó thực sự sai.

29. Độ tin cậy (confidence level) của khoảng tin cậy (confidence interval) thể hiện điều gì?

A. Xác suất khoảng tin cậy chứa giá trị tham số quần thể thực sự.
B. Xác suất giá trị tham số quần thể nằm ngoài khoảng tin cậy.
C. Xác suất mẫu được chọn là đại diện cho quần thể.
D. Kích thước mẫu cần thiết để đạt được độ chính xác mong muốn.

30. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?

A. Trung vị
B. Độ lệch chuẩn
C. Trung bình
D. Mốt

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

1. Giá trị P (p-value) trong kiểm định giả thuyết biểu thị điều gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

2. Trong phân tích chuỗi thời gian (time series analysis), thành phần 'tính mùa vụ' (seasonality) đề cập đến điều gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

3. Thống kê mô tả (descriptive statistics) được sử dụng để làm gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

4. Trong thống kê sinh học (biostatistics), 'nghiên cứu когорт' (cohort study) là gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

5. Trong phân tích hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

6. Phân phối nào sau đây là nền tảng cho nhiều kiểm định giả thuyết tham số, đặc biệt khi kích thước mẫu lớn?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

7. Phương pháp lấy mẫu nào mà mỗi thành viên của quần thể có cơ hội được chọn như nhau?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

8. Hệ số tương quan (correlation coefficient) đo lường điều gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

9. Ma trận hiệp phương sai (covariance matrix) mô tả điều gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

10. Biểu đồ nào sau đây thích hợp nhất để thể hiện tần số của dữ liệu định tính?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

11. Trong thống kê Bayesian, khái niệm 'prior' (tiền nghiệm) đề cập đến điều gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

12. Kỹ thuật 'bootstrap' trong thống kê là gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

13. Phương pháp nào sau đây thường được sử dụng để đánh giá độ tin cậy nội tại (internal consistency reliability) của một thang đo trong nghiên cứu khảo sát?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

14. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

15. Giá trị ngoại lệ (outlier) là gì?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

16. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần một sự kiện hiếm gặp xảy ra trong một khoảng thời gian hoặc không gian nhất định?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

17. Mục đích của việc sử dụng trọng số (weights) trong thống kê là gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

18. Trong phân tích dữ liệu lớn (big data analytics), 'Hadoop' là gì?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

19. Khái niệm 'độ mạnh kiểm định' (statistical power) trong kiểm định giả thuyết đề cập đến điều gì?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

20. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

21. Trong học máy (machine learning), kỹ thuật 'kiểm định chéo' (cross-validation) được sử dụng để làm gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

22. Phương pháp nào sau đây được sử dụng để phân tích dữ liệu phân loại (categorical data) và kiểm tra mối quan hệ giữa các biến phân loại?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

23. Trong phân tích phương sai (ANOVA), mục đích chính là gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

24. Biến định lượng (quantitative variable) khác với biến định tính (qualitative variable) ở điểm nào?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

25. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

26. Phương pháp nào sau đây được sử dụng để giảm số chiều dữ liệu (dimensionality reduction) trong thống kê?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

27. Ý nghĩa của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

28. Trong kiểm định giả thuyết, sai lầm Loại I xảy ra khi nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

29. Độ tin cậy (confidence level) của khoảng tin cậy (confidence interval) thể hiện điều gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Thống kê học

Tags: Bộ đề 14

30. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?