Đề thi, bài tập trắc nghiệm online Học máy – Đề 2

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Học máy

Đề 2 - Bài tập, đề thi trắc nghiệm online Học máy

1. Đâu là một kỹ thuật để giảm thiểu overfitting?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình (ví dụ: sử dụng regularization).
C. Sử dụng cross-validation để đánh giá mô hình.
D. Tất cả các đáp án trên.

2. Trong ngữ cảnh của mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), lớp `convolutional layer` (lớp tích chập) có chức năng chính là gì?

A. Phân loại hình ảnh.
B. Giảm chiều dữ liệu đầu vào.
C. Tự động học các đặc trưng không gian từ dữ liệu đầu vào (ví dụ: hình ảnh).
D. Tối ưu hóa trọng số của mạng.

3. Mô hình `Decision Tree` hoạt động dựa trên nguyên tắc nào?

A. Tìm hyperplane tối ưu để phân tách các lớp.
B. Phân chia dữ liệu một cách đệ quy dựa trên các đặc trưng (features) để tạo ra cấu trúc cây quyết định.
C. Tìm trung tâm của các cụm dữ liệu.
D. Tính khoảng cách đến các điểm lân cận gần nhất.

4. Học máy (Machine Learning) là gì?

A. Một lĩnh vực của khoa học máy tính cho phép máy tính học hỏi từ dữ liệu mà không cần được lập trình rõ ràng.
B. Một phương pháp lập trình tuyến tính để giải quyết các bài toán tối ưu hóa.
C. Một kỹ thuật nén dữ liệu để giảm dung lượng lưu trữ.
D. Một loại ngôn ngữ lập trình bậc cao chuyên dụng cho phân tích dữ liệu.

5. Đâu là một ví dụ về thuật toán phân cụm (clustering)?

A. Linear Regression
B. K-means
C. Logistic Regression
D. Support Vector Machine

6. Trong học máy, `bias` và `variance` đề cập đến điều gì?

A. Hai loại thuật toán học máy khác nhau.
B. Hai phương pháp đánh giá mô hình khác nhau.
C. Bias là lỗi do đơn giản hóa quá mức mô hình, Variance là lỗi do mô hình quá nhạy cảm với sự biến động trong dữ liệu huấn luyện.
D. Bias là độ chính xác của mô hình trên dữ liệu huấn luyện, Variance là độ chính xác trên dữ liệu kiểm tra.

7. Mục tiêu của việc sử dụng `dropout` trong mạng nơ-ron là gì?

A. Tăng tốc độ huấn luyện.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Tăng độ chính xác trên dữ liệu huấn luyện.
D. Thêm lớp ẩn vào mạng nơ-ron.

8. Phương pháp nào sau đây thuộc loại học tăng cường (Reinforcement Learning)?

A. K-means clustering
B. Support Vector Machines (SVM)
C. Q-learning
D. Principal Component Analysis (PCA)

9. Mục tiêu chính của học không giám sát (Unsupervised Learning) là gì?

A. Dự đoán giá trị của một biến mục tiêu dựa trên các biến đầu vào đã cho.
B. Tìm kiếm cấu trúc ẩn, mẫu hoặc nhóm trong dữ liệu không có nhãn.
C. Huấn luyện một tác nhân (agent) để đưa ra chuỗi hành động tối ưu trong một môi trường để tối đa hóa phần thưởng.
D. Giảm số chiều của dữ liệu trong khi vẫn giữ được thông tin quan trọng nhất.

10. Khi nào nên ưu tiên sử dụng mô hình học máy đơn giản (ví dụ: Linear Regression, Decision Tree nông) thay vì mô hình phức tạp (ví dụ: Deep Neural Network)?

A. Khi dữ liệu huấn luyện rất lớn và phức tạp.
B. Khi cần độ chính xác tuyệt đối trên dữ liệu huấn luyện.
C. Khi dữ liệu có cấu trúc đơn giản, mối quan hệ tuyến tính hoặc khi cần mô hình dễ giải thích.
D. Khi muốn đạt được hiệu suất tốt nhất trên mọi loại dữ liệu.

11. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu?

A. Regularization
B. Principal Component Analysis (PCA)
C. Cross-validation
D. Gradient Descent

12. Sự khác biệt chính giữa hồi quy tuyến tính (Linear Regression) và hồi quy logistic (Logistic Regression) là gì?

A. Hồi quy tuyến tính dự đoán biến mục tiêu liên tục, trong khi hồi quy logistic dự đoán biến mục tiêu rời rạc (phân loại).
B. Hồi quy tuyến tính sử dụng hàm kích hoạt sigmoid, trong khi hồi quy logistic sử dụng hàm kích hoạt tuyến tính.
C. Hồi quy logistic chỉ có thể xử lý dữ liệu tuyến tính, trong khi hồi quy tuyến tính có thể xử lý dữ liệu phi tuyến.
D. Hồi quy tuyến tính mạnh mẽ hơn trước overfitting so với hồi quy logistic.

13. Đâu là một thách thức phổ biến trong học máy khi làm việc với dữ liệu thực tế?

A. Luôn có đủ dữ liệu huấn luyện chất lượng cao.
B. Dữ liệu luôn sạch và được gán nhãn chính xác.
C. Xử lý dữ liệu nhiễu, dữ liệu thiếu và dữ liệu không cân bằng.
D. Thuật toán học máy luôn hoạt động tốt ngay từ đầu.

14. Thuật ngữ `deep learning` (học sâu) thường được sử dụng để chỉ loại mô hình học máy nào?

A. Cây quyết định sâu (Deep decision trees).
B. Mạng nơ-ron nhiều lớp (Deep neural networks).
C. Máy vector hỗ trợ sâu (Deep support vector machines).
D. Hồi quy tuyến tính sâu (Deep linear regression).

15. Ma trận nhầm lẫn (Confusion Matrix) thường được sử dụng để đánh giá hiệu suất của mô hình nào?

A. Mô hình hồi quy (Regression)
B. Mô hình phân cụm (Clustering)
C. Mô hình phân loại (Classification)
D. Mô hình giảm chiều (Dimensionality Reduction)

16. Đâu là loại học máy mà mô hình được huấn luyện trên dữ liệu đã được gán nhãn?

A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)

17. Phương pháp `cross-validation` được sử dụng để làm gì?

A. Tối ưu hóa siêu tham số của mô hình.
B. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu chưa từng thấy.
C. Giảm kích thước tập dữ liệu huấn luyện.
D. Chọn thuật toán học máy tốt nhất.

18. Ưu điểm chính của thuật toán `Support Vector Machines` (SVM) là gì?

A. Dễ dàng xử lý dữ liệu phi tuyến.
B. Hiệu quả cao trong việc xử lý dữ liệu kích thước lớn.
C. Khả năng khái quát hóa tốt, đặc biệt trong không gian đặc trưng (feature space) có số chiều cao.
D. Ít bị ảnh hưởng bởi nhiễu trong dữ liệu.

19. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?

A. Nhận dạng hình ảnh (Image recognition).
B. Dịch máy (Machine translation).
C. Thiết kế vi mạch (Circuit design).
D. Lọc thư rác (Spam filtering).

20. Trong học máy, `hyperparameter tuning` (tinh chỉnh siêu tham số) đề cập đến quá trình nào?

A. Lựa chọn thuật toán học máy phù hợp nhất.
B. Tối ưu hóa các tham số nội tại của mô hình (ví dụ: trọng số trong mạng nơ-ron).
C. Tìm kiếm các giá trị tối ưu cho các siêu tham số của mô hình (ví dụ: learning rate, số lượng lớp ẩn).
D. Đánh giá hiệu suất của mô hình trên dữ liệu kiểm tra.

21. Thuật toán `K-Nearest Neighbors` (KNN) thuộc loại học máy nào?

A. Học tăng cường
B. Học không giám sát
C. Học có giám sát
D. Học bán giám sát

22. Trong ngữ cảnh học máy, `model selection` (lựa chọn mô hình) là quá trình nào?

A. Tối ưu hóa tham số của một mô hình cụ thể.
B. Lựa chọn mô hình học máy tốt nhất từ một tập hợp các mô hình khác nhau cho một bài toán cụ thể.
C. Huấn luyện mô hình trên toàn bộ tập dữ liệu.
D. Đánh giá hiệu suất của một mô hình duy nhất.

23. Đâu là một ví dụ về thuật toán học tăng cường (Reinforcement Learning) được sử dụng trong trò chơi?

A. K-means clustering
B. Q-learning
C. Principal Component Analysis (PCA)
D. Linear Regression

24. Khái niệm `ensemble learning` (học ансамбль) trong học máy là gì?

A. Huấn luyện một mô hình duy nhất với nhiều thuật toán khác nhau.
B. Kết hợp dự đoán từ nhiều mô hình học máy khác nhau để cải thiện hiệu suất tổng thể.
C. Chia nhỏ dữ liệu huấn luyện thành nhiều phần và huấn luyện mô hình trên từng phần.
D. Sử dụng một mô hình học máy duy nhất cho nhiều bài toán khác nhau.

25. Trong ngữ cảnh của mạng nơ-ron (Neural Networks), hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán độ lỗi (loss) của mạng.
B. Đưa tính phi tuyến vào mạng nơ-ron.
C. Tối ưu hóa trọng số (weights) của mạng.
D. Khởi tạo giá trị đầu vào cho mạng.

26. Thuật toán Gradient Descent được sử dụng để làm gì trong học máy?

A. Chọn đặc trưng (feature selection).
B. Giảm chiều dữ liệu.
C. Tối ưu hóa tham số của mô hình (ví dụ: trọng số trong mạng nơ-ron) để giảm thiểu hàm mất mát (loss function).
D. Phân cụm dữ liệu.

27. Trong học máy, `regularization` là kỹ thuật được sử dụng để làm gì?

A. Tăng tốc độ huấn luyện mô hình.
B. Giảm overfitting bằng cách thêm một hình phạt vào hàm mất mát (loss function).
C. Cải thiện độ chính xác trên dữ liệu huấn luyện.
D. Tăng kích thước tập dữ liệu huấn luyện.

28. Trong học máy, `feature engineering` đề cập đến quá trình nào?

A. Lựa chọn thuật toán học máy phù hợp nhất cho bài toán.
B. Tối ưu hóa siêu tham số của mô hình học máy.
C. Trích xuất, biến đổi và lựa chọn các đặc trưng (features) có ý nghĩa từ dữ liệu thô để cải thiện hiệu suất mô hình.
D. Đánh giá hiệu suất của mô hình học máy trên tập dữ liệu kiểm tra.

29. Độ đo `Precision` trong đánh giá mô hình phân loại được tính như thế nào?

A. Số lượng True Positives chia cho tổng số lượng thực tế là Positive.
B. Số lượng True Positives chia cho tổng số lượng dự đoán là Positive.
C. Số lượng True Negatives chia cho tổng số lượng thực tế là Negative.
D. Số lượng True Negatives chia cho tổng số lượng dự đoán là Negative.

30. Hiện tượng `overfitting` trong học máy xảy ra khi nào?

A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình học quá kém trên cả dữ liệu huấn luyện và dữ liệu mới.
C. Mô hình không đủ dữ liệu để học.
D. Dữ liệu huấn luyện bị nhiễu.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

1. Đâu là một kỹ thuật để giảm thiểu overfitting?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

2. Trong ngữ cảnh của mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), lớp 'convolutional layer' (lớp tích chập) có chức năng chính là gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

3. Mô hình 'Decision Tree' hoạt động dựa trên nguyên tắc nào?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

4. Học máy (Machine Learning) là gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

5. Đâu là một ví dụ về thuật toán phân cụm (clustering)?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

6. Trong học máy, 'bias' và 'variance' đề cập đến điều gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

7. Mục tiêu của việc sử dụng 'dropout' trong mạng nơ-ron là gì?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

8. Phương pháp nào sau đây thuộc loại học tăng cường (Reinforcement Learning)?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

9. Mục tiêu chính của học không giám sát (Unsupervised Learning) là gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

10. Khi nào nên ưu tiên sử dụng mô hình học máy đơn giản (ví dụ: Linear Regression, Decision Tree nông) thay vì mô hình phức tạp (ví dụ: Deep Neural Network)?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

11. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

12. Sự khác biệt chính giữa hồi quy tuyến tính (Linear Regression) và hồi quy logistic (Logistic Regression) là gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

13. Đâu là một thách thức phổ biến trong học máy khi làm việc với dữ liệu thực tế?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

14. Thuật ngữ 'deep learning' (học sâu) thường được sử dụng để chỉ loại mô hình học máy nào?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

15. Ma trận nhầm lẫn (Confusion Matrix) thường được sử dụng để đánh giá hiệu suất của mô hình nào?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

16. Đâu là loại học máy mà mô hình được huấn luyện trên dữ liệu đã được gán nhãn?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

17. Phương pháp 'cross-validation' được sử dụng để làm gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

18. Ưu điểm chính của thuật toán 'Support Vector Machines' (SVM) là gì?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

19. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

20. Trong học máy, 'hyperparameter tuning' (tinh chỉnh siêu tham số) đề cập đến quá trình nào?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

21. Thuật toán 'K-Nearest Neighbors' (KNN) thuộc loại học máy nào?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

22. Trong ngữ cảnh học máy, 'model selection' (lựa chọn mô hình) là quá trình nào?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

23. Đâu là một ví dụ về thuật toán học tăng cường (Reinforcement Learning) được sử dụng trong trò chơi?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

24. Khái niệm 'ensemble learning' (học ансамбль) trong học máy là gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

25. Trong ngữ cảnh của mạng nơ-ron (Neural Networks), hàm kích hoạt (activation function) có vai trò gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

26. Thuật toán Gradient Descent được sử dụng để làm gì trong học máy?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

27. Trong học máy, 'regularization' là kỹ thuật được sử dụng để làm gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

28. Trong học máy, 'feature engineering' đề cập đến quá trình nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

29. Độ đo 'Precision' trong đánh giá mô hình phân loại được tính như thế nào?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 2

30. Hiện tượng 'overfitting' trong học máy xảy ra khi nào?