Đề thi, bài tập trắc nghiệm online Học máy – Đề 14

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Học máy

Đề 14 - Bài tập, đề thi trắc nghiệm online Học máy

1. `Recall` (độ phủ) được định nghĩa là gì?

A. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu dự đoán là dương tính.
B. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu thực tế là dương tính.
C. Tỷ lệ mẫu thực tế là dương tính trên tổng số mẫu.
D. Tỷ lệ mẫu dự đoán sai trên tổng số mẫu thực tế là âm tính.

2. Trong ngữ cảnh của cây quyết định (Decision Tree), `entropy` (độ hỗn loạn) được sử dụng để làm gì?

A. Đo lường độ chính xác của cây quyết định.
B. Xác định thuộc tính tốt nhất để phân chia nút trong quá trình xây dựng cây.
C. Kiểm soát độ phức tạp của cây quyết định để tránh overfitting.
D. Tính toán độ sâu tối ưu của cây quyết định.

3. Trong thuật toán Support Vector Machine (SVM), `kernel` (hàm nhân) có vai trò gì?

A. Tăng tốc độ huấn luyện SVM.
B. Biến đổi dữ liệu đầu vào sang một không gian chiều cao hơn để có thể tìm được siêu phẳng phân tách tuyến tính, ngay cả khi dữ liệu không phân tách tuyến tính trong không gian gốc.
C. Giảm số lượng vector hỗ trợ.
D. Đơn giản hóa bài toán tối ưu hóa trong SVM.

4. Mục đích của việc sử dụng `dropout` trong mạng nơ-ron là gì?

A. Tăng tốc độ huấn luyện mạng nơ-ron.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua (dropout) một số nơ-ron trong quá trình huấn luyện.
C. Tăng độ chính xác của mạng nơ-ron trên dữ liệu huấn luyện.
D. Giảm kích thước của mạng nơ-ron.

5. Ma trận nhầm lẫn (Confusion matrix) được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình hồi quy.
B. Trực quan hóa cấu trúc của dữ liệu đầu vào.
C. Phân tích chi tiết hiệu suất của mô hình phân loại bằng cách hiển thị số lượng dự đoán đúng và sai cho từng lớp.
D. Chọn thuật toán học máy phù hợp nhất cho bài toán.

6. K-Nearest Neighbors (KNN) là một thuật toán học máy thuộc loại nào?

A. Học tăng cường.
B. Học không giám sát.
C. Học có giám sát.
D. Học bán giám sát.

7. Backpropagation (lan truyền ngược) là gì trong ngữ cảnh mạng nơ-ron?

A. Một kỹ thuật để tăng tốc độ huấn luyện mạng nơ-ron.
B. Một thuật toán để tính toán gradient của hàm mất mát đối với các tham số của mạng nơ-ron.
C. Một phương pháp để trực quan hóa cấu trúc của mạng nơ-ron.
D. Một kỹ thuật để giảm overfitting trong mạng nơ-ron.

8. `Precision` (độ chính xác) và `Recall` (độ phủ) là hai độ đo quan trọng trong đánh giá mô hình phân loại, đặc biệt khi dữ liệu bị mất cân bằng (imbalanced dataset). Precision được định nghĩa là gì?

A. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu thực tế là dương tính.
B. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu dự đoán là dương tính.
C. Tỷ lệ mẫu thực tế là dương tính trên tổng số mẫu.
D. Tỷ lệ mẫu dự đoán sai trên tổng số mẫu thực tế là âm tính.

9. Phương pháp nào sau đây giúp giảm thiểu overfitting trong mô hình học máy?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình (ví dụ: pruning cây quyết định).
C. Sử dụng kỹ thuật Regularization (ví dụ: L1, L2 regularization).
D. Tất cả các phương pháp trên.

10. Transfer learning (học chuyển giao) là gì và tại sao nó hữu ích?

A. Một phương pháp để chuyển đổi dữ liệu từ dạng số sang dạng văn bản.
B. Một kỹ thuật để huấn luyện mô hình trên một tập dữ liệu lớn và sau đó sử dụng kiến thức đã học được để giải quyết một bài toán tương tự nhưng với tập dữ liệu nhỏ hơn.
C. Một cách để chuyển đổi mô hình học máy từ học có giám sát sang học không giám sát.
D. Một phương pháp để tăng tốc độ huấn luyện mô hình.

11. Độ đo `accuracy` (độ chính xác) trong phân loại thường được định nghĩa như thế nào?

A. Tỷ lệ mẫu dự đoán đúng trên tổng số mẫu.
B. Tỷ lệ mẫu dự đoán sai trên tổng số mẫu.
C. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu thực tế là dương tính.
D. Tỷ lệ mẫu thực tế là dương tính trên tổng số mẫu dự đoán là dương tính.

12. Kỹ thuật `cross-validation` (kiểm định chéo) được sử dụng để làm gì?

A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khả năng tổng quát hóa của mô hình học máy trên dữ liệu mới.
C. Cải thiện độ chính xác của mô hình trên dữ liệu huấn luyện.
D. Giảm kích thước của tập dữ liệu huấn luyện.

13. Học máy (Machine Learning) là gì?

A. Một lĩnh vực của khoa học máy tính cho phép máy tính học hỏi từ dữ liệu mà không cần được lập trình явно.
B. Một phương pháp lập trình máy tính truyền thống dựa trên các quy tắc được xác định trước.
C. Một loại ngôn ngữ lập trình mới được sử dụng để phát triển phần mềm.
D. Một công cụ phần cứng đặc biệt giúp tăng tốc độ xử lý dữ liệu.

14. Mô hình có `high variance` (phương sai cao) thường có đặc điểm gì?

A. Underfitting dữ liệu huấn luyện.
B. Khả năng tổng quát hóa tốt trên dữ liệu mới.
C. Overfitting dữ liệu huấn luyện, tức là mô hình quá phức tạp và học cả nhiễu trong dữ liệu huấn luyện.
D. Độ chính xác thấp trên dữ liệu huấn luyện.

15. F1-score là gì và nó được tính như thế nào?

A. Trung bình cộng của Precision và Recall; (Precision + Recall) / 2.
B. Trung bình điều hòa của Precision và Recall; 2 * (Precision * Recall) / (Precision + Recall).
C. Tích của Precision và Recall; Precision * Recall.
D. Hiệu của Precision và Recall; Precision - Recall.

16. Loại học máy nào sử dụng dữ liệu đã được gán nhãn để huấn luyện?

A. Học không giám sát (Unsupervised Learning)
B. Học tăng cường (Reinforcement Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)

17. Batch normalization (chuẩn hóa theo lô) có lợi ích gì trong huấn luyện mạng nơ-ron sâu?

A. Giảm số lượng lớp trong mạng nơ-ron.
B. Tăng tốc độ huấn luyện và cải thiện độ ổn định bằng cách chuẩn hóa đầu ra của mỗi lớp trong mỗi mini-batch.
C. Đơn giản hóa kiến trúc mạng nơ-ron.
D. Giảm kích thước dữ liệu huấn luyện.

18. Trong xử lý ngôn ngữ tự nhiên (NLP), `word embedding` (nhúng từ) có vai trò gì?

A. Phân tích cú pháp của câu.
B. Biểu diễn từ ngữ thành các vector số thực có ý nghĩa ngữ nghĩa, giúp máy tính hiểu được mối quan hệ giữa các từ.
C. Dịch ngôn ngữ từ ngôn ngữ này sang ngôn ngữ khác.
D. Tạo ra văn bản mới.

19. Giải thuật `Ensemble Learning` (học ансамбль) là gì?

A. Một thuật toán học máy đơn lẻ mạnh mẽ.
B. Một kỹ thuật kết hợp dự đoán của nhiều mô hình học máy khác nhau (ví dụ: Bagging, Boosting, Stacking) để cải thiện hiệu suất tổng thể.
C. Một phương pháp để đơn giản hóa mô hình học máy.
D. Một cách để chuẩn hóa dữ liệu đầu vào.

20. Bias-variance tradeoff (đánh đổi giữa độ chệch và phương sai) là một khái niệm quan trọng trong học máy. Mô hình có `high bias` (độ chệch cao) thường có đặc điểm gì?

A. Overfitting dữ liệu huấn luyện.
B. Underfitting dữ liệu huấn luyện, tức là mô hình quá đơn giản và không thể nắm bắt được các mẫu phức tạp trong dữ liệu.
C. Độ chính xác cao trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
D. Phương sai lớn trên dữ liệu kiểm tra.

21. RNN (Recurrent Neural Network) khác biệt so với CNN (Convolutional Neural Network) chủ yếu ở điểm nào?

A. RNN xử lý dữ liệu tuần tự (sequence data), trong khi CNN thường được sử dụng cho dữ liệu ảnh.
B. RNN có số lượng tham số ít hơn CNN.
C. CNN có khả năng học các mối quan hệ thời gian tốt hơn RNN.
D. RNN chỉ có thể được sử dụng cho học không giám sát, trong khi CNN chỉ dùng cho học có giám sát.

22. Thuật toán `Gradient Descent` (hạ gradient) được sử dụng để làm gì trong huấn luyện mạng nơ-ron?

A. Chọn kiến trúc mạng nơ-ron phù hợp.
B. Tối ưu hóa các tham số (weights và biases) của mạng nơ-ron để giảm thiểu hàm mất mát (loss function).
C. Đánh giá hiệu suất của mạng nơ-ron.
D. Chuẩn hóa dữ liệu đầu vào cho mạng nơ-ron.

23. `Pooling` (gộp nhóm) layer thường được sử dụng sau lớp convolution trong CNN để làm gì?

A. Tăng độ phân giải của ảnh.
B. Tăng số lượng đặc trưng được phát hiện.
C. Giảm kích thước không gian của feature maps và làm cho các đặc trưng trở nên bất biến hơn với các biến đổi nhỏ (ví dụ: dịch chuyển, xoay nhẹ).
D. Cải thiện độ chính xác của mô hình trên dữ liệu huấn luyện.

24. PCA (Principal Component Analysis) là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction) được sử dụng để làm gì?

A. Tăng số chiều của dữ liệu.
B. Tìm các thành phần chính (principal components) của dữ liệu, là các hướng mà dữ liệu có phương sai lớn nhất, và giảm số chiều bằng cách giữ lại một số thành phần chính quan trọng nhất.
C. Phân loại dữ liệu thành các nhóm khác nhau.
D. Cải thiện độ chính xác của mô hình học máy.

25. Hàm kích hoạt (activation function) trong mạng nơ-ron (neural network) có vai trò gì?

A. Tăng tốc độ tính toán của mạng nơ-ron.
B. Giới thiệu tính phi tuyến (non-linearity) vào mạng nơ-ron, cho phép mô hình học các mối quan hệ phức tạp.
C. Giảm số lượng tham số trong mạng nơ-ron.
D. Chuẩn hóa dữ liệu đầu vào cho mạng nơ-ron.

26. Mục tiêu chính của học tăng cường (Reinforcement Learning) là gì?

A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự đoán giá trị của một biến số liên tục.
C. Huấn luyện một tác nhân (agent) để đưa ra chuỗi hành động tối ưu trong một môi trường để tối đa hóa phần thưởng tích lũy.
D. Tìm kiếm cấu trúc ẩn trong dữ liệu không có nhãn.

27. AUC-ROC (Area Under the Receiver Operating Characteristic curve) được sử dụng để đánh giá điều gì?

A. Hiệu suất của mô hình hồi quy.
B. Hiệu suất của mô hình phân cụm.
C. Hiệu suất của mô hình phân loại nhị phân ở các ngưỡng phân loại khác nhau.
D. Độ phức tạp của mô hình phân loại.

28. Hiện tượng `overfitting` (quá khớp) trong học máy xảy ra khi nào?

A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình không học được các mẫu trong dữ liệu huấn luyện.
C. Dữ liệu huấn luyện quá lớn khiến mô hình học chậm.
D. Thuật toán học máy được sử dụng không phù hợp.

29. Thuật toán nào sau đây thuộc loại học không giám sát?

A. Cây quyết định (Decision Tree)
B. K-Means Clustering
C. Hồi quy tuyến tính (Linear Regression)
D. Máy vector hỗ trợ (Support Vector Machine)

30. Trong ngữ cảnh của học sâu (Deep Learning), `convolution` (tích chập) trong CNN (Convolutional Neural Network) được sử dụng để làm gì?

A. Tăng kích thước ảnh đầu vào.
B. Giảm số lượng màu sắc trong ảnh.
C. Phát hiện các đặc trưng cục bộ (local features) trong ảnh, như cạnh, góc, kết cấu.
D. Thay đổi độ sáng của ảnh.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

1. 'Recall' (độ phủ) được định nghĩa là gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

2. Trong ngữ cảnh của cây quyết định (Decision Tree), 'entropy' (độ hỗn loạn) được sử dụng để làm gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

3. Trong thuật toán Support Vector Machine (SVM), 'kernel' (hàm nhân) có vai trò gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

4. Mục đích của việc sử dụng 'dropout' trong mạng nơ-ron là gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

5. Ma trận nhầm lẫn (Confusion matrix) được sử dụng để làm gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

6. K-Nearest Neighbors (KNN) là một thuật toán học máy thuộc loại nào?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

7. Backpropagation (lan truyền ngược) là gì trong ngữ cảnh mạng nơ-ron?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

8. 'Precision' (độ chính xác) và 'Recall' (độ phủ) là hai độ đo quan trọng trong đánh giá mô hình phân loại, đặc biệt khi dữ liệu bị mất cân bằng (imbalanced dataset). Precision được định nghĩa là gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

9. Phương pháp nào sau đây giúp giảm thiểu overfitting trong mô hình học máy?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

10. Transfer learning (học chuyển giao) là gì và tại sao nó hữu ích?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

11. Độ đo 'accuracy' (độ chính xác) trong phân loại thường được định nghĩa như thế nào?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

12. Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

13. Học máy (Machine Learning) là gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

14. Mô hình có 'high variance' (phương sai cao) thường có đặc điểm gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

15. F1-score là gì và nó được tính như thế nào?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

16. Loại học máy nào sử dụng dữ liệu đã được gán nhãn để huấn luyện?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

17. Batch normalization (chuẩn hóa theo lô) có lợi ích gì trong huấn luyện mạng nơ-ron sâu?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

18. Trong xử lý ngôn ngữ tự nhiên (NLP), 'word embedding' (nhúng từ) có vai trò gì?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

19. Giải thuật 'Ensemble Learning' (học ансамбль) là gì?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

20. Bias-variance tradeoff (đánh đổi giữa độ chệch và phương sai) là một khái niệm quan trọng trong học máy. Mô hình có 'high bias' (độ chệch cao) thường có đặc điểm gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

21. RNN (Recurrent Neural Network) khác biệt so với CNN (Convolutional Neural Network) chủ yếu ở điểm nào?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

22. Thuật toán 'Gradient Descent' (hạ gradient) được sử dụng để làm gì trong huấn luyện mạng nơ-ron?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

23. 'Pooling' (gộp nhóm) layer thường được sử dụng sau lớp convolution trong CNN để làm gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

24. PCA (Principal Component Analysis) là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction) được sử dụng để làm gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

25. Hàm kích hoạt (activation function) trong mạng nơ-ron (neural network) có vai trò gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

26. Mục tiêu chính của học tăng cường (Reinforcement Learning) là gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

27. AUC-ROC (Area Under the Receiver Operating Characteristic curve) được sử dụng để đánh giá điều gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

28. Hiện tượng 'overfitting' (quá khớp) trong học máy xảy ra khi nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

29. Thuật toán nào sau đây thuộc loại học không giám sát?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 14

30. Trong ngữ cảnh của học sâu (Deep Learning), 'convolution' (tích chập) trong CNN (Convolutional Neural Network) được sử dụng để làm gì?