Đề thi, bài tập trắc nghiệm online Học máy – Đề 7

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Học máy

Đề 7 - Bài tập, đề thi trắc nghiệm online Học máy

1. Trong học sâu, `backpropagation` (lan truyền ngược) là gì?

A. Một thuật toán tối ưu hóa để tìm cực trị toàn cục.
B. Một phương pháp để giảm overfitting trong mạng nơ-ron.
C. Một thuật toán để tính gradient của hàm mất mát (loss function) đối với trọng số (weights) trong mạng nơ-ron.
D. Một kỹ thuật để tăng tốc độ huấn luyện mạng nơ-ron.

2. Thuật toán nào sau đây là một ví dụ của ensemble learning?

A. K-means clustering.
B. Principal Component Analysis (PCA).
C. Random Forest.
D. Linear Regression.

3. SVM (Support Vector Machine) hoạt động tốt nhất trong trường hợp nào?

A. Dữ liệu có nhiều nhiễu.
B. Dữ liệu có số chiều rất lớn.
C. Dữ liệu có biên quyết định tuyến tính hoặc gần tuyến tính.
D. Dữ liệu có mối quan hệ phi tuyến phức tạp.

4. Trong thuật toán K-Nearest Neighbors (KNN), tham số `K` đại diện cho điều gì?

A. Số lượng cụm (clusters) cần tìm.
B. Số chiều dữ liệu.
C. Số lượng hàng xóm gần nhất được xem xét để phân loại hoặc hồi quy.
D. Số lần lặp huấn luyện.

5. Kỹ thuật `cross-validation` (kiểm định chéo) được sử dụng để làm gì?

A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu chưa từng thấy.
C. Giảm overfitting bằng cách tăng dữ liệu huấn luyện.
D. Chọn ra các đặc trưng quan trọng nhất.

6. Ma trận nhầm lẫn (Confusion matrix) được sử dụng để làm gì trong học máy?

A. Đánh giá hiệu suất mô hình hồi quy.
B. Trực quan hóa dữ liệu đầu vào.
C. Đánh giá hiệu suất mô hình phân loại và hiểu rõ hơn về các loại lỗi.
D. Chọn thuật toán học máy phù hợp.

7. Khái niệm `feature engineering` (kỹ thuật đặc trưng) trong học máy là gì?

A. Quá trình chọn thuật toán học máy tốt nhất.
B. Quá trình tinh chỉnh siêu tham số của mô hình.
C. Quá trình biến đổi dữ liệu thô thành các đặc trưng phù hợp hơn để mô hình học.
D. Quá trình đánh giá hiệu suất mô hình.

8. Điều gì xảy ra nếu learning rate (tốc độ học) trong gradient descent được đặt quá lớn?

A. Mô hình sẽ hội tụ nhanh hơn đến nghiệm tối ưu.
B. Mô hình có thể không hội tụ hoặc dao động xung quanh nghiệm tối ưu.
C. Mô hình sẽ bị overfitting.
D. Mô hình sẽ bị underfitting.

9. Boosting khác biệt với Bagging như thế nào?

A. Boosting huấn luyện song song các mô hình, trong khi Bagging huấn luyện tuần tự.
B. Boosting sử dụng lấy mẫu có hoàn lại, trong khi Bagging không.
C. Boosting tập trung vào việc giảm phương sai (variance), trong khi Bagging tập trung vào việc giảm độ chệch (bias).
D. Boosting huấn luyện tuần tự các mô hình, mỗi mô hình cố gắng sửa lỗi của mô hình trước, trong khi Bagging huấn luyện song song các mô hình độc lập.

10. Trong ngữ cảnh của mô hình học máy, `ensemble learning` (học tập kết hợp) là gì?

A. Một phương pháp để giảm overfitting.
B. Một kỹ thuật để tăng tốc độ huấn luyện.
C. Một phương pháp kết hợp dự đoán của nhiều mô hình học máy để cải thiện hiệu suất tổng thể.
D. Một cách để trực quan hóa dữ liệu.

11. Phương pháp nào sau đây giúp giảm thiểu overfitting trong mô hình học máy?

A. Tăng kích thước dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình.
C. Sử dụng kỹ thuật regularization (chính quy hóa).
D. Tất cả các đáp án trên.

12. Transformer networks, đặc biệt hiệu quả trong xử lý ngôn ngữ tự nhiên (NLP), dựa trên cơ chế chính nào?

A. Convolution.
B. Recurrence.
C. Attention (Cơ chế chú ý).
D. Pooling.

13. AUC-ROC (Area Under the ROC Curve) là độ đo hiệu suất cho loại bài toán nào?

A. Hồi quy.
B. Phân cụm.
C. Phân loại nhị phân (Binary classification).
D. Giảm chiều dữ liệu.

14. Trong học tăng cường (Reinforcement learning), `agent` (tác nhân) học bằng cách nào?

A. Từ dữ liệu đã được gán nhãn.
B. Từ dữ liệu không có nhãn.
C. Tương tác với môi trường và nhận phần thưởng hoặc hình phạt.
D. Quan sát hành vi của các agent khác.

15. Hàm kích hoạt (activation function) có vai trò gì trong mạng nơ-ron?

A. Tăng tốc độ tính toán.
B. Giảm số lượng tham số của mô hình.
C. Giới thiệu tính phi tuyến vào mạng nơ-ron, cho phép mô hình học các quan hệ phức tạp.
D. Chuẩn hóa dữ liệu đầu vào.

16. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại?

A. RMSE (Root Mean Squared Error)
B. MAE (Mean Absolute Error)
C. Accuracy (Độ chính xác)
D. R-squared

17. Thuật toán nào sau đây dựa trên nguyên tắc `chia để trị` (divide and conquer)?

A. Hồi quy Logistic (Logistic Regression).
B. Máy vector hỗ trợ (Support Vector Machine).
C. Cây quyết định (Decision Tree).
D. Mạng nơ-ron (Neural Network).

18. CNN (Convolutional Neural Network) thường được sử dụng cho loại dữ liệu nào?

A. Dữ liệu dạng bảng (tabular data).
B. Dữ liệu văn bản (text data).
C. Dữ liệu ảnh (image data).
D. Dữ liệu chuỗi thời gian (time series data).

19. Mục tiêu chính của việc chuẩn hóa dữ liệu (data normalization/scaling) là gì?

A. Tăng cường khả năng diễn giải của mô hình.
B. Đảm bảo rằng các đặc trưng có phạm vi giá trị khác nhau không ảnh hưởng không cân xứng đến mô hình.
C. Giảm overfitting bằng cách làm mịn dữ liệu.
D. Xử lý dữ liệu bị thiếu.

20. Đâu là định nghĩa chính xác nhất về Học máy (Machine Learning)?

A. Một lĩnh vực khoa học máy tính tập trung vào việc lập trình máy tính.
B. Một phương pháp cho phép máy tính học từ dữ liệu mà không cần được lập trình một cách rõ ràng.
C. Một kỹ thuật để tạo ra các chương trình máy tính phức tạp.
D. Một công cụ để phân tích dữ liệu và tạo ra báo cáo.

21. Bootstrap aggregating (Bagging) hoạt động bằng cách nào?

A. Huấn luyện một mô hình duy nhất trên toàn bộ dữ liệu.
B. Huấn luyện tuần tự các mô hình, mỗi mô hình tập trung vào việc sửa lỗi của mô hình trước.
C. Huấn luyện song song nhiều mô hình trên các tập con dữ liệu được lấy mẫu có hoàn lại (bootstrap samples).
D. Chia dữ liệu thành các cụm và huấn luyện mô hình riêng cho mỗi cụm.

22. Trong học máy, `gradient descent` (gradient xuống dốc) là gì?

A. Một thuật toán để giảm chiều dữ liệu.
B. Một phương pháp đánh giá hiệu suất mô hình.
C. Một thuật toán tối ưu hóa để tìm cực tiểu của hàm mất mát bằng cách đi theo hướng ngược gradient.
D. Một kỹ thuật để xử lý dữ liệu bị thiếu.

23. Loại học máy nào sử dụng dữ liệu đã được gán nhãn (labeled data) để huấn luyện?

A. Học không giám sát (Unsupervised learning)
B. Học tăng cường (Reinforcement learning)
C. Học có giám sát (Supervised learning)
D. Học sâu (Deep learning)

24. RNN (Recurrent Neural Network) phù hợp với loại dữ liệu nào?

A. Dữ liệu rời rạc.
B. Dữ liệu có cấu trúc cây.
C. Dữ liệu chuỗi (sequential data) như văn bản hoặc chuỗi thời gian.
D. Dữ liệu không gian.

25. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

A. Feature scaling (co giãn đặc trưng).
B. Regularization (chính quy hóa).
C. Imputation (điền giá trị thiếu).
D. One-hot encoding.

26. Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào sau đây là tuyến tính?

A. t-SNE (t-distributed Stochastic Neighbor Embedding)
B. PCA (Principal Component Analysis)
C. UMAP (Uniform Manifold Approximation and Projection)
D. Autoencoders

27. Bias-variance tradeoff (đánh đổi giữa độ chệch và phương sai) trong học máy mô tả điều gì?

A. Sự đánh đổi giữa tốc độ huấn luyện và độ chính xác của mô hình.
B. Sự đánh đổi giữa khả năng diễn giải mô hình và hiệu suất dự đoán.
C. Sự đánh đổi giữa độ chệch (bias) và phương sai (variance) trong lỗi dự đoán của mô hình.
D. Sự đánh đổi giữa kích thước dữ liệu huấn luyện và kích thước mô hình.

28. Trong học máy, `overfitting` (quá khớp) xảy ra khi nào?

A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới.
B. Mô hình học quá kém trên cả dữ liệu huấn luyện và dữ liệu mới.
C. Mô hình không đủ dữ liệu để học.
D. Dữ liệu huấn luyện bị nhiễu.

29. Label encoding và one-hot encoding là các kỹ thuật thường được sử dụng để xử lý loại dữ liệu nào?

A. Dữ liệu số (numerical data).
B. Dữ liệu văn bản (text data).
C. Dữ liệu phạm trù (categorical data).
D. Dữ liệu chuỗi thời gian (time series data).

30. Thuật toán nào sau đây thuộc loại học không giám sát?

A. Hồi quy tuyến tính (Linear Regression)
B. Phân cụm K-means (K-means Clustering)
C. Máy vector hỗ trợ (Support Vector Machine)
D. Rừng ngẫu nhiên (Random Forest)

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

1. Trong học sâu, 'backpropagation' (lan truyền ngược) là gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

2. Thuật toán nào sau đây là một ví dụ của ensemble learning?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

3. SVM (Support Vector Machine) hoạt động tốt nhất trong trường hợp nào?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

4. Trong thuật toán K-Nearest Neighbors (KNN), tham số 'K' đại diện cho điều gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

5. Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

6. Ma trận nhầm lẫn (Confusion matrix) được sử dụng để làm gì trong học máy?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

7. Khái niệm 'feature engineering' (kỹ thuật đặc trưng) trong học máy là gì?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

8. Điều gì xảy ra nếu learning rate (tốc độ học) trong gradient descent được đặt quá lớn?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

9. Boosting khác biệt với Bagging như thế nào?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

10. Trong ngữ cảnh của mô hình học máy, 'ensemble learning' (học tập kết hợp) là gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

11. Phương pháp nào sau đây giúp giảm thiểu overfitting trong mô hình học máy?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

12. Transformer networks, đặc biệt hiệu quả trong xử lý ngôn ngữ tự nhiên (NLP), dựa trên cơ chế chính nào?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

13. AUC-ROC (Area Under the ROC Curve) là độ đo hiệu suất cho loại bài toán nào?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

14. Trong học tăng cường (Reinforcement learning), 'agent' (tác nhân) học bằng cách nào?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

15. Hàm kích hoạt (activation function) có vai trò gì trong mạng nơ-ron?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

16. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

17. Thuật toán nào sau đây dựa trên nguyên tắc 'chia để trị' (divide and conquer)?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

18. CNN (Convolutional Neural Network) thường được sử dụng cho loại dữ liệu nào?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

19. Mục tiêu chính của việc chuẩn hóa dữ liệu (data normalization/scaling) là gì?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

20. Đâu là định nghĩa chính xác nhất về Học máy (Machine Learning)?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

21. Bootstrap aggregating (Bagging) hoạt động bằng cách nào?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

22. Trong học máy, 'gradient descent' (gradient xuống dốc) là gì?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

23. Loại học máy nào sử dụng dữ liệu đã được gán nhãn (labeled data) để huấn luyện?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

24. RNN (Recurrent Neural Network) phù hợp với loại dữ liệu nào?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

25. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

26. Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào sau đây là tuyến tính?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

27. Bias-variance tradeoff (đánh đổi giữa độ chệch và phương sai) trong học máy mô tả điều gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

28. Trong học máy, 'overfitting' (quá khớp) xảy ra khi nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

29. Label encoding và one-hot encoding là các kỹ thuật thường được sử dụng để xử lý loại dữ liệu nào?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 8

30. Thuật toán nào sau đây thuộc loại học không giám sát?