Đề thi, bài tập trắc nghiệm online Học máy – Đề 13

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Học máy

Đề 13 - Bài tập, đề thi trắc nghiệm online Học máy

1. Exploration (khám phá) và Exploitation (khai thác) là hai khái niệm quan trọng trong Reinforcement Learning. `Exploitation` nghĩa là gì?

A. Thử nghiệm các hành động ngẫu nhiên để khám phá môi trường.
B. Lựa chọn hành động mà agent tin là tốt nhất dựa trên kinh nghiệm đã học được.
C. Tối ưu hóa tốc độ học của agent.
D. Đánh giá hiệu suất của agent trong môi trường mới.

2. TF-IDF (Term Frequency-Inverse Document Frequency) là một kỹ thuật phổ biến trong NLP để làm gì?

A. Phân tích tình cảm văn bản (sentiment analysis).
B. Đánh giá tầm quan trọng của từ trong một văn bản so với tập hợp văn bản (corpus).
C. Tạo word embedding.
D. Thực hiện dịch máy.

3. Trong machine learning pipeline (quy trình học máy), bước nào thường diễn ra sau bước thu thập dữ liệu (data collection)?

A. Huấn luyện mô hình (model training).
B. Đánh giá mô hình (model evaluation).
C. Tiền xử lý dữ liệu (data preprocessing).
D. Triển khai mô hình (model deployment).

4. Phương pháp nào sau đây thường được sử dụng để giảm thiểu overfitting trong mô hình học máy?

A. Tăng kích thước dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình.
C. Tăng số lượng đặc trưng (features) đầu vào.
D. Sử dụng dữ liệu kiểm thử (test data) thường xuyên hơn trong quá trình huấn luyện.

5. Dropout là một kỹ thuật regularization thường được sử dụng trong mạng nơ-ron để làm gì?

A. Tăng tốc độ huấn luyện mạng.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Tăng độ chính xác của mô hình trên dữ liệu huấn luyện.
D. Giúp mạng nơ-ron diễn giải kết quả dễ dàng hơn.

6. Điều gì xảy ra nếu bạn đặt learning rate (tốc độ học) quá cao khi sử dụng gradient descent?

A. Quá trình huấn luyện sẽ hội tụ nhanh hơn.
B. Quá trình huấn luyện có thể không hội tụ hoặc dao động xung quanh cực tiểu.
C. Mô hình sẽ overfitting dữ liệu huấn luyện.
D. Độ chính xác của mô hình sẽ tăng lên đáng kể.

7. Đâu là sự khác biệt chính giữa học có giám sát (supervised learning) và học không giám sát (unsupervised learning)?

A. Học có giám sát sử dụng dữ liệu đã được gán nhãn, trong khi học không giám sát sử dụng dữ liệu chưa được gán nhãn.
B. Học có giám sát chỉ áp dụng cho bài toán phân loại, còn học không giám sát chỉ áp dụng cho bài toán hồi quy.
C. Học có giám sát luôn cho kết quả chính xác hơn học không giám sát.
D. Học không giám sát cần nhiều dữ liệu huấn luyện hơn học có giám sát.

8. Thuật toán K-Means Clustering thuộc loại học máy nào?

A. Học có giám sát (Supervised Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học tăng cường (Reinforcement Learning)
D. Học bán giám sát (Semi-supervised Learning)

9. L1 regularization (Lasso) và L2 regularization (Ridge) là hai kỹ thuật regularization phổ biến. Sự khác biệt chính giữa chúng là gì?

A. L1 regularization hiệu quả hơn trong việc giảm overfitting so với L2 regularization.
B. L1 regularization có xu hướng tạo ra các tham số mô hình thưa thớt (sparse), trong khi L2 regularization không.
C. L2 regularization phù hợp hơn cho dữ liệu có nhiều đặc trưng nhiễu.
D. L1 regularization dễ dàng tính toán hơn L2 regularization.

10. Regularization (chính quy hóa) là một nhóm kỹ thuật được sử dụng trong học máy để giải quyết vấn đề gì?

A. Dữ liệu bị thiếu (missing data).
B. Overfitting.
C. Underfitting.
D. Dữ liệu nhiễu (noisy data).

11. AUC-ROC curve (Đường cong AUC-ROC) là một độ đo hiệu suất thường được sử dụng cho bài toán nào?

A. Bài toán hồi quy.
B. Bài toán phân cụm.
C. Bài toán phân loại nhị phân.
D. Bài toán giảm chiều dữ liệu.

12. `Curse of dimensionality` (lời nguyền chiều dữ liệu) đề cập đến vấn đề gì khi làm việc với dữ liệu có số chiều cao?

A. Việc huấn luyện mô hình trở nên nhanh hơn.
B. Hiệu suất của một số thuật toán học máy có thể giảm đi khi số chiều dữ liệu tăng lên.
C. Dữ liệu trở nên dễ dàng trực quan hóa hơn.
D. Overfitting ít có khả năng xảy ra hơn.

13. Feature engineering (kỹ thuật đặc trưng) là quá trình làm gì trong học máy?

A. Chọn thuật toán học máy phù hợp nhất.
B. Tối ưu hóa tham số của mô hình.
C. Tạo ra các đặc trưng mới từ dữ liệu thô hiện có để cải thiện hiệu suất mô hình.
D. Giảm kích thước của dữ liệu huấn luyện.

14. Trong học máy, thuật ngữ `overfitting` (quá khớp) đề cập đến hiện tượng gì?

A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình không học được các mẫu từ dữ liệu huấn luyện.
C. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu mới.
D. Mô hình cần thêm dữ liệu huấn luyện để cải thiện hiệu suất.

15. Trong học sâu (deep learning), hàm kích hoạt (activation function) có vai trò gì trong mạng nơ-ron?

A. Giảm độ phức tạp tính toán của mạng.
B. Giới thiệu tính phi tuyến vào mạng, cho phép mạng học các mối quan hệ phức tạp hơn.
C. Tăng tốc độ hội tụ của quá trình huấn luyện.
D. Chuẩn hóa dữ liệu đầu vào trước khi đưa vào mạng.

16. Khi nào thì việc sử dụng một mô hình học máy đơn giản (ví dụ: hồi quy tuyến tính) có thể tốt hơn so với một mô hình phức tạp (ví dụ: mạng nơ-ron sâu)?

A. Khi dữ liệu huấn luyện rất lớn và phức tạp.
B. Khi cần độ chính xác dự đoán cao nhất có thể.
C. Khi dữ liệu ít và mối quan hệ giữa các đặc trưng và mục tiêu là tuyến tính hoặc gần tuyến tính.
D. Khi cần một mô hình có khả năng diễn giải kết quả kém hơn.

17. Recurrent Neural Networks (RNNs - Mạng nơ-ron hồi quy) đặc biệt phù hợp cho loại dữ liệu nào?

A. Dữ liệu hình ảnh tĩnh.
B. Dữ liệu dạng bảng (tabular data).
C. Dữ liệu chuỗi thời gian (time series) hoặc dữ liệu tuần tự (sequential data).
D. Dữ liệu âm thanh độc lập.

18. Backpropagation (lan truyền ngược) là thuật toán chính được sử dụng để làm gì trong huấn luyện mạng nơ-ron?

A. Dự đoán đầu ra cho dữ liệu mới.
B. Tính toán độ chính xác của mô hình.
C. Cập nhật trọng số (weights) của mạng để giảm thiểu hàm mất mát (loss function).
D. Lựa chọn kiến trúc mạng nơ-ron phù hợp.

19. Trong bài toán phân loại nhị phân (binary classification), độ đo `Precision` (Độ chính xác) được tính như thế nào?

A. Số lượng dự đoán đúng trên tổng số dự đoán.
B. Số lượng dự đoán đúng dương tính trên tổng số thực tế là dương tính.
C. Số lượng dự đoán đúng dương tính trên tổng số dự đoán là dương tính.
D. Số lượng dự đoán đúng âm tính trên tổng số thực tế là âm tính.

20. Thuật toán nào sau đây là một ví dụ về thuật toán phân loại dựa trên cây quyết định (decision tree)?

A. Support Vector Machine (SVM)
B. K-Nearest Neighbors (KNN)
C. Random Forest
D. Linear Regression

21. Trong ngữ cảnh của học máy, `feature scaling` (tỉ lệ đặc trưng) thường được thực hiện để làm gì?

A. Tăng độ chính xác của mô hình bằng cách loại bỏ các đặc trưng không quan trọng.
B. Đảm bảo rằng tất cả các đặc trưng đóng góp vào mô hình một cách đồng đều và thuật toán hội tụ nhanh hơn.
C. Giảm kích thước của dữ liệu huấn luyện để tăng tốc độ huấn luyện.
D. Chuyển đổi dữ liệu dạng categorical (phân loại) sang dạng numerical (số).

22. Bagging và Boosting là hai phương pháp ensemble learning (học tập tổ hợp). Phương pháp Boosting khác biệt với Bagging chủ yếu ở điểm nào?

A. Boosting tạo ra các mô hình độc lập song song, trong khi Bagging tạo ra các mô hình tuần tự.
B. Boosting tập trung vào việc giảm variance, trong khi Bagging tập trung vào việc giảm bias.
C. Boosting huấn luyện các mô hình yếu (weak learners) tuần tự, trong đó mỗi mô hình tập trung vào việc sửa lỗi của các mô hình trước đó, trong khi Bagging huấn luyện các mô hình độc lập song song.
D. Boosting chỉ sử dụng được cho bài toán phân loại, còn Bagging chỉ sử dụng được cho bài toán hồi quy.

23. F1-score là trung bình điều hòa (harmonic mean) của hai độ đo nào?

A. Precision và Recall.
B. Accuracy và Precision.
C. Recall và Specificity.
D. Accuracy và Specificity.

24. Phương pháp `gradient descent` (xuống dốc gradient) được sử dụng để làm gì trong học máy?

A. Chọn đặc trưng (feature selection) tốt nhất.
B. Tìm giá trị tối ưu của tham số mô hình (ví dụ: trọng số trong hồi quy tuyến tính hoặc mạng nơ-ron) để giảm thiểu hàm mất mát.
C. Đánh giá hiệu suất của mô hình.
D. Phân tích dữ liệu đầu vào.

25. Trong xử lý ngôn ngữ tự nhiên (NLP), `word embedding` (biểu diễn từ) được sử dụng để làm gì?

A. Loại bỏ từ dừng (stop words) khỏi văn bản.
B. Chuyển đổi từ ngữ thành các vector số, giúp máy tính có thể hiểu và xử lý ngôn ngữ tự nhiên.
C. Phân tích cú pháp của câu.
D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

26. Bias-variance tradeoff (đánh đổi bias-variance) là một khái niệm quan trọng trong học máy. `High bias` (bias cao) thường dẫn đến vấn đề gì?

A. Overfitting.
B. Underfitting.
C. Variance cao.
D. Mô hình hoạt động kém trên dữ liệu huấn luyện nhưng tốt trên dữ liệu kiểm thử.

27. PCA (Principal Component Analysis - Phân tích thành phần chính) là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction) nhằm mục đích gì?

A. Tăng số lượng đặc trưng.
B. Tìm ra các thành phần chính (principal components) là tổ hợp tuyến tính của các đặc trưng ban đầu, giữ lại phần lớn phương sai của dữ liệu.
C. Loại bỏ tất cả các đặc trưng ít quan trọng.
D. Cải thiện khả năng diễn giải của mô hình bằng cách tăng độ phức tạp.

28. Convolutional Neural Networks (CNNs - Mạng nơ-ron tích chập) thường được sử dụng thành công nhất trong lĩnh vực nào?

A. Xử lý ngôn ngữ tự nhiên.
B. Dự báo chuỗi thời gian tài chính.
C. Thị giác máy tính (computer vision) và phân tích hình ảnh.
D. Hệ thống đề xuất sản phẩm.

29. Trong Reinforcement Learning (Học tăng cường), `agent` (tác nhân) học cách hành động trong `environment` (môi trường) để tối đa hóa yếu tố nào?

A. Thời gian huấn luyện.
B. Độ chính xác của dự đoán.
C. Phần thưởng tích lũy (cumulative reward).
D. Số lượng trạng thái (states) đã khám phá.

30. Mục tiêu chính của việc sử dụng `cross-validation` (kiểm định chéo) trong học máy là gì?

A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khách quan hiệu suất của mô hình trên dữ liệu chưa từng thấy.
C. Giảm overfitting bằng cách sử dụng nhiều tập dữ liệu huấn luyện khác nhau.
D. Chọn ra thuật toán học máy tốt nhất cho một bài toán cụ thể.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

1. Exploration (khám phá) và Exploitation (khai thác) là hai khái niệm quan trọng trong Reinforcement Learning. 'Exploitation' nghĩa là gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

2. TF-IDF (Term Frequency-Inverse Document Frequency) là một kỹ thuật phổ biến trong NLP để làm gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

3. Trong machine learning pipeline (quy trình học máy), bước nào thường diễn ra sau bước thu thập dữ liệu (data collection)?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

4. Phương pháp nào sau đây thường được sử dụng để giảm thiểu overfitting trong mô hình học máy?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

5. Dropout là một kỹ thuật regularization thường được sử dụng trong mạng nơ-ron để làm gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

6. Điều gì xảy ra nếu bạn đặt learning rate (tốc độ học) quá cao khi sử dụng gradient descent?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

7. Đâu là sự khác biệt chính giữa học có giám sát (supervised learning) và học không giám sát (unsupervised learning)?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

8. Thuật toán K-Means Clustering thuộc loại học máy nào?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

9. L1 regularization (Lasso) và L2 regularization (Ridge) là hai kỹ thuật regularization phổ biến. Sự khác biệt chính giữa chúng là gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

10. Regularization (chính quy hóa) là một nhóm kỹ thuật được sử dụng trong học máy để giải quyết vấn đề gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

11. AUC-ROC curve (Đường cong AUC-ROC) là một độ đo hiệu suất thường được sử dụng cho bài toán nào?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

12. 'Curse of dimensionality' (lời nguyền chiều dữ liệu) đề cập đến vấn đề gì khi làm việc với dữ liệu có số chiều cao?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

13. Feature engineering (kỹ thuật đặc trưng) là quá trình làm gì trong học máy?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

14. Trong học máy, thuật ngữ 'overfitting' (quá khớp) đề cập đến hiện tượng gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

15. Trong học sâu (deep learning), hàm kích hoạt (activation function) có vai trò gì trong mạng nơ-ron?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

16. Khi nào thì việc sử dụng một mô hình học máy đơn giản (ví dụ: hồi quy tuyến tính) có thể tốt hơn so với một mô hình phức tạp (ví dụ: mạng nơ-ron sâu)?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

17. Recurrent Neural Networks (RNNs - Mạng nơ-ron hồi quy) đặc biệt phù hợp cho loại dữ liệu nào?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

18. Backpropagation (lan truyền ngược) là thuật toán chính được sử dụng để làm gì trong huấn luyện mạng nơ-ron?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

19. Trong bài toán phân loại nhị phân (binary classification), độ đo 'Precision' (Độ chính xác) được tính như thế nào?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

20. Thuật toán nào sau đây là một ví dụ về thuật toán phân loại dựa trên cây quyết định (decision tree)?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

21. Trong ngữ cảnh của học máy, 'feature scaling' (tỉ lệ đặc trưng) thường được thực hiện để làm gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

22. Bagging và Boosting là hai phương pháp ensemble learning (học tập tổ hợp). Phương pháp Boosting khác biệt với Bagging chủ yếu ở điểm nào?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

23. F1-score là trung bình điều hòa (harmonic mean) của hai độ đo nào?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

24. Phương pháp 'gradient descent' (xuống dốc gradient) được sử dụng để làm gì trong học máy?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

25. Trong xử lý ngôn ngữ tự nhiên (NLP), 'word embedding' (biểu diễn từ) được sử dụng để làm gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

26. Bias-variance tradeoff (đánh đổi bias-variance) là một khái niệm quan trọng trong học máy. 'High bias' (bias cao) thường dẫn đến vấn đề gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

27. PCA (Principal Component Analysis - Phân tích thành phần chính) là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction) nhằm mục đích gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

28. Convolutional Neural Networks (CNNs - Mạng nơ-ron tích chập) thường được sử dụng thành công nhất trong lĩnh vực nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

29. Trong Reinforcement Learning (Học tăng cường), 'agent' (tác nhân) học cách hành động trong 'environment' (môi trường) để tối đa hóa yếu tố nào?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 13

30. Mục tiêu chính của việc sử dụng 'cross-validation' (kiểm định chéo) trong học máy là gì?