Đề thi, bài tập trắc nghiệm online Học máy – Đề 1

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Học máy

Đề 1 - Bài tập, đề thi trắc nghiệm online Học máy

1. Mô hình nào sau đây thuộc loại mô hình tuyến tính?

A. Decision Tree (Cây quyết định)
B. Support Vector Machine (SVM) với kernel RBF
C. Logistic Regression (Hồi quy Logistic)
D. Random Forest (Rừng ngẫu nhiên)

2. Khái niệm `bias-variance tradeoff` (đánh đổi giữa độ chệch và phương sai) trong học máy đề cập đến điều gì?

A. Sự đánh đổi giữa tốc độ huấn luyện và độ chính xác của mô hình.
B. Sự đánh đổi giữa khả năng diễn giải và độ phức tạp của mô hình.
C. Sự đánh đổi giữa độ chệch (bias - lỗi do giả định đơn giản hóa mô hình) và phương sai (variance - độ nhạy của mô hình với sự thay đổi trong dữ liệu huấn luyện).
D. Sự đánh đổi giữa kích thước dữ liệu huấn luyện và kích thước dữ liệu kiểm tra.

3. Đâu là định nghĩa chính xác nhất về Học máy?

A. Một lĩnh vực khoa học máy tính tập trung vào việc tạo ra các chương trình có khả năng tự viết mã.
B. Một lĩnh vực khoa học máy tính cho phép hệ thống máy tính học hỏi từ dữ liệu mà không cần được lập trình một cách rõ ràng.
C. Một nhánh của thống kê toán học sử dụng máy tính để thực hiện các phép tính phức tạp.
D. Một phương pháp lập trình hướng đối tượng tiên tiến, tập trung vào việc xây dựng các lớp và đối tượng thông minh.

4. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại?

A. Mean Squared Error (MSE)
B. R-squared
C. Accuracy
D. Root Mean Squared Error (RMSE)

5. Phương pháp `cross-validation` (kiểm định chéo) được sử dụng để làm gì?

A. Tăng kích thước dữ liệu huấn luyện.
B. Giảm chiều dữ liệu.
C. Ước tính hiệu suất của mô hình trên dữ liệu chưa từng thấy và giảm thiểu overfitting.
D. Tăng tốc độ huấn luyện mô hình.

6. Mô hình nào sau đây thường được sử dụng cho bài toán phát hiện bất thường (anomaly detection)?

A. Linear Regression.
B. K-Means Clustering.
C. Isolation Forest.
D. Logistic Regression.

7. Trong ngữ cảnh của mô hình ngôn ngữ (language models), `perplexity` là gì?

A. Độ chính xác của mô hình trong việc dự đoán từ tiếp theo.
B. Độ phức tạp của mô hình ngôn ngữ.
C. Đo lường mức độ `bất ngờ` của mô hình khi gặp một chuỗi văn bản.
D. Tốc độ xử lý văn bản của mô hình.

8. Trong mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), lớp tích chập (convolutional layer) có vai trò chính gì?

A. Giảm chiều dữ liệu.
B. Phân loại dữ liệu.
C. Trích xuất đặc trưng cục bộ từ dữ liệu đầu vào (ví dụ: ảnh).
D. Tăng cường dữ liệu huấn luyện.

9. Trong học máy, `feature engineering` (kỹ thuật đặc trưng) đề cập đến quá trình nào?

A. Lựa chọn thuật toán học máy phù hợp nhất.
B. Tối ưu hóa siêu tham số của mô hình.
C. Biến đổi và tạo ra các đặc trưng mới từ dữ liệu thô để cải thiện hiệu suất mô hình.
D. Chia dữ liệu thành tập huấn luyện và tập kiểm tra.

10. Trong học máy, `ensemble methods` (phương pháp tập hợp) là gì?

A. Các phương pháp để tiền xử lý dữ liệu.
B. Các phương pháp để đánh giá mô hình.
C. Các phương pháp kết hợp dự đoán của nhiều mô hình học máy riêng lẻ để tạo ra một dự đoán tổng hợp tốt hơn.
D. Các phương pháp để tối ưu hóa siêu tham số.

11. Mục đích chính của việc sử dụng `batch normalization` trong mạng nơ-ron sâu (deep neural networks) là gì?

A. Tăng độ chính xác của mô hình.
B. Giảm overfitting.
C. Ổn định và tăng tốc độ huấn luyện bằng cách chuẩn hóa đầu ra của các lớp trung gian.
D. Giảm số lượng tham số của mô hình.

12. Mục tiêu của thuật toán DBSCAN (Density-Based Spatial Clustering of Applications with Noise) là gì?

A. Phân cụm dữ liệu dựa trên số lượng cụm mong muốn.
B. Phân cụm dữ liệu dựa trên khoảng cách đến trung tâm cụm.
C. Phân cụm dữ liệu dựa trên mật độ điểm dữ liệu và xác định các điểm nhiễu.
D. Phân cụm dữ liệu dựa trên phân cấp.

13. Phương pháp nào sau đây giúp giải quyết vấn đề `imbalanced dataset` (dữ liệu không cân bằng)?

A. Principal Component Analysis (PCA)
B. One-Hot Encoding
C. Oversampling và Undersampling
D. Cross-Validation

14. Trong ngữ cảnh của mạng nơ-ron (neural networks), hàm kích hoạt (activation function) có vai trò gì?

A. Giảm tốc độ học của mô hình.
B. Tăng chiều dữ liệu đầu vào.
C. Giới thiệu tính phi tuyến vào mô hình.
D. Chuẩn hóa dữ liệu đầu vào.

15. Trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP), `word embedding` (nhúng từ) có vai trò gì?

A. Loại bỏ các từ dừng (stopwords).
B. Chuyển đổi từ thành các vector số biểu diễn ngữ nghĩa của từ.
C. Phân tích cú pháp câu.
D. Dịch văn bản giữa các ngôn ngữ.

16. Trong các loại hình học máy sau, loại nào đòi hỏi dữ liệu huấn luyện đã được gán nhãn?

A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)

17. Phương pháp `regularization` (chính quy hóa) được sử dụng để làm gì trong học máy?

A. Tăng cường dữ liệu huấn luyện.
B. Giảm chiều dữ liệu.
C. Ngăn chặn overfitting bằng cách thêm một hình phạt vào hàm mất mát để hạn chế độ phức tạp của mô hình.
D. Tăng tốc độ huấn luyện mô hình.

18. Mô hình Recurrent Neural Network (RNN) đặc biệt phù hợp với loại dữ liệu nào?

A. Dữ liệu dạng bảng.
B. Dữ liệu ảnh tĩnh.
C. Dữ liệu chuỗi thời gian hoặc dữ liệu tuần tự.
D. Dữ liệu văn bản không có cấu trúc.

19. Gradient Descent là thuật toán tối ưu hóa được sử dụng để làm gì trong học máy?

A. Chọn ra các đặc trưng quan trọng nhất.
B. Tìm ra tham số tối ưu của mô hình để giảm thiểu hàm mất mát (loss function).
C. Phân cụm dữ liệu thành các nhóm.
D. Đánh giá hiệu suất của mô hình.

20. Đâu là một thách thức đạo đức lớn trong việc phát triển và ứng dụng các hệ thống học máy?

A. Tốc độ huấn luyện mô hình chậm.
B. Thiếu dữ liệu huấn luyện.
C. Sự thiên vị (bias) trong dữ liệu và thuật toán dẫn đến kết quả không công bằng hoặc phân biệt đối xử.
D. Khả năng diễn giải mô hình kém.

21. Mô hình Generative Adversarial Networks (GANs) được sử dụng chủ yếu cho mục đích gì?

A. Phân loại ảnh.
B. Dự đoán chuỗi thời gian.
C. Sinh dữ liệu mới tương tự như dữ liệu huấn luyện.
D. Phân tích cảm xúc văn bản.

22. Ưu điểm chính của thuật toán Decision Tree (Cây quyết định) là gì?

A. Hiệu suất cao trên dữ liệu có chiều cao.
B. Khả năng xử lý tốt dữ liệu phi tuyến tính phức tạp.
C. Dễ dàng diễn giải và trực quan hóa.
D. Ít bị overfitting.

23. Kernel trong Support Vector Machine (SVM) được sử dụng để làm gì?

A. Giảm số lượng chiều dữ liệu đầu vào.
B. Tăng tốc độ huấn luyện mô hình.
C. Ánh xạ dữ liệu vào không gian chiều cao hơn để tìm siêu phẳng phân tách tuyến tính.
D. Chuẩn hóa dữ liệu đầu vào.

24. Thuật ngữ `transfer learning` (học chuyển giao) đề cập đến phương pháp nào?

A. Huấn luyện mô hình trên nhiều GPU để tăng tốc độ.
B. Sử dụng kiến thức đã học từ một bài toán (hoặc tập dữ liệu) để cải thiện hiệu suất trên một bài toán (hoặc tập dữ liệu) khác liên quan.
C. Chuyển đổi dữ liệu từ dạng không cấu trúc sang dạng cấu trúc.
D. Chuyển đổi mô hình từ dạng tuyến tính sang dạng phi tuyến.

25. Đâu là nhược điểm chính của mô hình K-Nearest Neighbors (KNN)?

A. Khả năng diễn giải kém.
B. Yêu cầu tính toán lớn khi dự đoán trên dữ liệu lớn.
C. Dễ bị underfitting.
D. Không hiệu quả với dữ liệu có nhiều chiều.

26. Mục tiêu chính của học tăng cường (Reinforcement Learning) là gì?

A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự đoán giá trị của một biến mục tiêu liên tục.
C. Tìm ra cấu trúc ẩn trong dữ liệu không nhãn.
D. Huấn luyện một tác nhân (agent) để đưa ra chuỗi hành động tối ưu trong một môi trường để tối đa hóa phần thưởng.

27. Hiện tượng `overfitting` (quá khớp) trong học máy xảy ra khi nào?

A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu kiểm tra nhưng kém trên dữ liệu huấn luyện.
C. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
D. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.

28. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu (dimensionality reduction)?

A. One-Hot Encoding
B. Principal Component Analysis (PCA)
C. Cross-Validation
D. Gradient Descent

29. Phương pháp `boosting` trong ensemble methods hoạt động như thế nào?

A. Huấn luyện song song nhiều mô hình độc lập và lấy trung bình kết quả.
B. Huấn luyện tuần tự các mô hình, mỗi mô hình tập trung vào việc sửa lỗi của các mô hình trước đó.
C. Chia dữ liệu thành nhiều phần và huấn luyện mỗi mô hình trên một phần dữ liệu.
D. Chọn ngẫu nhiên các đặc trưng và huấn luyện nhiều cây quyết định.

30. Thuật toán K-Means Clustering thuộc loại hình học máy nào?

A. Học có giám sát
B. Học tăng cường
C. Học không giám sát
D. Học bán giám sát

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

1. Mô hình nào sau đây thuộc loại mô hình tuyến tính?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

2. Khái niệm 'bias-variance tradeoff' (đánh đổi giữa độ chệch và phương sai) trong học máy đề cập đến điều gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

3. Đâu là định nghĩa chính xác nhất về Học máy?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

4. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

5. Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để làm gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

6. Mô hình nào sau đây thường được sử dụng cho bài toán phát hiện bất thường (anomaly detection)?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

7. Trong ngữ cảnh của mô hình ngôn ngữ (language models), 'perplexity' là gì?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

8. Trong mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), lớp tích chập (convolutional layer) có vai trò chính gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

9. Trong học máy, 'feature engineering' (kỹ thuật đặc trưng) đề cập đến quá trình nào?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

10. Trong học máy, 'ensemble methods' (phương pháp tập hợp) là gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

11. Mục đích chính của việc sử dụng 'batch normalization' trong mạng nơ-ron sâu (deep neural networks) là gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

12. Mục tiêu của thuật toán DBSCAN (Density-Based Spatial Clustering of Applications with Noise) là gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

13. Phương pháp nào sau đây giúp giải quyết vấn đề 'imbalanced dataset' (dữ liệu không cân bằng)?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

14. Trong ngữ cảnh của mạng nơ-ron (neural networks), hàm kích hoạt (activation function) có vai trò gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

15. Trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP), 'word embedding' (nhúng từ) có vai trò gì?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

16. Trong các loại hình học máy sau, loại nào đòi hỏi dữ liệu huấn luyện đã được gán nhãn?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

17. Phương pháp 'regularization' (chính quy hóa) được sử dụng để làm gì trong học máy?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

18. Mô hình Recurrent Neural Network (RNN) đặc biệt phù hợp với loại dữ liệu nào?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

19. Gradient Descent là thuật toán tối ưu hóa được sử dụng để làm gì trong học máy?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

20. Đâu là một thách thức đạo đức lớn trong việc phát triển và ứng dụng các hệ thống học máy?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

21. Mô hình Generative Adversarial Networks (GANs) được sử dụng chủ yếu cho mục đích gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

22. Ưu điểm chính của thuật toán Decision Tree (Cây quyết định) là gì?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

23. Kernel trong Support Vector Machine (SVM) được sử dụng để làm gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

24. Thuật ngữ 'transfer learning' (học chuyển giao) đề cập đến phương pháp nào?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

25. Đâu là nhược điểm chính của mô hình K-Nearest Neighbors (KNN)?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

26. Mục tiêu chính của học tăng cường (Reinforcement Learning) là gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

27. Hiện tượng 'overfitting' (quá khớp) trong học máy xảy ra khi nào?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

28. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu (dimensionality reduction)?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

29. Phương pháp 'boosting' trong ensemble methods hoạt động như thế nào?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 1

30. Thuật toán K-Means Clustering thuộc loại hình học máy nào?