Đề thi, bài tập trắc nghiệm online Học máy – Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Học máy

Đề 10 - Bài tập, đề thi trắc nghiệm online Học máy

1. Trong học không giám sát, thuật toán PCA (Principal Component Analysis) được sử dụng để làm gì?

A. Phân loại dữ liệu.
B. Phân cụm dữ liệu.
C. Giảm chiều dữ liệu bằng cách tìm các thành phần chính.
D. Dự đoán giá trị liên tục.

2. Phương pháp `cross-validation` (kiểm định chéo) được sử dụng để làm gì trong học máy?

A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá hiệu suất mô hình một cách khách quan trên dữ liệu độc lập.
C. Cải thiện độ chính xác của dữ liệu huấn luyện.
D. Giảm kích thước của tập dữ liệu.

3. Trong học tăng cường (Reinforcement Learning), `agent` (tác nhân) học hỏi thông qua tương tác với môi trường và nhận được gì?

A. Nhãn dữ liệu (data labels).
B. Phần thưởng (rewards) hoặc hình phạt (penalties).
C. Gradient của hàm mất mát.
D. Thông tin về cấu trúc dữ liệu.

4. Trong học máy, `overfitting` (quá khớp) xảy ra khi nào?

A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu kiểm tra nhưng kém trên dữ liệu huấn luyện.
C. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra mới.
D. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.

5. Khái niệm `ensemble learning` (học tập kết hợp) trong học máy là gì?

A. Huấn luyện một mô hình duy nhất trên nhiều tập dữ liệu khác nhau.
B. Kết hợp dự đoán của nhiều mô hình học máy khác nhau để cải thiện hiệu suất tổng thể.
C. Sử dụng nhiều thuật toán tối ưu hóa khác nhau trong quá trình huấn luyện.
D. Phân chia dữ liệu thành nhiều phần và huấn luyện mô hình trên mỗi phần.

6. Gradient Descent là thuật toán tối ưu hóa được sử dụng để làm gì trong học máy?

A. Chọn đặc trưng (feature selection) tốt nhất.
B. Tìm giá trị tham số của mô hình sao cho hàm mất mát (loss function) đạt giá trị nhỏ nhất.
C. Phân cụm dữ liệu.
D. Giảm chiều dữ liệu.

7. Trong Natural Language Processing (NLP), `word embedding` (nhúng từ) là gì?

A. Một phương pháp mã hóa văn bản thành dạng hình ảnh.
B. Một kỹ thuật biểu diễn từ vựng thành các vector số thực trong không gian nhiều chiều.
C. Một thuật toán để phân tích cú pháp của câu.
D. Một phương pháp để loại bỏ stop words (từ dừng) khỏi văn bản.

8. Nguyên tắc `Occam`s Razor` thường được áp dụng trong học máy như thế nào?

A. Ưu tiên các mô hình phức tạp để đạt độ chính xác cao nhất.
B. Ưu tiên các mô hình đơn giản nhất có thể giải thích dữ liệu một cách hợp lý.
C. Ưu tiên các mô hình được huấn luyện nhanh nhất.
D. Ưu tiên các mô hình có ít tham số nhất.

9. Trong thuật toán Decision Tree (Cây quyết định), mục tiêu chính của việc chia nút là gì?

A. Tăng độ phức tạp của cây.
B. Giảm entropy hoặc Gini impurity của các nút con.
C. Tăng số lượng mẫu trong mỗi nút lá.
D. Tạo ra các cây sâu hơn để mô hình hóa dữ liệu tốt hơn.

10. Đâu là loại học máy mà mô hình được huấn luyện trên dữ liệu đã được gán nhãn?

A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)

11. Batch Normalization là một kỹ thuật thường được sử dụng trong mạng nơ-ron sâu để giải quyết vấn đề nào?

A. Overfitting.
B. Vanishing gradients (gradient biến mất).
C. Exploding gradients (gradient bùng nổ).
D. Internal covariate shift.

12. Bias-Variance tradeoff (đánh đổi Bias-Variance) trong học máy đề cập đến sự cân bằng giữa điều gì?

A. Tốc độ huấn luyện và độ chính xác.
B. Độ phức tạp của mô hình và khả năng khái quát hóa.
C. Precision và Recall.
D. Dữ liệu huấn luyện và dữ liệu kiểm tra.

13. L1 và L2 regularization (chính quy hóa L1 và L2) khác nhau chủ yếu ở điểm nào?

A. L1 regularization khuyến khích các tham số lớn, L2 regularization khuyến khích các tham số nhỏ.
B. L1 regularization tạo ra các mô hình phức tạp hơn, L2 regularization tạo ra các mô hình đơn giản hơn.
C. L1 regularization có xu hướng tạo ra các tham số thưa thớt (sparse), L2 regularization không.
D. L1 regularization chỉ dùng cho bài toán hồi quy, L2 regularization chỉ dùng cho bài toán phân loại.

14. AUC-ROC (Area Under the ROC curve) là một độ đo hiệu suất thường được sử dụng cho bài toán nào?

A. Hồi quy (Regression).
B. Phân cụm (Clustering).
C. Phân loại nhị phân (Binary Classification).
D. Giảm chiều dữ liệu (Dimensionality Reduction).

15. Phương pháp `one-hot encoding` được sử dụng để xử lý loại dữ liệu nào trong học máy?

A. Dữ liệu số liên tục (continuous numerical data).
B. Dữ liệu văn bản (text data).
C. Dữ liệu phân loại (categorical data).
D. Dữ liệu chuỗi thời gian (time series data).

16. Mục đích chính của việc sử dụng `kernel` trong Support Vector Machine (SVM) là gì?

A. Tăng tốc độ huấn luyện SVM.
B. Xử lý dữ liệu phi tuyến tính bằng cách ánh xạ dữ liệu vào không gian chiều cao hơn.
C. Giảm số chiều dữ liệu đầu vào.
D. Cải thiện khả năng giải thích của mô hình SVM.

17. ReLU (Rectified Linear Unit) là gì và nó thường được sử dụng ở đâu trong mạng nơ-ron?

A. Một hàm mất mát (loss function) dùng để đo lỗi của mô hình.
B. Một hàm kích hoạt (activation function) thường dùng trong các lớp ẩn của mạng nơ-ron sâu.
C. Một thuật toán tối ưu hóa (optimization algorithm) để huấn luyện mạng nơ-ron.
D. Một phương pháp chính quy hóa (regularization method) để tránh overfitting.

18. Thuật toán K-Means thường được sử dụng cho loại bài toán học máy nào?

A. Phân loại (Classification)
B. Hồi quy (Regression)
C. Phân cụm (Clustering)
D. Giảm chiều dữ liệu (Dimensionality Reduction)

19. Độ đo `precision` (độ chính xác) trong bài toán phân loại được tính như thế nào?

A. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu thực tế là dương tính.
B. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu được dự đoán là dương tính.
C. Tỷ lệ mẫu dự đoán đúng là âm tính trên tổng số mẫu thực tế là âm tính.
D. Tỷ lệ mẫu dự đoán đúng trên tổng số mẫu.

20. Đâu là phương pháp thường được sử dụng để giảm thiểu overfitting?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình.
C. Sử dụng kỹ thuật regularization (chính quy hóa).
D. Tất cả các phương án trên.

21. Trong ngữ cảnh của mạng nơ-ron tích chập (CNN), `pooling layer` (lớp gộp) có chức năng chính là gì?

A. Tăng số chiều của feature maps.
B. Giảm kích thước không gian của feature maps và giảm số lượng tham số.
C. Thêm tính phi tuyến vào mạng.
D. Chuẩn hóa dữ liệu đầu vào.

22. Trong học máy, `hyperparameter tuning` (điều chỉnh siêu tham số) là quá trình gì?

A. Điều chỉnh dữ liệu huấn luyện để cải thiện chất lượng.
B. Điều chỉnh các tham số bên trong của mô hình trong quá trình huấn luyện.
C. Chọn các giá trị tối ưu cho các siêu tham số của mô hình (ví dụ: learning rate, số lượng lớp trong mạng nơ-ron).
D. Điều chỉnh các thuật toán tối ưu hóa để huấn luyện nhanh hơn.

23. Dropout là một kỹ thuật regularization thường được sử dụng trong mạng nơ-ron để làm gì?

A. Tăng tốc độ hội tụ của mô hình.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Cải thiện khả năng giải thích của mô hình.
D. Tăng độ chính xác trên dữ liệu huấn luyện.

24. Boosting và Bagging là hai phương pháp phổ biến trong ensemble learning. Sự khác biệt chính giữa chúng là gì?

A. Boosting huấn luyện các mô hình song song, Bagging huấn luyện tuần tự.
B. Bagging tập trung giảm bias, Boosting tập trung giảm variance.
C. Bagging huấn luyện các mô hình độc lập, Boosting huấn luyện tuần tự và các mô hình sau tập trung vào các mẫu mà mô hình trước đó dự đoán sai.
D. Boosting chỉ sử dụng cho bài toán phân loại, Bagging chỉ sử dụng cho bài toán hồi quy.

25. Khi nào thì nên sử dụng `Random Forest` thay vì một Decision Tree đơn lẻ?

A. Khi cần một mô hình dễ giải thích và trực quan.
B. Khi dữ liệu huấn luyện rất nhỏ.
C. Khi cần cải thiện độ chính xác và giảm overfitting so với cây quyết định đơn lẻ.
D. Khi cần thời gian huấn luyện nhanh nhất.

26. Trong học máy, `feature scaling` (tỉ lệ đặc trưng) là quá trình gì và tại sao nó quan trọng?

A. Quá trình chọn các đặc trưng quan trọng nhất cho mô hình.
B. Quá trình biến đổi dữ liệu để các đặc trưng có phạm vi giá trị tương tự nhau.
C. Quá trình tạo ra các đặc trưng mới từ các đặc trưng hiện có.
D. Quá trình loại bỏ các đặc trưng không liên quan.

27. RNN (Recurrent Neural Network) đặc biệt phù hợp với loại dữ liệu nào?

A. Dữ liệu dạng bảng (tabular data).
B. Dữ liệu ảnh tĩnh (static images).
C. Dữ liệu chuỗi thời gian (time series data) hoặc dữ liệu tuần tự (sequential data).
D. Dữ liệu không có cấu trúc (unstructured data).

28. Khái niệm `transfer learning` (học chuyển giao) trong học máy là gì?

A. Chuyển dữ liệu từ định dạng này sang định dạng khác.
B. Áp dụng kiến thức đã học từ một bài toán này sang một bài toán khác liên quan.
C. Chuyển mô hình từ CPU sang GPU để tăng tốc độ tính toán.
D. Chuyển dữ liệu huấn luyện từ tập huấn luyện sang tập kiểm tra.

29. Học máy (Machine Learning) được định nghĩa chính xác nhất là gì?

A. Một lĩnh vực của khoa học máy tính cho phép máy tính tự lập trình.
B. Một tập hợp các thuật toán cho phép máy tính học hỏi từ dữ liệu mà không cần được lập trình một cách rõ ràng.
C. Một phương pháp thống kê để phân tích dữ liệu lớn và đưa ra dự đoán.
D. Một công nghệ phần mềm cho phép máy tính thực hiện các tác vụ mà con người có thể làm.

30. F1-score là trung bình điều hòa của độ đo nào?

A. Precision và Support.
B. Recall và Specificity.
C. Precision và Recall.
D. Accuracy và Precision.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

1. Trong học không giám sát, thuật toán PCA (Principal Component Analysis) được sử dụng để làm gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

2. Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong học máy?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

3. Trong học tăng cường (Reinforcement Learning), 'agent' (tác nhân) học hỏi thông qua tương tác với môi trường và nhận được gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

4. Trong học máy, 'overfitting' (quá khớp) xảy ra khi nào?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

5. Khái niệm 'ensemble learning' (học tập kết hợp) trong học máy là gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

6. Gradient Descent là thuật toán tối ưu hóa được sử dụng để làm gì trong học máy?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

7. Trong Natural Language Processing (NLP), 'word embedding' (nhúng từ) là gì?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

8. Nguyên tắc 'Occam's Razor' thường được áp dụng trong học máy như thế nào?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

9. Trong thuật toán Decision Tree (Cây quyết định), mục tiêu chính của việc chia nút là gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

10. Đâu là loại học máy mà mô hình được huấn luyện trên dữ liệu đã được gán nhãn?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

11. Batch Normalization là một kỹ thuật thường được sử dụng trong mạng nơ-ron sâu để giải quyết vấn đề nào?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

12. Bias-Variance tradeoff (đánh đổi Bias-Variance) trong học máy đề cập đến sự cân bằng giữa điều gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

13. L1 và L2 regularization (chính quy hóa L1 và L2) khác nhau chủ yếu ở điểm nào?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

14. AUC-ROC (Area Under the ROC curve) là một độ đo hiệu suất thường được sử dụng cho bài toán nào?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

15. Phương pháp 'one-hot encoding' được sử dụng để xử lý loại dữ liệu nào trong học máy?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

16. Mục đích chính của việc sử dụng 'kernel' trong Support Vector Machine (SVM) là gì?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

17. ReLU (Rectified Linear Unit) là gì và nó thường được sử dụng ở đâu trong mạng nơ-ron?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

18. Thuật toán K-Means thường được sử dụng cho loại bài toán học máy nào?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

19. Độ đo 'precision' (độ chính xác) trong bài toán phân loại được tính như thế nào?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

20. Đâu là phương pháp thường được sử dụng để giảm thiểu overfitting?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

21. Trong ngữ cảnh của mạng nơ-ron tích chập (CNN), 'pooling layer' (lớp gộp) có chức năng chính là gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

22. Trong học máy, 'hyperparameter tuning' (điều chỉnh siêu tham số) là quá trình gì?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

23. Dropout là một kỹ thuật regularization thường được sử dụng trong mạng nơ-ron để làm gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

24. Boosting và Bagging là hai phương pháp phổ biến trong ensemble learning. Sự khác biệt chính giữa chúng là gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

25. Khi nào thì nên sử dụng 'Random Forest' thay vì một Decision Tree đơn lẻ?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

26. Trong học máy, 'feature scaling' (tỉ lệ đặc trưng) là quá trình gì và tại sao nó quan trọng?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

27. RNN (Recurrent Neural Network) đặc biệt phù hợp với loại dữ liệu nào?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

28. Khái niệm 'transfer learning' (học chuyển giao) trong học máy là gì?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

29. Học máy (Machine Learning) được định nghĩa chính xác nhất là gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 10

30. F1-score là trung bình điều hòa của độ đo nào?