1. ROC curve (đường cong ROC) và AUC (Area Under the Curve) được sử dụng để đánh giá hiệu suất của mô hình nào?
A. Mô hình hồi quy (Regression models).
B. Mô hình phân cụm (Clustering models).
C. Mô hình phân loại nhị phân (Binary classification models).
D. Mô hình giảm chiều dữ liệu (Dimensionality reduction models).
2. Phương pháp nào sau đây thường được sử dụng để giảm thiểu `overfitting`?
A. Tăng kích thước tập dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình (ví dụ, sử dụng ít lớp hơn trong mạng nơ-ron).
C. Sử dụng kỹ thuật `regularization` (chính quy hóa).
D. Tất cả các phương án trên.
3. CNN (Convolutional Neural Network) thường được sử dụng hiệu quả nhất cho loại dữ liệu nào?
A. Dữ liệu dạng bảng (tabular data).
B. Dữ liệu văn bản (text data).
C. Dữ liệu hình ảnh (image data).
D. Dữ liệu chuỗi thời gian (time series data).
4. RNN (Recurrent Neural Network) thích hợp cho loại dữ liệu nào?
A. Dữ liệu hình ảnh (image data).
B. Dữ liệu rời rạc (discrete data).
C. Dữ liệu chuỗi thời gian (time series data) và dữ liệu văn bản (text data).
D. Dữ liệu không có cấu trúc (unstructured data).
5. SVM (Support Vector Machine) đặc biệt hiệu quả trong bài toán nào?
A. Phân cụm dữ liệu lớn.
B. Hồi quy tuyến tính.
C. Phân loại, đặc biệt là trong không gian đặc trưng chiều cao.
D. Giảm chiều dữ liệu.
6. Trong ngữ cảnh của học máy, `overfitting` (quá khớp) xảy ra khi nào?
A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
C. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
D. Mô hình quá đơn giản và không nắm bắt được các mẫu trong dữ liệu huấn luyện.
7. Kỹ thuật `cross-validation` (kiểm định chéo) được sử dụng để làm gì?
A. Tăng kích thước tập dữ liệu huấn luyện.
B. Đánh giá mô hình một cách khách quan hơn bằng cách sử dụng nhiều phân chia dữ liệu huấn luyện và kiểm tra khác nhau.
C. Giảm số lượng đặc trưng trong dữ liệu.
D. Tối ưu hóa hàm mất mát.
8. Mục tiêu chính của `feature scaling` (tỉ lệ hóa đặc trưng) trong tiền xử lý dữ liệu học máy là gì?
A. Giảm số lượng đặc trưng trong dữ liệu.
B. Đảm bảo tất cả các đặc trưng có cùng phạm vi giá trị, giúp các thuật toán hội tụ nhanh hơn và hiệu quả hơn.
C. Tăng độ phức tạp của mô hình học máy.
D. Tạo thêm dữ liệu huấn luyện.
9. Phương pháp `dimensionality reduction` (giảm chiều dữ liệu) như PCA (Principal Component Analysis) có mục đích chính là gì?
A. Tăng độ chính xác của mô hình.
B. Giảm độ phức tạp tính toán, loại bỏ nhiễu và có thể cải thiện hiệu suất mô hình bằng cách giảm số lượng đặc trưng.
C. Tạo ra các đặc trưng mới.
D. Chuẩn hóa dữ liệu.
10. Backpropagation (lan truyền ngược) là thuật toán được sử dụng để làm gì trong mạng nơ-ron?
A. Dự đoán đầu ra của mạng.
B. Tính toán độ chính xác của mô hình.
C. Cập nhật trọng số (weights) của mạng để giảm thiểu hàm mất mát (loss function).
D. Khởi tạo trọng số ban đầu của mạng.
11. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?
A. Nhận dạng giọng nói.
B. Dự báo thời tiết chính xác 100% trong dài hạn.
C. Hệ thống đề xuất sản phẩm.
D. Xe tự lái.
12. Vấn đề `curse of dimensionality` (lời nguyền chiều dữ liệu) trong học máy ám chỉ điều gì?
A. Việc mô hình trở nên quá phức tạp khi có quá nhiều tham số.
B. Hiệu suất của nhiều thuật toán học máy giảm đáng kể khi số lượng đặc trưng (chiều dữ liệu) tăng lên quá cao.
C. Khó khăn trong việc thu thập dữ liệu huấn luyện đủ lớn.
D. Việc mô hình bị overfitting trên dữ liệu huấn luyện.
13. Ma trận nhầm lẫn (Confusion Matrix) được sử dụng để làm gì trong học máy?
A. Để trực quan hóa dữ liệu đầu vào.
B. Để đánh giá hiệu suất của mô hình phân loại bằng cách hiển thị số lượng dự đoán đúng và sai.
C. Để chọn các đặc trưng quan trọng nhất cho mô hình.
D. Để tối ưu hóa siêu tham số của mô hình.
14. Khái niệm `bias-variance tradeoff` (đánh đổi giữa độ chệch và phương sai) trong học máy đề cập đến điều gì?
A. Sự đánh đổi giữa tốc độ huấn luyện và tốc độ dự đoán của mô hình.
B. Sự đánh đổi giữa độ chính xác và độ phủ của mô hình.
C. Sự đánh đổi giữa khả năng khái quát hóa (variance) và độ phù hợp với dữ liệu huấn luyện (bias) của mô hình.
D. Sự đánh đổi giữa số lượng đặc trưng và kích thước tập dữ liệu.
15. Trong học máy, thuật ngữ `hyperparameter` (siêu tham số) khác với `parameter` (tham số) như thế nào?
A. Siêu tham số được học từ dữ liệu, trong khi tham số được thiết lập thủ công.
B. Tham số được học từ dữ liệu, trong khi siêu tham số được thiết lập thủ công trước khi huấn luyện mô hình.
C. Siêu tham số chỉ áp dụng cho mạng nơ-ron, còn tham số áp dụng cho tất cả các thuật toán học máy.
D. Tham số quyết định kiến trúc mô hình, còn siêu tham số điều chỉnh quá trình huấn luyện.
16. Trong học tăng cường (Reinforcement Learning), `agent` (tác nhân) học bằng cách nào?
A. Bằng cách được cung cấp dữ liệu đã gán nhãn.
B. Bằng cách tìm kiếm cấu trúc ẩn trong dữ liệu không nhãn.
C. Bằng cách tương tác với môi trường và nhận phần thưởng hoặc hình phạt dựa trên hành động của mình.
D. Bằng cách sao chép hành vi của chuyên gia con người.
17. Phương pháp `early stopping` (dừng sớm) thường được sử dụng để làm gì trong quá trình huấn luyện mô hình?
A. Tăng tốc độ huấn luyện mô hình.
B. Giảm overfitting bằng cách dừng quá trình huấn luyện khi hiệu suất trên tập kiểm tra không còn cải thiện.
C. Tối ưu hóa siêu tham số.
D. Lựa chọn mô hình tốt nhất từ nhiều mô hình khác nhau.
18. Ưu điểm chính của thuật toán Decision Tree (Cây quyết định) là gì?
A. Luôn đạt độ chính xác cao nhất so với các thuật toán khác.
B. Dễ dàng diễn giải và trực quan hóa, có thể hiểu rõ logic quyết định của mô hình.
C. Hoạt động tốt trên dữ liệu có chiều cao.
D. Không bị ảnh hưởng bởi overfitting.
19. Độ đo `precision` (độ chính xác) trong đánh giá mô hình phân loại đo lường điều gì?
A. Tỷ lệ dự đoán đúng trên tổng số mẫu thực tế là tích cực.
B. Tỷ lệ dự đoán đúng là tích cực trên tổng số mẫu được dự đoán là tích cực.
C. Tỷ lệ mẫu thực tế là tích cực được dự đoán chính xác.
D. Tỷ lệ mẫu thực tế là tiêu cực được dự đoán chính xác.
20. Transformer networks, đặc biệt là kiến trúc Transformer, đã cách mạng hóa lĩnh vực học máy nào?
A. Computer Vision (Thị giác máy tính).
B. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
C. Học tăng cường (Reinforcement Learning).
D. Phân tích dữ liệu chuỗi thời gian (Time Series Data Analysis).
21. Thuật toán K-Means Clustering thuộc loại học máy nào?
A. Học có giám sát (Supervised Learning)
B. Học bán giám sát (Semi-supervised Learning)
C. Học tăng cường (Reinforcement Learning)
D. Học không giám sát (Unsupervised Learning)
22. Thuật toán Gradient Descent được sử dụng để làm gì trong học máy?
A. Phân cụm dữ liệu.
B. Tìm kiếm giá trị tối ưu của tham số mô hình bằng cách di chuyển theo hướng ngược lại của gradient hàm mất mát.
C. Giảm chiều dữ liệu.
D. Phân loại dữ liệu.
23. GANs (Generative Adversarial Networks) được sử dụng chủ yếu cho mục đích gì?
A. Phân loại hình ảnh.
B. Phát hiện đối tượng trong hình ảnh.
C. Sinh dữ liệu mới, ví dụ như tạo ra hình ảnh, âm thanh hoặc văn bản giả mạo nhưng chân thực.
D. Phân tích dữ liệu chuỗi thời gian.
24. Trong mạng nơ-ron (Neural Network), hàm kích hoạt (activation function) có vai trò gì?
A. Tính toán trọng số (weights) của các kết nối.
B. Giới thiệu tính phi tuyến vào mạng, cho phép mô hình học các mối quan hệ phức tạp.
C. Chuẩn hóa dữ liệu đầu vào.
D. Giảm số lượng tham số của mạng.
25. Trong ngữ cảnh của học máy, `ensemble methods` (phương pháp học ансамбль) là gì?
A. Các phương pháp để tiền xử lý dữ liệu.
B. Các phương pháp kết hợp dự đoán của nhiều mô hình học máy khác nhau để cải thiện hiệu suất tổng thể.
C. Các phương pháp để đánh giá mô hình học máy.
D. Các phương pháp để tối ưu hóa tham số mô hình.
26. Nhược điểm của thuật toán K-Nearest Neighbors (KNN) là gì?
A. Khó diễn giải kết quả.
B. Tính toán chậm trong giai đoạn dự đoán, đặc biệt với dữ liệu lớn.
C. Dễ bị overfitting.
D. Chỉ hoạt động với dữ liệu số.
27. Trong học sâu (Deep Learning), `dropout` là một kỹ thuật được sử dụng để làm gì?
A. Tăng tốc độ huấn luyện mạng nơ-ron.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Tối ưu hóa hàm kích hoạt.
D. Chuẩn hóa dữ liệu đầu vào.
28. Trong các loại học máy sau, loại nào thường được sử dụng để phân loại email vào `spam` hoặc `không spam`?
A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học có giám sát (Supervised Learning)
D. Học sâu (Deep Learning)
29. Độ đo `recall` (độ phủ) trong đánh giá mô hình phân loại đo lường điều gì?
A. Tỷ lệ dự đoán đúng trên tổng số mẫu thực tế là tích cực.
B. Tỷ lệ dự đoán đúng là tích cực trên tổng số mẫu được dự đoán là tích cực.
C. Tỷ lệ mẫu thực tế là tích cực được dự đoán chính xác.
D. Tỷ lệ mẫu thực tế là tiêu cực được dự đoán chính xác.
30. Đâu là định nghĩa chính xác nhất về Học máy (Machine Learning)?
A. Một lĩnh vực khoa học máy tính tập trung vào việc tạo ra các chương trình máy tính phức tạp.
B. Một phương pháp lập trình cho phép máy tính thực hiện các tác vụ mà không cần được lập trình rõ ràng, dựa trên dữ liệu.
C. Một tập hợp các thuật toán thống kê được sử dụng để phân tích dữ liệu lớn.
D. Một nhánh của trí tuệ nhân tạo tập trung vào việc xây dựng robot thông minh.