1. Ma trận nhầm lẫn (confusion matrix) được sử dụng để làm gì trong Học máy?
A. Đo lường tốc độ huấn luyện của mô hình.
B. Trực quan hóa và đánh giá hiệu suất của mô hình phân loại bằng cách hiển thị số lượng dự đoán đúng và sai cho từng lớp.
C. Chọn ra các đặc trưng quan trọng nhất cho mô hình.
D. Giảm số chiều của dữ liệu đầu vào.
2. Phương pháp `giảm chiều dữ liệu` (dimensionality reduction) được sử dụng để làm gì trong Học máy?
A. Tăng độ chính xác của mô hình học máy.
B. Giảm số lượng đặc trưng đầu vào, giúp giảm độ phức tạp tính toán, tránh `lời nguyền chiều cao` (curse of dimensionality), và cải thiện khả năng trực quan hóa.
C. Tăng kích thước tập dữ liệu huấn luyện.
D. Chọn ra thuật toán học máy phù hợp nhất.
3. Phương pháp `học không giám sát` (unsupervised learning) khác biệt chính so với `học có giám sát` là gì?
A. Học không giám sát đòi hỏi dữ liệu huấn luyện phải có kích thước lớn hơn.
B. Học không giám sát sử dụng dữ liệu không có nhãn và tập trung vào việc tìm kiếm cấu trúc ẩn hoặc mối quan hệ trong dữ liệu.
C. Học không giám sát chỉ áp dụng cho các bài toán phân loại, không dùng cho hồi quy.
D. Học không giám sát luôn cho kết quả chính xác hơn học có giám sát.
4. Kỹ thuật `chuẩn hóa đặc trưng` (feature scaling) thường được áp dụng trong Học máy để làm gì?
A. Tăng kích thước của tập dữ liệu huấn luyện.
B. Giảm số lượng đặc trưng đầu vào.
C. Đưa các đặc trưng về cùng một thang đo để các thuật toán dựa trên khoảng cách hoạt động hiệu quả hơn.
D. Chọn ra các đặc trưng quan trọng nhất.
5. Mục tiêu chính của `tiền xử lý dữ liệu` (data preprocessing) trong Học máy là gì?
A. Tăng kích thước tập dữ liệu huấn luyện để cải thiện độ chính xác của mô hình.
B. Giảm độ phức tạp của mô hình học máy để tăng tốc độ huấn luyện.
C. Cải thiện chất lượng dữ liệu và làm cho dữ liệu phù hợp hơn với các thuật toán học máy.
D. Chọn ra thuật toán học máy tốt nhất cho một bài toán cụ thể.
6. Độ đo `độ chính xác` (accuracy) trong phân loại (classification) Học máy được tính như thế nào?
A. Tỷ lệ giữa số lượng dự đoán sai trên tổng số dự đoán.
B. Tỷ lệ giữa số lượng dự đoán đúng trên tổng số dự đoán.
C. Tổng số lượng dự đoán đúng và sai.
D. Hiệu số giữa số lượng dự đoán đúng và sai.
7. Lớp ẩn (hidden layer) trong mạng nơ-ron đa lớp (multilayer neural network) có vai trò gì?
A. Nhận dữ liệu đầu vào trực tiếp từ môi trường.
B. Xuất kết quả dự đoán cuối cùng.
C. Thực hiện các phép biến đổi phi tuyến tính trên dữ liệu đầu vào để trích xuất các đặc trưng phức tạp.
D. Đánh giá hiệu suất của mạng nơ-ron.
8. Nhược điểm chính của thuật toán K-Nearest Neighbors (KNN) là gì?
A. Khó khăn trong việc xử lý dữ liệu dạng chuỗi thời gian.
B. Tốn nhiều bộ nhớ và thời gian tính toán khi tập dữ liệu lớn, đặc biệt trong giai đoạn dự đoán.
C. Không hiệu quả với dữ liệu có nhiều chiều.
D. Không thể xử lý dữ liệu phân loại.
9. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) đặc biệt hiệu quả trong lĩnh vực nào?
A. Xử lý ngôn ngữ tự nhiên (NLP).
B. Dự báo chuỗi thời gian.
C. Thị giác máy tính (Computer Vision), như nhận dạng ảnh và video.
D. Hệ thống khuyến nghị.
10. Gradient Descent là thuật toán tối ưu hóa được sử dụng phổ biến trong Học máy để làm gì?
A. Chọn ra các đặc trưng quan trọng nhất.
B. Giảm số chiều của dữ liệu.
C. Tìm giá trị tối ưu của các tham số mô hình bằng cách lặp đi lặp lại điều chỉnh các tham số theo hướng ngược lại của gradient hàm mất mát.
D. Đánh giá hiệu suất của mô hình.
11. Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN) phù hợp với loại dữ liệu nào?
A. Dữ liệu dạng bảng.
B. Dữ liệu ảnh tĩnh.
C. Dữ liệu chuỗi tuần tự (sequential data), như văn bản, âm thanh, và chuỗi thời gian.
D. Dữ liệu phân loại rời rạc.
12. Trong Học máy, `đặc trưng` (feature) là gì?
A. Một thuật toán học máy cụ thể.
B. Một tham số được điều chỉnh trong quá trình huấn luyện mô hình.
C. Một thuộc tính hoặc một phần dữ liệu đầu vào được sử dụng để mô tả đối tượng hoặc sự kiện.
D. Một loại lỗi xảy ra trong quá trình huấn luyện mô hình.
13. Hiện tượng `thiếu khớp` (underfitting) trong Học máy xảy ra khi nào?
A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng hoạt động kém trên dữ liệu mới.
B. Mô hình học quá kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
C. Mô hình không thể học được từ dữ liệu huấn luyện do dữ liệu quá phức tạp.
D. Mô hình học tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
14. Trong Học máy, `lựa chọn mô hình` (model selection) là quá trình gì?
A. Tối ưu hóa các tham số của một mô hình đã chọn.
B. Chọn ra mô hình học máy tốt nhất từ một tập hợp các mô hình ứng cử viên cho một bài toán cụ thể.
C. Chuẩn hóa dữ liệu đầu vào.
D. Đánh giá hiệu suất của một mô hình đã huấn luyện.
15. Trong thuật toán K-Means Clustering, giá trị `K` đại diện cho điều gì?
A. Số chiều của dữ liệu đầu vào.
B. Số lượng cụm (clusters) mong muốn mà thuật toán sẽ tìm kiếm trong dữ liệu.
C. Số lần lặp tối đa của thuật toán.
D. Tốc độ học của thuật toán.
16. Trong ngữ cảnh của Học máy, `học tăng cường` (reinforcement learning) là gì?
A. Một phương pháp học dựa trên việc phân loại dữ liệu theo từng nhóm cụ thể.
B. Một phương pháp học mà mô hình được huấn luyện bằng cách cung cấp phản hồi trực tiếp (phần thưởng hoặc hình phạt) dựa trên hành động của nó trong một môi trường.
C. Một kỹ thuật học tập trung vào việc giảm số chiều của dữ liệu đầu vào.
D. Một phương pháp học mà mô hình tự động tạo ra dữ liệu mới giống với dữ liệu huấn luyện.
17. Kỹ thuật `chính quy hóa` (regularization) được sử dụng trong Học máy để giải quyết vấn đề gì?
A. Thiếu dữ liệu huấn luyện.
B. Quá khớp (overfitting).
C. Dữ liệu nhiễu.
D. Tốc độ huấn luyện chậm.
18. Mạng nơ-ron nhân tạo (artificial neural network) được lấy cảm hứng từ đâu?
A. Cấu trúc của bộ não con người.
B. Hệ thống tuần hoàn máu.
C. Cấu trúc của DNA.
D. Nguyên lý của máy tính lượng tử.
19. Hiện tượng `quá khớp` (overfitting) trong Học máy xảy ra khi nào?
A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng hoạt động kém trên dữ liệu mới (dữ liệu kiểm tra).
B. Mô hình học quá kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
C. Mô hình không thể học được từ dữ liệu huấn luyện do dữ liệu quá nhiễu.
D. Mô hình học tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
20. Trong Học máy, thuật ngữ `học có giám sát` (supervised learning) đề cập đến điều gì?
A. Một phương pháp học mà mô hình được đào tạo trên dữ liệu không có nhãn.
B. Một phương pháp học mà mô hình được đào tạo trên dữ liệu có nhãn, tức là dữ liệu đã được gán nhãn hoặc đầu ra mong muốn.
C. Một phương pháp học mà mô hình tự động khám phá cấu trúc ẩn trong dữ liệu.
D. Một phương pháp học mà mô hình tương tác với môi trường để học hỏi thông qua phần thưởng và hình phạt.
21. Support Vector Machine (SVM) hoạt động hiệu quả nhất trong trường hợp nào?
A. Dữ liệu có số lượng đặc trưng rất lớn so với số lượng mẫu.
B. Dữ liệu có nhiều nhiễu và ngoại lệ.
C. Dữ liệu có số chiều cao và có thể phân tách tuyến tính hoặc gần tuyến tính.
D. Dữ liệu không có cấu trúc rõ ràng.
22. Đâu là định nghĩa chính xác nhất về Học máy?
A. Một lĩnh vực khoa học máy tính tập trung vào việc tạo ra các chương trình có thể thực hiện các tác vụ cụ thể theo lệnh của con người.
B. Một lĩnh vực khoa học máy tính cho phép hệ thống máy tính học hỏi từ dữ liệu mà không cần được lập trình một cách rõ ràng.
C. Một lĩnh vực toán học thuần túy nghiên cứu các thuật toán và mô hình thống kê phức tạp.
D. Một phương pháp lập trình tiên tiến sử dụng các ngôn ngữ bậc cao để giải quyết các bài toán phức tạp.
23. Backpropagation là thuật toán được sử dụng để làm gì trong huấn luyện mạng nơ-ron?
A. Khởi tạo các tham số của mạng nơ-ron.
B. Tính toán gradient của hàm mất mát đối với các tham số của mạng nơ-ron, để cập nhật tham số bằng Gradient Descent.
C. Lựa chọn kiến trúc mạng nơ-ron tối ưu.
D. Đánh giá hiệu suất của mạng nơ-ron sau khi huấn luyện.
24. Principal Component Analysis (PCA) là một kỹ thuật giảm chiều dữ liệu thuộc loại nào?
A. Giảm chiều dữ liệu tuyến tính (linear dimensionality reduction).
B. Giảm chiều dữ liệu phi tuyến tính (non-linear dimensionality reduction).
C. Giảm chiều dữ liệu dựa trên cây quyết định.
D. Giảm chiều dữ liệu dựa trên mạng nơ-ron.
25. Thuật toán nào sau đây thuộc loại `học có giám sát`?
A. K-Means Clustering
B. Principal Component Analysis (PCA)
C. Support Vector Machine (SVM)
D. Anomaly Detection
26. Hàm kích hoạt (activation function) trong mạng nơ-ron có chức năng gì?
A. Tăng tốc độ huấn luyện của mạng nơ-ron.
B. Giảm số lượng tham số của mạng nơ-ron.
C. Giới thiệu tính phi tuyến tính vào mạng nơ-ron, cho phép mô hình học các mối quan hệ phức tạp.
D. Chuẩn hóa dữ liệu đầu vào cho mạng nơ-ron.
27. Khái niệm `Bias-Variance Tradeoff` trong Học máy mô tả sự cân bằng giữa điều gì?
A. Độ chính xác và độ phức tạp của mô hình.
B. Thiên vị (Bias) và phương sai (Variance) của mô hình, ảnh hưởng đến khả năng tổng quát hóa.
C. Tốc độ huấn luyện và tốc độ dự đoán của mô hình.
D. Số lượng dữ liệu huấn luyện và số lượng tham số của mô hình.
28. Transformer Network, một kiến trúc mạng nơ-ron mới, đã đạt được những thành công lớn trong lĩnh vực nào?
A. Phân tích dữ liệu tài chính.
B. Thị giác máy tính (Computer Vision).
C. Xử lý ngôn ngữ tự nhiên (NLP), đặc biệt là trong các mô hình ngôn ngữ lớn.
D. Robot học.
29. Ưu điểm chính của thuật toán Decision Tree (Cây quyết định) là gì?
A. Khả năng xử lý dữ liệu phi tuyến tính cực kỳ tốt.
B. Dễ dàng diễn giải và trực quan hóa, giúp hiểu rõ quá trình ra quyết định của mô hình.
C. Hiệu suất vượt trội trên dữ liệu có kích thước lớn và số chiều cao.
D. Khả năng chống chịu tốt với hiện tượng quá khớp.
30. Thuật toán nào sau đây thuộc loại `học không giám sát`?
A. Linear Regression
B. Decision Tree
C. K-Nearest Neighbors (KNN)
D. K-Means Clustering