Đề thi, bài tập trắc nghiệm online Học máy – Đề 3

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Học máy

Đề 3 - Bài tập, đề thi trắc nghiệm online Học máy

1. Trong mạng nơ-ron tích chập (CNN), lớp `convolutional` (tích chập) có chức năng chính là gì?

A. Trích xuất đặc trưng cục bộ từ dữ liệu đầu vào (ví dụ: ảnh).
B. Phân loại dữ liệu đầu vào.
C. Tăng chiều dữ liệu đầu vào.
D. Giảm kích thước dữ liệu đầu vào.

2. Trong học tăng cường (Reinforcement Learning), `agent` (tác nhân) học hỏi thông qua tương tác với môi trường và nhận được phản hồi dưới dạng:

A. Phần thưởng (rewards) hoặc hình phạt (penalties).
B. Dữ liệu có nhãn (labeled data).
C. Dữ liệu không nhãn (unlabeled data).
D. Ví dụ về hành động đúng trong từng trạng thái.

3. Thuật toán `K-Nearest Neighbors` (KNN) hoạt động dựa trên nguyên tắc nào?

A. Phân loại một điểm dữ liệu dựa trên lớp phổ biến nhất của K điểm dữ liệu lân cận nó.
B. Tìm siêu phẳng tối ưu để phân tách các lớp dữ liệu.
C. Xây dựng cây quyết định dựa trên các đặc trưng của dữ liệu.
D. Phân cụm dữ liệu thành K cụm dựa trên khoảng cách đến các trung tâm cụm.

4. Ưu điểm chính của thuật toán `Support Vector Machine` (SVM) so với các thuật toán phân loại khác là gì?

A. Hiệu quả trong không gian chiều cao và khả năng tổng quát hóa tốt.
B. Luôn cho độ chính xác cao hơn các thuật toán khác.
C. Dễ dàng xử lý dữ liệu phi tuyến mà không cần kernel trick.
D. Huấn luyện rất nhanh ngay cả với dữ liệu lớn.

5. Độ đo `độ chính xác` (accuracy) trong phân loại (classification) được tính bằng công thức nào?

A. (Số lượng dự đoán đúng) / (Tổng số lượng dự đoán)
B. (Số lượng dự đoán đúng dương tính) / (Tổng số lượng thực tế là dương tính)
C. (Số lượng dự đoán đúng âm tính) / (Tổng số lượng thực tế là âm tính)
D. (Số lượng dự đoán đúng dương tính) / (Tổng số lượng dự đoán là dương tính)

6. Hàm mất mát (loss function) trong học máy được sử dụng để làm gì?

A. Đo lường sự khác biệt giữa dự đoán của mô hình và giá trị thực tế.
B. Chọn thuật toán học máy phù hợp cho bài toán.
C. Tiền xử lý dữ liệu đầu vào.
D. Đánh giá độ chính xác của mô hình.

7. Vấn đề `vanishing gradient` (gradient biến mất) thường xảy ra trong mạng nơ-ron sâu (deep neural networks) là gì?

A. Gradient trở nên quá nhỏ khi lan truyền ngược qua nhiều lớp, làm chậm hoặc ngừng quá trình huấn luyện các lớp đầu.
B. Gradient trở nên quá lớn, gây ra sự bất ổn trong quá trình huấn luyện.
C. Gradient luôn bằng 0 do hàm kích hoạt không phù hợp.
D. Gradient không thể tính toán được do lỗi phần cứng.

8. Trong học máy, `học có giám sát` (supervised learning) khác biệt với `học không giám sát` (unsupervised learning) chủ yếu ở điểm nào?

A. Học có giám sát sử dụng dữ liệu có nhãn (labeled data), trong khi học không giám sát sử dụng dữ liệu không nhãn.
B. Học có giám sát chỉ áp dụng cho bài toán hồi quy, còn học không giám sát chỉ áp dụng cho bài toán phân loại.
C. Học có giám sát luôn cho kết quả chính xác hơn học không giám sát.
D. Học có giám sát đòi hỏi nhiều dữ liệu hơn học không giám sát.

9. Khi triển khai mô hình học máy trong thực tế, điều quan trọng nào sau đây cần được xem xét ngoài độ chính xác của mô hình?

A. Khả năng giải thích của mô hình (interpretability), tính công bằng (fairness), và chi phí tính toán.
B. Kích thước tập dữ liệu huấn luyện.
C. Số lượng tham số của mô hình.
D. Ngôn ngữ lập trình sử dụng để xây dựng mô hình.

10. Thuật ngữ `backpropagation` (lan truyền ngược) liên quan đến quá trình nào trong huấn luyện mạng nơ-ron?

A. Tính toán gradient của hàm mất mát (loss function) đối với các trọng số của mạng.
B. Truyền dữ liệu đầu vào qua mạng nơ-ron để tạo ra dự đoán.
C. Chọn hàm kích hoạt phù hợp cho từng lớp trong mạng.
D. Chia tập dữ liệu thành các batch nhỏ để huấn luyện hiệu quả hơn.

11. Học máy (Machine Learning) được định nghĩa chính xác nhất là:

A. Một lĩnh vực của khoa học máy tính cho phép máy tính học hỏi từ dữ liệu mà không cần được lập trình rõ ràng.
B. Một phương pháp lập trình máy tính truyền thống để thực hiện các tác vụ cụ thể.
C. Một tập hợp các thuật toán thống kê được sử dụng để phân tích dữ liệu.
D. Một loại phần mềm ứng dụng được sử dụng để tự động hóa các quy trình kinh doanh.

12. Kỹ thuật `cross-validation` (kiểm định chéo) được sử dụng để làm gì trong học máy?

A. Đánh giá độ tin cậy của mô hình và lựa chọn mô hình tốt nhất.
B. Tăng kích thước tập dữ liệu huấn luyện.
C. Giảm thời gian huấn luyện mô hình.
D. Trực quan hóa dữ liệu đầu vào.

13. Lỗi `bias` (độ lệch) và `variance` (phương sai) trong học máy thể hiện điều gì?

A. Bias là lỗi do giả định đơn giản hóa mô hình, variance là lỗi do mô hình quá nhạy cảm với dữ liệu huấn luyện.
B. Bias là lỗi do dữ liệu huấn luyện bị nhiễu, variance là lỗi do mô hình không đủ phức tạp.
C. Bias và variance đều là lỗi do quá trình tiền xử lý dữ liệu.
D. Bias và variance đều là lỗi do chọn sai thuật toán học máy.

14. Lớp `pooling` (gộp nhóm) trong CNN thường được sử dụng sau lớp tích chập với mục đích gì?

A. Giảm kích thước không gian của bản đồ đặc trưng (feature maps) và tăng tính bất biến vị trí.
B. Tăng số lượng đặc trưng được trích xuất.
C. Phân loại các đặc trưng đã trích xuất.
D. Tăng độ phức tạp của mô hình.

15. Trong xử lý ngôn ngữ tự nhiên (NLP), `word embedding` (biểu diễn từ) có mục đích gì?

A. Biểu diễn từ ngữ thành các vector số trong không gian nhiều chiều, giữ lại thông tin ngữ nghĩa.
B. Loại bỏ các từ dừng (stop words) khỏi văn bản.
C. Phân tích cú pháp của câu văn.
D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

16. Mục tiêu chính của việc chia tập dữ liệu thành `tập huấn luyện` (training set) và `tập kiểm thử` (test set) trong học máy là gì?

A. Đánh giá hiệu năng của mô hình trên dữ liệu mới, chưa từng được sử dụng trong quá trình huấn luyện.
B. Tăng tốc độ huấn luyện mô hình bằng cách giảm lượng dữ liệu huấn luyện.
C. Cải thiện độ chính xác của mô hình trên tập huấn luyện.
D. Đảm bảo rằng mô hình không bị quá khớp (overfitting) trên tập huấn luyện.

17. Kỹ thuật `dropout` thường được sử dụng trong mạng nơ-ron để giải quyết vấn đề nào?

A. Quá khớp (overfitting).
B. Huấn luyện chậm.
C. Thiếu dữ liệu huấn luyện.
D. Dữ liệu đầu vào có nhiều nhiễu.

18. Đâu là thách thức lớn nhất hiện nay trong lĩnh vực học máy?

A. Thiếu dữ liệu huấn luyện chất lượng cao và đảm bảo tính công bằng, minh bạch của mô hình.
B. Tốc độ tính toán của máy tính quá chậm.
C. Thuật toán học máy còn quá đơn giản.
D. Ứng dụng học máy còn quá ít trong thực tế.

19. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán học có giám sát?

A. Cây quyết định (Decision Tree)
B. K-means clustering
C. Hồi quy tuyến tính (Linear Regression)
D. Mạng nơ-ron (Neural Network)

20. Thuật toán `Gradient Descent` được sử dụng để làm gì trong học máy?

A. Tìm giá trị tối ưu của các tham số mô hình để tối thiểu hóa hàm mất mát.
B. Phân tích gradient của dữ liệu đầu vào.
C. Giảm chiều dữ liệu.
D. Phân cụm dữ liệu.

21. Khi nào thì nên ưu tiên sử dụng độ đo `F1-score` thay vì `accuracy` để đánh giá mô hình phân loại?

A. Khi tập dữ liệu có sự mất cân bằng lớp (imbalanced dataset).
B. Khi độ chính xác (accuracy) của mô hình quá cao.
C. Khi mô hình bị quá khớp (overfitting).
D. Khi tập dữ liệu huấn luyện rất lớn.

22. Ứng dụng nào sau đây KHÔNG phải là ứng dụng điển hình của học máy?

A. Soạn thảo văn bản bằng tay.
B. Phân loại ảnh.
C. Dự đoán giá cổ phiếu.
D. Nhận dạng giọng nói.

23. Sự khác biệt chính giữa thuật toán `Random Forest` và `Boosting` là gì?

A. Random Forest xây dựng các cây quyết định song song và độc lập, trong khi Boosting xây dựng các cây tuần tự và phụ thuộc lẫn nhau.
B. Random Forest chỉ sử dụng cho bài toán phân loại, còn Boosting chỉ sử dụng cho bài toán hồi quy.
C. Random Forest có xu hướng bị quá khớp hơn Boosting.
D. Boosting đơn giản và dễ huấn luyện hơn Random Forest.

24. Trong mạng nơ-ron (Neural Network), hàm kích hoạt (activation function) có vai trò gì?

A. Giới thiệu tính phi tuyến vào mạng, cho phép mô hình học các mối quan hệ phức tạp.
B. Tính toán đạo hàm của hàm mất mát (loss function) để cập nhật trọng số.
C. Khởi tạo trọng số ban đầu cho mạng nơ-ron.
D. Chuẩn hóa dữ liệu đầu vào trước khi đưa vào mạng.

25. Mạng nơ-ron hồi quy (RNN) được thiết kế đặc biệt để xử lý loại dữ liệu nào?

A. Dữ liệu chuỗi tuần tự (sequential data) như văn bản, chuỗi thời gian.
B. Dữ liệu dạng bảng (tabular data).
C. Dữ liệu ảnh (image data).
D. Dữ liệu âm thanh (audio data).

26. Trong bài toán phân loại nhị phân (binary classification), `độRecall` (Recall) đo lường điều gì?

A. Tỷ lệ các trường hợp dương tính thực tế được mô hình dự đoán đúng.
B. Tỷ lệ các trường hợp dương tính được dự đoán đúng trong số tất cả các dự đoán dương tính.
C. Tỷ lệ các trường hợp âm tính thực tế được mô hình dự đoán đúng.
D. Tỷ lệ các trường hợp âm tính được dự đoán đúng trong số tất cả các dự đoán âm tính.

27. Phương pháp nào sau đây thường được sử dụng để giảm thiểu hiện tượng quá khớp (overfitting) trong mô hình học máy?

A. Tăng độ phức tạp của mô hình.
B. Sử dụng kỹ thuật chính quy hóa (regularization).
C. Giảm kích thước tập dữ liệu huấn luyện.
D. Tăng số lượng đặc trưng (features) đầu vào.

28. Hiện tượng `quá khớp` (overfitting) trong học máy xảy ra khi nào?

A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu kiểm thử.
B. Mô hình không học được các mẫu (patterns) quan trọng từ dữ liệu huấn luyện.
C. Mô hình huấn luyện quá chậm do dữ liệu quá lớn.
D. Dữ liệu huấn luyện không đủ để mô hình học hiệu quả.

29. Phương pháp `Principal Component Analysis` (PCA) được sử dụng để làm gì?

A. Giảm số chiều dữ liệu bằng cách tìm các thành phần chính.
B. Phân loại dữ liệu thành các nhóm khác nhau.
C. Dự đoán giá trị của một biến số liên tục.
D. Tăng độ chính xác của mô hình học máy.

30. Kiến trúc `Transformer` (biến hình) vượt trội hơn RNN trong xử lý ngôn ngữ tự nhiên (NLP) chủ yếu nhờ cơ chế nào?

A. Cơ chế tự chú ý (self-attention), cho phép mô hình tập trung vào các phần quan trọng của chuỗi đầu vào một cách linh hoạt.
B. Sử dụng lớp tích chập thay vì lớp hồi quy.
C. Loại bỏ hoàn toàn lớp ẩn.
D. Tăng độ sâu của mạng nơ-ron.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

1. Trong mạng nơ-ron tích chập (CNN), lớp 'convolutional' (tích chập) có chức năng chính là gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

2. Trong học tăng cường (Reinforcement Learning), 'agent' (tác nhân) học hỏi thông qua tương tác với môi trường và nhận được phản hồi dưới dạng:

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

3. Thuật toán 'K-Nearest Neighbors' (KNN) hoạt động dựa trên nguyên tắc nào?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

4. Ưu điểm chính của thuật toán 'Support Vector Machine' (SVM) so với các thuật toán phân loại khác là gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

5. Độ đo 'độ chính xác' (accuracy) trong phân loại (classification) được tính bằng công thức nào?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

6. Hàm mất mát (loss function) trong học máy được sử dụng để làm gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

7. Vấn đề 'vanishing gradient' (gradient biến mất) thường xảy ra trong mạng nơ-ron sâu (deep neural networks) là gì?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

8. Trong học máy, 'học có giám sát' (supervised learning) khác biệt với 'học không giám sát' (unsupervised learning) chủ yếu ở điểm nào?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

9. Khi triển khai mô hình học máy trong thực tế, điều quan trọng nào sau đây cần được xem xét ngoài độ chính xác của mô hình?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

10. Thuật ngữ 'backpropagation' (lan truyền ngược) liên quan đến quá trình nào trong huấn luyện mạng nơ-ron?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

11. Học máy (Machine Learning) được định nghĩa chính xác nhất là:

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

12. Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong học máy?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

13. Lỗi 'bias' (độ lệch) và 'variance' (phương sai) trong học máy thể hiện điều gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

14. Lớp 'pooling' (gộp nhóm) trong CNN thường được sử dụng sau lớp tích chập với mục đích gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

15. Trong xử lý ngôn ngữ tự nhiên (NLP), 'word embedding' (biểu diễn từ) có mục đích gì?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

16. Mục tiêu chính của việc chia tập dữ liệu thành 'tập huấn luyện' (training set) và 'tập kiểm thử' (test set) trong học máy là gì?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

17. Kỹ thuật 'dropout' thường được sử dụng trong mạng nơ-ron để giải quyết vấn đề nào?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

18. Đâu là thách thức lớn nhất hiện nay trong lĩnh vực học máy?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

19. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán học có giám sát?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

20. Thuật toán 'Gradient Descent' được sử dụng để làm gì trong học máy?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

21. Khi nào thì nên ưu tiên sử dụng độ đo 'F1-score' thay vì 'accuracy' để đánh giá mô hình phân loại?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

22. Ứng dụng nào sau đây KHÔNG phải là ứng dụng điển hình của học máy?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

23. Sự khác biệt chính giữa thuật toán 'Random Forest' và 'Boosting' là gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

24. Trong mạng nơ-ron (Neural Network), hàm kích hoạt (activation function) có vai trò gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

25. Mạng nơ-ron hồi quy (RNN) được thiết kế đặc biệt để xử lý loại dữ liệu nào?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

26. Trong bài toán phân loại nhị phân (binary classification), 'độRecall' (Recall) đo lường điều gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

27. Phương pháp nào sau đây thường được sử dụng để giảm thiểu hiện tượng quá khớp (overfitting) trong mô hình học máy?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

28. Hiện tượng 'quá khớp' (overfitting) trong học máy xảy ra khi nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

29. Phương pháp 'Principal Component Analysis' (PCA) được sử dụng để làm gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Học máy

Tags: Bộ đề 3

30. Kiến trúc 'Transformer' (biến hình) vượt trội hơn RNN trong xử lý ngôn ngữ tự nhiên (NLP) chủ yếu nhờ cơ chế nào?