Trắc nghiệm Khoa học máy tính 12 Chân trời bài F16: Máy tính, thuật toán và Khoa học dữ liệu
1. Trong Khoa học dữ liệu, thuật toán "Phân cụm" (Clustering) được sử dụng chủ yếu cho mục đích gì?
A. Dự đoán giá trị tương lai.
B. Nhóm các điểm dữ liệu tương tự nhau lại với nhau.
C. Sắp xếp dữ liệu theo thứ tự.
D. Xác định mối quan hệ nhân quả.
2. Trong Khoa học dữ liệu, khái niệm "tính tương quan" (correlation) mô tả điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ mà hai biến thay đổi cùng nhau một cách có hệ thống.
C. Khả năng dự đoán chính xác của một mô hình.
D. Độ phức tạp của một thuật toán.
3. Mục tiêu chính của việc "trực quan hóa dữ liệu" (data visualization) là gì?
A. Giảm kích thước tập dữ liệu.
B. Tìm kiếm các mẫu hình, xu hướng và mối quan hệ trong dữ liệu một cách dễ hiểu.
C. Tăng tốc độ xử lý thuật toán.
D. Xóa bỏ các giá trị ngoại lai (outliers).
4. Máy tính thực hiện các phép tính toán học và logic dựa trên các lệnh được cung cấp. Đơn vị xử lý trung tâm (CPU) chịu trách nhiệm chính cho việc gì?
A. Lưu trữ dữ liệu lâu dài.
B. Hiển thị hình ảnh trên màn hình.
C. Thực thi các lệnh và xử lý dữ liệu.
D. Kết nối với mạng Internet.
5. Đâu là một ví dụ về "phần cứng" của máy tính?
A. Hệ điều hành Linux.
B. Trình soạn thảo văn bản.
C. Ổ cứng (Hard Drive).
D. Trình duyệt web.
6. Thuật toán nào thường được sử dụng để tìm kiếm một phần tử trong một danh sách đã sắp xếp một cách hiệu quả?
A. Thuật toán sắp xếp nổi bọt (Bubble Sort)
B. Thuật toán tìm kiếm tuyến tính (Linear Search)
C. Thuật toán tìm kiếm nhị phân (Binary Search)
D. Thuật toán sắp xếp chọn (Selection Sort)
7. Một "chuỗi ký tự" (string) trong lập trình là gì?
A. Một số nguyên.
B. Một tập hợp các ký tự được sắp xếp theo một thứ tự nhất định.
C. Một giá trị logic (đúng/sai).
D. Một tập hợp các số thực.
8. Bộ nhớ RAM (Random Access Memory) trong máy tính có chức năng chính là gì?
A. Lưu trữ vĩnh viễn hệ điều hành.
B. Lưu trữ dữ liệu tạm thời cho các ứng dụng đang chạy.
C. Lưu trữ các tệp tin đa phương tiện.
D. Cung cấp nguồn điện cho máy tính.
9. Trong lập trình, biến "x" có giá trị là 10. Sau phép toán "x = x + 5", giá trị mới của "x" là bao nhiêu?
10. Hệ điều hành máy tính có vai trò gì cơ bản nhất?
A. Chỉ để hiển thị giao diện người dùng.
B. Quản lý tài nguyên phần cứng và cung cấp môi trường cho phần mềm hoạt động.
C. Chỉ để chạy các ứng dụng văn phòng.
D. Tạo ra các thuật toán mới.
11. Ngành Khoa học dữ liệu tập trung vào việc trích xuất kiến thức và thông tin chi tiết từ những loại dữ liệu nào?
A. Chỉ dữ liệu văn bản.
B. Chỉ dữ liệu số.
C. Dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc.
D. Chỉ dữ liệu hình ảnh.
12. Trong lập trình, "vòng lặp" (loop) được sử dụng để làm gì?
A. Định nghĩa một hàm mới.
B. Thực hiện một khối lệnh nhiều lần.
C. Lưu trữ dữ liệu tạm thời.
D. Kiểm tra điều kiện logic.
13. Thuật toán nào có độ phức tạp thời gian là O(n^2) trong trường hợp xấu nhất và thường không hiệu quả cho tập dữ liệu lớn?
A. Quick Sort
B. Merge Sort
C. Bubble Sort
D. Heap Sort
14. Khái niệm "Big Data" thường đề cập đến những tập dữ liệu có đặc điểm nào sau đây?
A. Nhỏ, có cấu trúc và dễ dàng quản lý.
B. Lớn về khối lượng, đa dạng về định dạng, và thay đổi nhanh chóng.
C. Chỉ bao gồm dữ liệu văn bản.
D. Yêu cầu phần cứng máy tính rất cũ.
15. Trong ngữ cảnh của Khoa học dữ liệu, thuật ngữ "feature" (đặc trưng) ám chỉ điều gì?
A. Kết quả đầu ra của mô hình dự đoán.
B. Một thuộc tính hoặc biến đo lường được trong tập dữ liệu.
C. Quá trình huấn luyện mô hình.
D. Độ chính xác của mô hình dự đoán.
16. Đâu là một ví dụ về "dữ liệu có cấu trúc" (structured data) trong Khoa học dữ liệu?
A. Nội dung của một bài đăng trên mạng xã hội.
B. Một file CSV (Comma Separated Values) chứa thông tin khách hàng.
C. Một đoạn video clip.
D. Một file âm thanh.
17. Đâu là một ví dụ về "thuật toán"?
A. Một chương trình ứng dụng di động.
B. Một tập hợp các bước hữu hạn, rõ ràng để giải quyết một vấn đề hoặc thực hiện một nhiệm vụ.
C. Phần cứng của máy tính.
D. Hệ điều hành máy tính.
18. Đâu là một ví dụ về "phần mềm ứng dụng"?
A. Hệ điều hành Windows.
B. Trình duyệt web Chrome.
C. Driver của card đồ họa.
D. BIOS của máy tính.
19. Trong Khoa học dữ liệu, "phân loại" (classification) là một kỹ thuật thuộc loại học máy nào?
A. Học không giám sát (Unsupervised Learning)
B. Học có giám sát (Supervised Learning)
C. Học tăng cường (Reinforcement Learning)
D. Học nửa giám sát (Semi-supervised Learning)
20. Trong Khoa học dữ liệu, thuật ngữ "overfitting" (quá khớp) mô tả hiện tượng gì?
A. Mô hình quá đơn giản, không nắm bắt được các mẫu hình phức tạp.
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng hoạt động kém trên dữ liệu mới.
C. Dữ liệu huấn luyện bị thiếu.
D. Mô hình bị lỗi cú pháp.
21. Thuật toán nào thuộc nhóm thuật toán tìm kiếm, thường được sử dụng khi không có thông tin về thứ tự của các phần tử?
A. Binary Search
B. Linear Search
C. Jump Search
D. Interpolation Search
22. Thuật toán nào thuộc nhóm thuật toán sắp xếp, có độ phức tạp thời gian trung bình là O(n log n) và hiệu quả cho tập dữ liệu lớn?
A. Bubble Sort
B. Insertion Sort
C. Merge Sort
D. Selection Sort
23. Thuật toán "Quick Sort" thường được đánh giá cao về hiệu suất vì có độ phức tạp thời gian trung bình là bao nhiêu?
A. O(n)
B. O(n^2)
C. O(n log n)
D. O(log n)
24. Trong Khoa học dữ liệu, quá trình thu thập, làm sạch và chuẩn bị dữ liệu trước khi phân tích được gọi là gì?
A. Khai thác dữ liệu (Data Mining)
B. Tiền xử lý dữ liệu (Data Preprocessing)
C. Trực quan hóa dữ liệu (Data Visualization)
D. Học máy (Machine Learning)
25. Trong Khoa học dữ liệu, "hồi quy tuyến tính" (linear regression) được sử dụng để làm gì?
A. Phân loại dữ liệu vào các nhóm rời rạc.
B. Dự đoán một giá trị liên tục dựa trên một hoặc nhiều biến đầu vào.
C. Tìm kiếm các mẫu hình ẩn trong dữ liệu phi cấu trúc.
D. Giảm số chiều của dữ liệu.