Trắc nghiệm Tin học 11 Tin học ứng dụng Kết nối Bài 10 Lưu trữ dữ liệu và khai thác thông tin phục vụ và quản lý
1. Loại hình lưu trữ nào thường được sử dụng cho các tệp tin có kích thước lớn và ít khi truy cập, nhằm tối ưu chi phí?
A. Lưu trữ trên ổ cứng SSD.
B. Lưu trữ lạnh (cold storage) hoặc lưu trữ trên băng từ.
C. Lưu trữ trên ổ cứng HDD tốc độ cao.
D. Lưu trữ trên bộ nhớ RAM.
2. Để tìm kiếm thông tin về "các sản phẩm bán chạy nhất trong quý trước" trong một cơ sở dữ liệu bán hàng, người dùng cần thực hiện hành động gì?
A. Xóa tất cả dữ liệu cũ.
B. Thực hiện một truy vấn (query) dựa trên các tiêu chí mong muốn.
C. Tăng dung lượng ổ cứng.
D. Thay đổi mật khẩu hệ thống.
3. Loại thông tin nào thường được ưu tiên khai thác để hỗ trợ quyết định kinh doanh chiến lược?
A. Dữ liệu giao dịch hàng ngày chi tiết.
B. Thông tin xu hướng thị trường và hành vi khách hàng.
C. Nhật ký hệ thống và các bản ghi lỗi.
D. Tệp tin cấu hình phần mềm.
4. Trong một hệ thống quản lý cơ sở dữ liệu, "lược đồ cơ sở dữ liệu" (database schema) có vai trò gì?
A. Là nơi lưu trữ toàn bộ dữ liệu thực tế.
B. Định nghĩa cấu trúc logic của cơ sở dữ liệu, bao gồm các bảng, trường, mối quan hệ và ràng buộc.
C. Là công cụ để chạy các truy vấn tìm kiếm dữ liệu.
D. Quy định quyền truy cập của người dùng vào cơ sở dữ liệu.
5. Vai trò của "ngôn ngữ truy vấn có cấu trúc" (SQL - Structured Query Language) trong quản lý cơ sở dữ liệu là gì?
A. Là ngôn ngữ lập trình để phát triển ứng dụng.
B. Là ngôn ngữ tiêu chuẩn để thao tác, truy vấn và quản lý dữ liệu trong các hệ quản trị cơ sở dữ liệu quan hệ.
C. Là ngôn ngữ để thiết kế giao diện người dùng.
D. Là ngôn ngữ để mã hóa dữ liệu.
6. Trong quá trình khai thác thông tin, thuật ngữ "data warehousing" (kho dữ liệu) đề cập đến điều gì?
A. Là quá trình xóa dữ liệu không cần thiết.
B. Là một hệ thống lưu trữ và quản lý dữ liệu lớn, tích hợp từ nhiều nguồn khác nhau, được thiết kế cho mục đích phân tích và báo cáo.
C. Là công cụ để tạo giao diện người dùng.
D. Là phương pháp mã hóa dữ liệu.
7. Yếu tố nào là quan trọng nhất để đảm bảo rằng thông tin được khai thác từ cơ sở dữ liệu là đáng tin cậy cho việc ra quyết định?
A. Số lượng dữ liệu lớn.
B. Tính chính xác, đầy đủ và nhất quán của dữ liệu gốc.
C. Tốc độ truy xuất nhanh.
D. Giao diện người dùng đẹp mắt.
8. Trong bối cảnh quản lý thông tin, "metadata" (siêu dữ liệu) là gì?
A. Là dữ liệu thực tế được lưu trữ.
B. Là dữ liệu mô tả về dữ liệu khác, cung cấp thông tin về nguồn gốc, định dạng, cấu trúc, và cách sử dụng.
C. Là bản sao lưu của toàn bộ cơ sở dữ liệu.
D. Là mật khẩu để truy cập vào hệ thống.
9. Khi thực hiện phân tích dữ liệu để tìm ra mối tương quan giữa hai biến số, kỹ thuật nào thường được sử dụng?
A. Xóa bỏ tất cả các bản ghi.
B. Áp dụng các thuật toán thống kê như hồi quy hoặc phân tích tương quan.
C. Chỉ xem xét các giá trị ngoại lệ.
D. Tăng số lượng trường dữ liệu.
10. Trong lĩnh vực khai thác dữ liệu, "hành động" (action) trong một tập luật kết hợp (association rule) thể hiện điều gì?
A. Là một mục dữ liệu không liên quan.
B. Là kết quả hoặc hệ quả có thể xảy ra khi các điều kiện của luật được thỏa mãn.
C. Là tần suất xuất hiện của một mặt hàng.
D. Là phương pháp để lưu trữ dữ liệu.
11. Khi phân tích dữ liệu để phát hiện các mẫu bất thường hoặc gian lận, phương pháp nào là phù hợp nhất?
A. Xóa bỏ tất cả các bản ghi có giá trị giống nhau.
B. Sử dụng các kỹ thuật phát hiện bất thường (anomaly detection) hoặc khai phá dữ liệu (data mining).
C. Chỉ xem xét các dữ liệu được nhập vào đầu ngày.
D. Tăng cường bảo mật vật lý cho trung tâm dữ liệu.
12. Để đảm bảo tính sẵn sàng cao (high availability) cho hệ thống lưu trữ dữ liệu, biện pháp nào sau đây là hiệu quả nhất?
A. Chỉ sử dụng một máy chủ lưu trữ duy nhất.
B. Triển khai các giải pháp dự phòng và sao lưu dữ liệu (redundancy and backup).
C. Giảm thiểu số lượng người dùng truy cập.
D. Chỉ lưu trữ dữ liệu quan trọng.
13. Khi xây dựng một hệ thống lưu trữ dữ liệu, yếu tố "khả năng mở rộng" (scalability) có ý nghĩa gì?
A. Khả năng thay đổi giao diện người dùng dễ dàng.
B. Khả năng tăng hoặc giảm dung lượng lưu trữ và hiệu năng của hệ thống để đáp ứng nhu cầu thay đổi.
C. Khả năng chống lại các cuộc tấn công mạng.
D. Khả năng làm việc trên nhiều hệ điều hành khác nhau.
14. Trong các kỹ thuật khai thác thông tin, "phân tích cụm" (clustering analysis) thường được sử dụng để làm gì?
A. Dự đoán giá cổ phiếu.
B. Nhóm các đối tượng hoặc điểm dữ liệu có đặc điểm tương tự nhau.
C. Xóa bỏ các bản ghi trùng lặp.
D. Tạo ra các báo cáo tổng hợp.
15. Khi xem xét chiến lược lưu trữ dữ liệu, yếu tố nào cần được ưu tiên để đảm bảo tuân thủ các quy định pháp luật về bảo vệ dữ liệu cá nhân?
A. Tốc độ truy cập nhanh.
B. Bảo mật dữ liệu và quyền riêng tư.
C. Khả năng mở rộng không giới hạn.
D. Chi phí lưu trữ thấp nhất.
16. Trong ngữ cảnh quản lý dữ liệu, mục tiêu chính của việc lưu trữ dữ liệu là gì?
A. Tạo ra các tệp tin có dung lượng lớn nhất có thể.
B. Đảm bảo dữ liệu có thể được truy cập, sử dụng và bảo vệ một cách hiệu quả.
C. Chỉ đơn giản là sao chép dữ liệu từ nguồn này sang nguồn khác.
D. Giảm thiểu chi phí lưu trữ bằng mọi giá, ngay cả khi ảnh hưởng đến khả năng truy cập.
17. Trong các công nghệ lưu trữ, "đám mây" (cloud storage) mang lại lợi ích chính nào cho doanh nghiệp?
A. Giảm hoàn toàn nhu cầu về quản lý hạ tầng vật lý.
B. Khả năng mở rộng linh hoạt, truy cập từ mọi nơi và giảm chi phí ban đầu.
C. Tăng cường kiểm soát vật lý đối với thiết bị lưu trữ.
D. Đảm bảo tốc độ truy cập nhanh hơn so với lưu trữ tại chỗ.
18. Mục đích của việc tạo chỉ mục (index) trong cơ sở dữ liệu là gì?
A. Tăng dung lượng lưu trữ của cơ sở dữ liệu.
B. Giảm tốc độ truy vấn dữ liệu.
C. Tăng tốc độ truy xuất dữ liệu bằng cách cung cấp một cấu trúc tra cứu nhanh chóng.
D. Ngăn chặn việc xóa dữ liệu.
19. Lợi ích chính của việc sử dụng hệ quản trị cơ sở dữ liệu (DBMS) so với việc quản lý dữ liệu bằng các tệp tin thông thường là gì?
A. Tăng số lượng tệp tin.
B. Cung cấp các cơ chế quản lý tập trung, đảm bảo tính toàn vẹn, bảo mật và khả năng truy vấn dữ liệu hiệu quả hơn.
C. Làm chậm quá trình truy cập dữ liệu.
D. Yêu cầu ít kiến thức chuyên môn hơn.
20. Yếu tố nào sau đây KHÔNG phải là một đặc điểm quan trọng của một hệ thống lưu trữ dữ liệu hiệu quả?
A. Khả năng mở rộng (Scalability).
B. Bảo mật dữ liệu (Data Security).
C. Tốc độ truy cập ngẫu nhiên kém (Poor random access speed).
D. Độ tin cậy (Reliability).
21. Việc phân loại dữ liệu thành "dữ liệu có cấu trúc", "dữ liệu bán cấu trúc" và "dữ liệu phi cấu trúc" giúp ích gì cho quá trình khai thác thông tin?
A. Giúp đơn giản hóa việc lưu trữ bằng cách chỉ giữ lại dữ liệu có cấu trúc.
B. Cho phép lựa chọn các phương pháp và công cụ khai thác phù hợp với từng loại dữ liệu.
C. Ngăn chặn việc truy cập vào dữ liệu phi cấu trúc.
D. Tăng tốc độ truy cập cho tất cả các loại dữ liệu.
22. Khi nói về "khai thác thông tin", hành động nào sau đây được xem là cốt lõi nhất?
A. Chỉ đơn thuần là sao chép toàn bộ cơ sở dữ liệu.
B. Phân tích, xử lý và diễn giải dữ liệu để rút ra tri thức hữu ích.
C. Tăng cường dung lượng lưu trữ của hệ thống.
D. Xóa bỏ các dữ liệu không cần thiết.
23. Một hệ thống quản lý dữ liệu phục vụ quản lý cần đảm bảo nguyên tắc nào để thông tin luôn cập nhật và chính xác?
A. Chỉ cập nhật dữ liệu khi có lỗi phát sinh.
B. Thực hiện cập nhật định kỳ và kiểm tra tính nhất quán của dữ liệu.
C. Ngăn chặn mọi hình thức cập nhật để tránh sai sót.
D. Ưu tiên tốc độ cập nhật hơn là tính chính xác.
24. Mục tiêu của "làm sạch dữ liệu" (data cleaning) là gì?
A. Tăng kích thước của tập dữ liệu.
B. Xác định và sửa chữa các sai sót, mâu thuẫn, hoặc dữ liệu thiếu trong tập dữ liệu.
C. Chỉ giữ lại các bản ghi có giá trị cao.
D. Chuyển đổi tất cả dữ liệu sang định dạng văn bản.
25. Khi khai thác thông tin từ các nguồn dữ liệu lớn (Big Data), thách thức lớn nhất thường gặp là gì?
A. Thiếu dữ liệu để phân tích.
B. Khối lượng, tốc độ và sự đa dạng của dữ liệu (Volume, Velocity, Variety).
C. Tốc độ truy cập chậm trên các thiết bị di động.
D. Chi phí lưu trữ rất thấp.