1. Trong mô hình dữ liệu quan hệ, khái niệm nào sau đây dùng để mô tả cấu trúc logic của dữ liệu, bao gồm các bảng, cột, khóa và ràng buộc?
A. Instance
B. Schema
C. Data dictionary
D. Physical data model
2. Loại ràng buộc toàn vẹn dữ liệu nào đảm bảo rằng giá trị nhập vào cho một cột phải nằm trong một danh sách các giá trị được phép?
A. Ràng buộc miền giá trị (Domain constraint)
B. Ràng buộc khóa chính (Primary key constraint)
C. Ràng buộc tham chiếu (Referential integrity constraint)
D. Ràng buộc duy nhất (Unique constraint)
3. Trong SQL, câu lệnh nào được sử dụng để truy xuất dữ liệu từ nhiều bảng có liên quan?
A. UPDATE
B. JOIN
C. DELETE
D. CREATE
4. Thuật ngữ ACID trong quản trị cơ sở dữ liệu đề cập đến nhóm các thuộc tính nào của giao dịch (transaction)?
A. Tính toàn vẹn, Tính nhất quán, Tính khả dụng, Độ bền
B. Tính nguyên tử, Tính nhất quán, Tính độc lập, Độ bền
C. Tính xác thực, Tính ủy quyền, Tính toàn vẹn, Tính bảo mật
D. Tính khả dụng, Tính linh hoạt, Tính mở rộng, Hiệu năng
5. Trong quá trình thiết kế cơ sở dữ liệu quan hệ, chuẩn hóa (normalization) nhằm mục đích chính là gì?
A. Tăng tốc độ truy vấn dữ liệu
B. Giảm thiểu dư thừa dữ liệu và cải thiện tính toàn vẹn dữ liệu
C. Đảm bảo tính bảo mật cho cơ sở dữ liệu
D. Đơn giản hóa cấu trúc vật lý của cơ sở dữ liệu
6. Loại chỉ mục (index) nào phù hợp nhất cho các cột thường xuyên được sử dụng trong mệnh đề WHERE với các toán tử so sánh phạm vi (ví dụ: >, <, BETWEEN)?
A. Hash index
B. Bitmap index
C. B-tree index
D. Clustered index
7. Trong mô hình cơ sở dữ liệu NoSQL, loại cơ sở dữ liệu nào lưu trữ dữ liệu dưới dạng các cặp key-value, thường được sử dụng cho caching và session management?
A. Document database
B. Graph database
C. Key-value database
D. Column-family database
8. Phương pháp nào sau đây giúp đảm bảo tính khả dụng cao (high availability) cho hệ thống cơ sở dữ liệu, ngay cả khi có sự cố phần cứng hoặc phần mềm?
A. Mã hóa dữ liệu (Data encryption)
B. Sao lưu và phục hồi dữ liệu (Backup and recovery)
C. Nhân bản cơ sở dữ liệu (Database replication)
D. Kiểm soát truy cập (Access control)
9. Trong ngữ cảnh bảo mật cơ sở dữ liệu, `SQL injection` là loại tấn công nào?
A. Tấn công từ chối dịch vụ (Denial of Service)
B. Tấn công leo thang đặc quyền (Privilege Escalation)
C. Tấn công chèn mã SQL độc hại vào truy vấn
D. Tấn công nghe lén dữ liệu (Eavesdropping)
10. Công cụ nào thường được sử dụng để giám sát hiệu năng (performance monitoring) của cơ sở dữ liệu, giúp phát hiện và giải quyết các vấn đề về hiệu suất?
A. Trình biên dịch (Compiler)
B. Trình gỡ lỗi (Debugger)
C. Hệ thống quản lý nhật ký (Log management system)
D. Công cụ giám sát cơ sở dữ liệu (Database monitoring tool)
11. Trong SQL, mệnh đề nào được sử dụng để lọc các bản ghi trùng lặp trong kết quả truy vấn?
A. ORDER BY
B. GROUP BY
C. DISTINCT
D. HAVING
12. Kiến trúc cơ sở dữ liệu `3-tier` thường bao gồm các tầng nào?
A. Presentation, Logic, Storage
B. Client, Server, Database
C. Web, Application, Database
D. User Interface, Business Logic, Data Access
13. Trong bối cảnh Data Warehouse, ETL là viết tắt của quy trình nào?
A. Extract, Transform, Load
B. Encrypt, Transfer, Log
C. Evaluate, Test, Launch
D. Execute, Track, Analyze
14. Loại sao lưu cơ sở dữ liệu nào chỉ sao lưu các thay đổi kể từ lần sao lưu đầy đủ cuối cùng?
A. Sao lưu đầy đủ (Full backup)
B. Sao lưu vi sai (Differential backup)
C. Sao lưu gia tăng (Incremental backup)
D. Sao lưu nóng (Hot backup)
15. Trong ngữ cảnh cơ sở dữ liệu phân tán, `sharding` (phân mảnh) là kỹ thuật để làm gì?
A. Mã hóa dữ liệu trên nhiều máy chủ
B. Phân chia dữ liệu theo chiều ngang trên nhiều máy chủ
C. Tạo bản sao dữ liệu dự phòng
D. Nén dữ liệu để giảm dung lượng lưu trữ
16. Khái niệm `deadlock` (bế tắc) trong quản trị cơ sở dữ liệu xảy ra khi nào?
A. Khi hệ thống cơ sở dữ liệu quá tải
B. Khi hai hoặc nhiều giao dịch chờ đợi lẫn nhau để giải phóng tài nguyên
C. Khi kết nối mạng đến cơ sở dữ liệu bị gián đoạn
D. Khi dữ liệu trong cơ sở dữ liệu bị hỏng
17. Công nghệ nào thường được sử dụng để quản lý lượng lớn dữ liệu phi cấu trúc, ví dụ như dữ liệu từ mạng xã hội, log server, hoặc cảm biến?
A. Hệ quản trị CSDL quan hệ (RDBMS)
B. Hệ quản trị CSDL hướng đối tượng (OODBMS)
C. Hadoop và các công nghệ Big Data
D. Hệ quản trị CSDL phân cấp (Hierarchical DBMS)
18. Trong SQL, hàm gộp (aggregate function) nào được sử dụng để tính giá trị trung bình của một cột?
A. SUM()
B. COUNT()
C. AVG()
D. MAX()
19. Loại khóa nào trong cơ sở dữ liệu quan hệ xác định duy nhất mỗi bản ghi trong một bảng và được chọn làm khóa chính?
A. Khóa ngoại (Foreign key)
B. Khóa ứng viên (Candidate key)
C. Khóa chính (Primary key)
D. Khóa thay thế (Alternate key)
20. Trong quản trị cơ sở dữ liệu, thuật ngữ `tuning` (tối ưu hóa) thường liên quan đến việc gì?
A. Thiết kế lại lược đồ cơ sở dữ liệu
B. Cải thiện hiệu suất truy vấn và hoạt động của cơ sở dữ liệu
C. Sao lưu và phục hồi dữ liệu định kỳ
D. Kiểm tra và vá lỗi bảo mật
21. Trong mô hình ER (Entity-Relationship), hình thoi (diamond) được sử dụng để biểu diễn khái niệm nào?
A. Thuộc tính (Attribute)
B. Thực thể (Entity)
C. Mối quan hệ (Relationship)
D. Khóa chính (Primary key)
22. Phương pháp nào sau đây giúp bảo vệ dữ liệu khi truyền qua mạng, ví dụ như giữa ứng dụng web và máy chủ cơ sở dữ liệu?
A. Kiểm soát truy cập dựa trên vai trò (RBAC)
B. Mã hóa dữ liệu (Data encryption)
C. Tường lửa (Firewall)
D. Hệ thống phát hiện xâm nhập (IDS)
23. Trong SQL, mệnh đề `GROUP BY` thường được sử dụng kết hợp với mệnh đề nào để lọc các nhóm dựa trên một điều kiện?
A. WHERE
B. ORDER BY
C. HAVING
D. LIMIT
24. Trong ngữ cảnh cơ sở dữ liệu đám mây (cloud database), `Database as a Service` (DBaaS) mang lại lợi ích chính nào cho người dùng?
A. Toàn quyền kiểm soát cơ sở hạ tầng phần cứng
B. Giảm chi phí quản lý và vận hành cơ sở dữ liệu
C. Tăng cường bảo mật dữ liệu tuyệt đối
D. Tăng tốc độ truy cập dữ liệu cục bộ
25. Trong thiết kế cơ sở dữ liệu, mối quan hệ `một-nhiều` (one-to-many relationship) giữa hai thực thể có nghĩa là gì?
A. Một bản ghi trong thực thể thứ nhất có thể liên kết với nhiều bản ghi trong thực thể thứ hai, và ngược lại.
B. Một bản ghi trong thực thể thứ nhất có thể liên kết với nhiều bản ghi trong thực thể thứ hai, nhưng một bản ghi trong thực thể thứ hai chỉ liên kết với tối đa một bản ghi trong thực thể thứ nhất.
C. Mỗi bản ghi trong thực thể thứ nhất phải liên kết với đúng một bản ghi trong thực thể thứ hai.
D. Không có mối liên kết trực tiếp giữa các bản ghi của hai thực thể.
26. Kỹ thuật `indexing` (tạo chỉ mục) trong cơ sở dữ liệu có tác động chính đến khía cạnh nào của hiệu suất?
A. Tăng tốc độ ghi dữ liệu
B. Giảm dung lượng lưu trữ dữ liệu
C. Tăng tốc độ truy vấn dữ liệu (đọc dữ liệu)
D. Cải thiện tính toàn vẹn dữ liệu
27. Trong quản lý giao dịch (transaction management), thuộc tính `Isolation` (tính độc lập) đảm bảo điều gì?
A. Các giao dịch được thực hiện một cách tuần tự, không chồng chéo.
B. Kết quả của giao dịch được ghi nhận vĩnh viễn vào cơ sở dữ liệu.
C. Các giao dịch được thực hiện như một đơn vị công việc không thể chia cắt.
D. Các giao dịch đồng thời không gây ảnh hưởng lẫn nhau, mỗi giao dịch hoạt động như thể nó là giao dịch duy nhất.
28. Trong ngữ cảnh bảo mật dữ liệu, `data masking` (che dấu dữ liệu) được sử dụng để làm gì?
A. Mã hóa toàn bộ cơ sở dữ liệu
B. Ẩn hoặc thay thế dữ liệu nhạy cảm bằng dữ liệu giả mạo nhưng vẫn giữ định dạng.
C. Xóa vĩnh viễn dữ liệu không còn cần thiết
D. Giám sát quyền truy cập dữ liệu
29. Một công ty thương mại điện tử muốn theo dõi hành vi mua sắm của khách hàng trên website để cá nhân hóa trải nghiệm và đưa ra các khuyến nghị sản phẩm phù hợp. Loại hình cơ sở dữ liệu nào sau đây có thể phù hợp nhất để phân tích dữ liệu hành vi khách hàng?
A. Cơ sở dữ liệu quan hệ (Relational database)
B. Cơ sở dữ liệu hướng đối tượng (Object-oriented database)
C. Kho dữ liệu (Data warehouse)
D. Cơ sở dữ liệu đồ thị (Graph database)
30. Trong môi trường cơ sở dữ liệu lớn, kỹ thuật `partitioning` (phân vùng) được sử dụng để cải thiện hiệu suất và khả năng quản lý bằng cách nào?
A. Mã hóa dữ liệu thành các phần nhỏ hơn
B. Phân chia bảng lớn thành các phần nhỏ hơn, dễ quản lý và truy vấn
C. Sao lưu dữ liệu sang các thiết bị lưu trữ khác nhau
D. Nén dữ liệu để giảm dung lượng lưu trữ