1. Tại sao dữ liệu ngày tháng năm (ví dụ: 20/10/2023) lại cần có một cách biểu diễn chuẩn hóa trong máy tính?
A. Để làm cho ngày tháng trông đẹp mắt hơn.
B. Để máy tính có thể thực hiện các phép toán liên quan đến thời gian (ví dụ: tính khoảng cách giữa hai ngày).
C. Để tránh nhầm lẫn với các loại dữ liệu khác.
D. Vì các định dạng ngày tháng khác nhau ở mỗi quốc gia.
2. Phân biệt giữa nén dữ liệu có tổn hao (lossy compression) và nén dữ liệu không tổn hao (lossless compression). Nén dữ liệu có tổn hao sẽ làm gì?
A. Giữ lại toàn bộ thông tin gốc, có thể khôi phục hoàn toàn.
B. Loại bỏ một phần thông tin không quan trọng để giảm dung lượng tối đa.
C. Chỉ áp dụng cho dữ liệu văn bản.
D. Tăng kích thước tệp tin để đảm bảo chất lượng.
3. Việc chuyển đổi dữ liệu từ dạng này sang dạng khác (ví dụ: từ hình ảnh sang văn bản mô tả) có thể gây ra mất mát thông tin nếu không được thực hiện cẩn thận. Nguyên nhân chủ yếu của sự mất mát này là gì?
A. Tốc độ xử lý của máy tính quá chậm.
B. Sự khác biệt về bản chất và độ chi tiết giữa các dạng biểu diễn.
C. Dung lượng bộ nhớ không đủ.
D. Lỗi cú pháp trong mã nguồn.
4. Khi nói về biểu diễn ký tự văn bản, tiêu chuẩn mã hóa nào hiện đang được sử dụng rộng rãi nhất trên toàn cầu để hỗ trợ nhiều ngôn ngữ khác nhau?
A. ASCII (American Standard Code for Information Interchange).
B. EBCDIC (Extended Binary Coded Decimal Interchange Code).
C. Unicode (bao gồm UTF-8).
D. ISO 8859-1.
5. Việc lựa chọn phương pháp biểu diễn dữ liệu phù hợp phụ thuộc vào nhiều yếu tố. Yếu tố nào sau đây là KHÔNG QUAN TRỌNG khi xem xét lựa chọn phương pháp biểu diễn?
A. Loại dữ liệu cần biểu diễn (số, văn bản, hình ảnh...).
B. Mục đích sử dụng dữ liệu (lưu trữ, tính toán, hiển thị...).
C. Màu sắc yêu thích của người lập trình.
D. Yêu cầu về hiệu suất (tốc độ, dung lượng).
6. Trong lĩnh vực biểu diễn dữ liệu, bitmap là một phương pháp chủ yếu để biểu diễn loại dữ liệu nào?
A. Dữ liệu văn bản.
B. Dữ liệu âm thanh.
C. Dữ liệu hình ảnh dạng raster (các điểm ảnh).
D. Dữ liệu số nguyên.
7. Khi phân tích một biểu đồ hoặc đồ thị, mục đích của việc biểu diễn dữ liệu bằng hình ảnh là gì?
A. Làm cho dữ liệu trở nên khó hiểu hơn.
B. Giúp người xem dễ dàng nhận biết xu hướng, mối quan hệ và các điểm bất thường trong dữ liệu.
C. Chỉ để trang trí cho báo cáo.
D. Giảm dung lượng lưu trữ của dữ liệu.
8. Tại sao mã hóa UTF-8 lại được ưa chuộng hơn ASCII cho việc biểu diễn văn bản trên internet?
A. UTF-8 chỉ sử dụng 7 bit cho mỗi ký tự, tiết kiệm dung lượng hơn.
B. UTF-8 có thể biểu diễn tất cả các ký tự trong bảng chữ cái tiếng Anh và một số ký tự đặc biệt.
C. UTF-8 tương thích ngược với ASCII và có thể biểu diễn một phạm vi ký tự rộng lớn, bao gồm cả các ký tự quốc tế.
D. UTF-8 mã hóa tất cả ký tự thành một chuỗi 8 bit cố định.
9. Trong biểu diễn dữ liệu, siêu dữ liệu (metadata) là gì và vai trò của nó?
A. Dữ liệu chính cần được xử lý.
B. Dữ liệu mô tả về dữ liệu khác (ví dụ: ngày tạo, tác giả, định dạng).
C. Dữ liệu ẩn không thể truy cập được.
D. Dữ liệu bị lỗi cần sửa chữa.
10. Dữ liệu số trong máy tính thường được biểu diễn dưới dạng nào để đảm bảo tính chính xác và khả năng tính toán?
A. Chuỗi ký tự văn bản.
B. Mã nhị phân (binary code).
C. Hình ảnh đồ họa.
D. Âm thanh đa phương tiện.
11. Độ phân giải (resolution) của một hình ảnh kỹ thuật số ảnh hưởng trực tiếp đến điều gì trong biểu diễn dữ liệu hình ảnh?
A. Tốc độ tải ảnh.
B. Số lượng màu sắc có thể hiển thị.
C. Mức độ chi tiết và sắc nét của ảnh.
D. Định dạng tập tin của ảnh.
12. Compression (nén dữ liệu) trong biểu diễn dữ liệu nhằm mục đích chính là gì?
A. Tăng cường độ chính xác của dữ liệu.
B. Giảm dung lượng lưu trữ và băng thông truyền tải.
C. Chuyển đổi dữ liệu sang dạng dễ đọc hơn.
D. Thêm thông tin mã hóa bảo mật.
13. Tại sao dữ liệu dạng phân số hoặc số thập phân có giới hạn (ví dụ: 1/3, 3.14) đôi khi lại khó biểu diễn chính xác hoàn toàn trong máy tính?
A. Vì máy tính không hiểu phép chia.
B. Do cách biểu diễn số thực trong máy tính thường sử dụng dạng dấu phẩy động (floating-point) có giới hạn về độ chính xác.
C. Vì các số này quá lớn để lưu trữ.
D. Vì chúng luôn là số âm.
14. Khi xem xét biểu diễn dữ liệu cho các phép tính phức tạp, hệ thống số nào thường được sử dụng làm nền tảng cho các bộ xử lý máy tính?
A. Hệ thập phân (Decimal).
B. Hệ bát phân (Octal).
C. Hệ thập lục phân (Hexadecimal).
D. Hệ nhị phân (Binary).
15. Dữ liệu hình ảnh trong máy tính thường được biểu diễn dưới dạng nào để máy tính có thể hiển thị và xử lý?
A. Các chuỗi số nguyên dương.
B. Các chấm ảnh (pixel) với thông tin màu sắc và vị trí.
C. Các đoạn mã văn bản mô tả đối tượng.
D. Các tập tin âm thanh nén.
16. Khi biểu diễn dữ liệu dạng bảng (ví dụ: bảng tính), mỗi ô trong bảng thường chứa loại dữ liệu nào?
A. Chỉ văn bản.
B. Chỉ số liệu.
C. Số, văn bản, ngày tháng hoặc công thức.
D. Chỉ hình ảnh.
17. Trong biểu diễn dữ liệu âm thanh, đơn vị cơ bản nhất mà máy tính xử lý là gì?
A. Bit.
B. Byte.
C. Mẫu âm thanh (sample).
D. Tần số (frequency).
18. Khái niệm mã hóa (encoding) trong biểu diễn dữ liệu đề cập đến quá trình nào?
A. Giải mã dữ liệu thành dạng con người đọc được.
B. Chuyển đổi dữ liệu từ một dạng sang một dạng khác theo một quy tắc xác định.
C. Nén dữ liệu để giảm dung lượng lưu trữ.
D. Xác minh tính toàn vẹn của dữ liệu.
19. Dữ liệu dạng chuỗi ký tự (string) trong lập trình được biểu diễn như thế nào trong bộ nhớ máy tính?
A. Một số nguyên duy nhất.
B. Một mảng các ký tự, mỗi ký tự được mã hóa theo một tiêu chuẩn nhất định (ví dụ: Unicode).
C. Một tập hợp các số thực.
D. Một tệp âm thanh.
20. Khi biểu diễn dữ liệu dưới dạng video, yếu tố nào sau đây KHÔNG phải là một thành phần cơ bản của video kỹ thuật số?
A. Chuỗi các khung hình ảnh tĩnh.
B. Luồng dữ liệu âm thanh đồng bộ.
C. Siêu dữ liệu (metadata) mô tả nội dung.
D. Mã nguồn chương trình điều khiển.
21. Trong các định dạng tập tin phổ biến, định dạng nào thường sử dụng nén dữ liệu có tổn hao và được ưa chuộng cho hình ảnh chất lượng cao?
A. PNG (Portable Network Graphics).
B. BMP (Bitmap).
C. JPEG (Joint Photographic Experts Group).
D. TIFF (Tagged Image File Format).
22. Biểu diễn dữ liệu dạng boolean (logic) chỉ có hai giá trị. Theo quy ước phổ biến, hai giá trị này thường được biểu diễn bằng:
A. Tất cả các chữ cái.
B. Số 0 và 1, hoặc True và False.
C. Các màu sắc cơ bản.
D. Âm thanh cao và thấp.
23. Trong biểu diễn dữ liệu, nhị phân hóa (binarization) là một kỹ thuật thường áp dụng cho loại dữ liệu nào?
A. Dữ liệu số nguyên dương.
B. Dữ liệu văn bản có dấu tiếng Việt.
C. Dữ liệu hình ảnh hoặc dữ liệu mà ta muốn phân loại thành hai nhóm riêng biệt.
D. Dữ liệu âm thanh có tần số cao.
24. Tại sao việc sử dụng mã nhị phân (bao gồm 0 và 1) lại là phương pháp biểu diễn dữ liệu phổ biến và hiệu quả trong máy tính?
A. Vì nó giống với cách con người giao tiếp bằng lời nói.
B. Vì nó cho phép biểu diễn thông tin phức tạp một cách đơn giản và tin cậy bằng hai trạng thái điện tử.
C. Vì nó yêu cầu ít bộ nhớ lưu trữ hơn bất kỳ hệ thống mã hóa nào khác.
D. Vì nó dễ dàng chuyển đổi sang ngôn ngữ tự nhiên.
25. Trong Tin học, biểu diễn dữ liệu là quá trình chuyển đổi thông tin thành dạng mà máy tính có thể xử lý và lưu trữ. Theo phân tích phổ biến về biểu diễn dữ liệu, yếu tố nào sau đây KHÔNG được xem là một dạng biểu diễn dữ liệu cơ bản?
A. Mã hóa dưới dạng các bit và byte.
B. Sử dụng các ký hiệu đồ họa trực quan.
C. Biểu diễn dưới dạng văn bản thuần túy.
D. Mô tả bằng cảm xúc cá nhân không có cấu trúc.