Trắc nghiệm Tin học 10 kết nối tri thức bài Một số kiểu dữ liệu và dữ liệu văn bản
1. Khái niệm "mã hóa ký tự" (character encoding) chủ yếu giải quyết vấn đề gì?
A. Cách hiển thị màu sắc cho văn bản.
B. Cách biểu diễn ký tự văn bản bằng các bit mà máy tính có thể hiểu.
C. Cách nén văn bản để giảm dung lượng.
D. Cách sắp xếp các từ trong văn bản.
2. Đâu là ví dụ về dữ liệu văn bản có cấu trúc?
A. Một bài thơ không có định dạng.
B. Một email với các trường "đến", "từ", "chủ đề".
C. Một cuốn tiểu thuyết được viết liền mạch.
D. Một đoạn ghi chú cá nhân.
3. Chuỗi ký tự "Tin học 10" có bao nhiêu ký tự?
4. Tại sao một số ký tự đặc biệt hoặc ký tự có dấu tiếng Việt đôi khi hiển thị sai (ví dụ: ô vuông, dấu chấm hỏi) trong các văn bản?
A. Do lỗi đánh máy.
B. Do thiếu phông chữ (font) tương thích.
C. Do văn bản quá dài.
D. Do máy tính bị nhiễm virus.
5. Trong xử lý văn bản, "khoảng trắng" (space character) được coi là loại ký tự nào?
A. Ký tự điều khiển.
B. Ký tự đồ họa.
C. Ký tự đặc biệt.
D. Ký tự có thể nhìn thấy được.
6. Khi làm việc với dữ liệu văn bản tiếng Việt, việc sử dụng bảng mã Unicode (ví dụ: UTF-8) là quan trọng vì lý do gì?
A. Để làm cho văn bản có màu sắc.
B. Để đảm bảo hiển thị chính xác các ký tự có dấu và các ký tự đặc biệt của tiếng Việt.
C. Để giảm dung lượng của tệp văn bản.
D. Để chỉ cho phép nhập văn bản bằng tiếng Anh.
7. Nếu một chương trình yêu cầu nhập tên người dùng và người dùng nhập "Nguyễn Văn A", thì "Nguyễn Văn A" được lưu trữ trong máy tính dưới dạng nào?
A. Một số nguyên.
B. Một chuỗi ký tự.
C. Một giá trị logic (đúng/sai).
D. Một giá trị thực.
8. Tại sao việc phân biệt chữ hoa và chữ thường lại quan trọng trong nhiều ngữ cảnh xử lý văn bản?
A. Để làm cho văn bản trông đẹp hơn.
B. Vì nó có thể thay đổi ý nghĩa của từ hoặc dữ liệu.
C. Để giảm dung lượng lưu trữ của văn bản.
D. Vì máy tính chỉ hiểu chữ hoa.
9. Một văn bản có thể chứa nhiều loại ký tự khác nhau, bao gồm chữ cái, chữ số, dấu câu, và ký tự đặc biệt. Điều này khẳng định tính chất gì của dữ liệu văn bản?
A. Tính chất đơn điệu.
B. Tính chất đa dạng.
C. Tính chất số học.
D. Tính chất hình ảnh.
10. Một tệp văn bản (.txt) chủ yếu chứa loại dữ liệu nào?
A. Dữ liệu số.
B. Dữ liệu hình ảnh.
C. Dữ liệu văn bản (chuỗi ký tự).
D. Dữ liệu âm thanh.
11. Đâu là cách biểu diễn đúng cho một chuỗi ký tự trong ngôn ngữ lập trình Python?
A. "Xin chào"
B. "Xin chào"
C. Cả hai lựa chọn 1 và 2 đều đúng.
D. Xin chào
12. Trong ngôn ngữ lập trình, biểu thức `"Hello" + " World"` thường tạo ra kết quả là gì?
A. Error (Lỗi).
B. "Hello World"
C. ["Hello", " World"]
D. HelloWorld
13. Đâu là cách biểu diễn đúng cho một chuỗi ký tự trong nhiều ngôn ngữ lập trình?
A. "Xin chào thế giới"
B. "Xin chào thế giới"
C. Xin chào thế giới
D. /Xin chào thế giới/
14. Trong hệ thống mã hóa ký tự UTF-8, ký tự "é" tiếng Pháp hoặc "ü" tiếng Đức được biểu diễn như thế nào so với ký tự "e" hay "u" tiếng Anh?
A. Chúng có cùng số byte biểu diễn.
B. Chúng có thể yêu cầu nhiều byte hơn để biểu diễn.
C. Chúng chỉ được biểu diễn bằng một byte.
D. Chúng không thể được biểu diễn trong UTF-8.
15. Khái niệm "khác biệt về mã hóa" (encoding mismatch) có thể dẫn đến hiện tượng gì khi làm việc với văn bản?
A. Văn bản được định dạng đẹp hơn.
B. Các ký tự hiển thị sai hoặc bị biến đổi.
C. Dung lượng tệp văn bản giảm.
D. Tốc độ xử lý văn bản nhanh hơn.
16. Loại dữ liệu nào thường được sử dụng để lưu trữ một ký tự đơn lẻ, ví dụ như "A", "b", "7", hoặc "$"?
A. Integer (Số nguyên).
B. Float (Số thực).
C. Boolean (Logic).
D. Character (Ký tự).
17. Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) dưới dạng văn bản?
A. Một bảng tính Excel.
B. Một bài đăng trên mạng xã hội không có định dạng rõ ràng.
C. Một tệp CSV với các cột được phân tách bằng dấu phẩy.
D. Một cơ sở dữ liệu quan hệ.
18. Khi bạn sao chép và dán một đoạn văn bản từ một trang web sang một trình soạn thảo văn bản đơn giản như Notepad, thông tin định dạng (như in đậm, in nghiêng) thường bị mất đi. Điều này xảy ra vì lý do gì?
A. Trình soạn thảo văn bản không hỗ trợ ký tự đặc biệt.
B. Trình soạn thảo văn bản chỉ hiểu dữ liệu văn bản thô.
C. Trang web đã xóa thông tin định dạng khi sao chép.
D. Máy tính không đủ bộ nhớ để lưu định dạng.
19. Khi nói về "dữ liệu văn bản thô" (plain text data), điều này ám chỉ điều gì?
A. Văn bản đã được định dạng phức tạp với nhiều kiểu chữ.
B. Văn bản chỉ bao gồm các ký tự cơ bản và không có thông tin định dạng đặc biệt.
C. Văn bản được mã hóa để bảo mật.
D. Văn bản đã được dịch sang nhiều ngôn ngữ.
20. Một văn bản có thể được coi là một dãy các ký tự được sắp xếp theo một trật tự nhất định. Điều này phản ánh khái niệm nào của dữ liệu văn bản?
A. Tính chất số học.
B. Tính chất thứ tự.
C. Tính chất hình ảnh.
D. Tính chất âm thanh.
21. Đâu là phát biểu đúng về độ dài của chuỗi ký tự?
A. Độ dài của một chuỗi ký tự luôn là một số chẵn.
B. Độ dài của một chuỗi ký tự là số lượng các ký tự trong chuỗi đó.
C. Độ dài của một chuỗi ký tự là số lượng ký tự không phải khoảng trắng.
D. Độ dài của một chuỗi ký tự luôn bằng 255.
22. Đâu là một ví dụ về dữ liệu văn bản bán cấu trúc (semi-structured text data)?
A. Một tệp tin log của hệ thống với các mục nhập không đồng nhất.
B. Một bài báo khoa học được định dạng chặt chẽ.
C. Một bảng tính Excel chứa dữ liệu số.
D. Một bức thư tay.
23. Trong xử lý văn bản, ký tự tab thường được sử dụng để làm gì?
A. Tạo một dòng trống.
B. Thụt đầu dòng hoặc tạo khoảng cách theo cột.
C. Phân tách các câu trong một đoạn.
D. Kết thúc một đoạn văn.
24. Trong Tin học, ký tự "A" và ký tự "a" có được xem là hai ký tự khác nhau hay không?
A. Có, vì chúng có mã ASCII khác nhau.
B. Không, vì chúng đều là chữ cái.
C. Có, nhưng chỉ trong một số trường hợp nhất định.
D. Không, vì chúng đại diện cho cùng một âm.
25. Trong ngữ cảnh xử lý văn bản, ký tự xuống dòng (newline character) có vai trò gì?
A. Để kết thúc một câu.
B. Để bắt đầu một đoạn mới hoặc xuống dòng.
C. Để phân tách các từ trong câu.
D. Để biểu thị khoảng trắng giữa các ký tự.