1. Loại biểu đồ nào thường được sử dụng để so sánh sự thay đổi của các phần trong tổng thể theo thời gian?
A. Biểu đồ đường (Line chart)
B. Biểu đồ cột chồng (Stacked bar chart) hoặc biểu đồ vùng chồng (Stacked area chart)
C. Biểu đồ phân tán (Scatter plot)
D. Biểu đồ tròn (Pie chart)
2. Trong ngữ cảnh trực quan hóa dữ liệu tương tác (interactive data visualization), `drill-down` có nghĩa là gì?
A. Thay đổi màu sắc của biểu đồ.
B. Thu phóng (zoom) biểu đồ để xem chi tiết hơn.
C. Khả năng khám phá dữ liệu ở mức độ chi tiết hơn bằng cách nhấp vào một phần của biểu đồ để xem thông tin chi tiết liên quan.
D. Chuyển đổi giữa các loại biểu đồ khác nhau.
3. Công cụ nào sau đây KHÔNG phải là một công cụ trực quan hóa dữ liệu phổ biến?
A. Tableau
B. Microsoft PowerPoint
C. Power BI
D. Python (với thư viện Matplotlib)
4. Loại biểu đồ nào thường được dùng để thể hiện sự phân bố tần suất của một biến số liên tục?
A. Biểu đồ đường (Line chart)
B. Biểu đồ cột (Bar chart)
C. Biểu đồ Histogram
D. Biểu đồ tròn (Pie chart)
5. Yếu tố nào sau đây KHÔNG phải là một thành phần cơ bản của một biểu đồ trực quan hóa dữ liệu tốt?
A. Tiêu đề rõ ràng và mô tả.
B. Chú thích trục (axis labels) và đơn vị đo lường.
C. Nguồn dữ liệu được trích dẫn.
D. Hiệu ứng hoạt hình 3D phức tạp và không cần thiết.
6. Công cụ trực quan hóa dữ liệu nào thường được sử dụng để tạo ra các `infographic`?
A. Microsoft Excel
B. Adobe Illustrator hoặc Canva
C. SQL
D. Command Prompt
7. Công cụ trực quan hóa dữ liệu nào thường được sử dụng cho việc phân tích dữ liệu không gian địa lý (geospatial data)?
A. Biểu đồ tròn (Pie chart)
B. Bản đồ nhiệt (Heat map) và bản đồ choropleth
C. Biểu đồ hộp (Box plot)
D. Biểu đồ bong bóng (Bubble chart)
8. Khi nào thì biểu đồ hộp (box plot) là một lựa chọn tốt để trực quan hóa dữ liệu?
A. Khi muốn so sánh giá trị trung bình giữa các nhóm.
B. Khi muốn thể hiện xu hướng theo thời gian.
C. Khi muốn so sánh sự phân bố và phát hiện giá trị ngoại lai (outliers) trong các tập dữ liệu khác nhau.
D. Khi muốn thể hiện tỷ lệ phần trăm của các phần so với tổng thể.
9. Khái niệm `data storytelling` trong trực quan hóa dữ liệu đề cập đến:
A. Việc tạo ra các biểu đồ phức tạp và chi tiết.
B. Việc sử dụng trực quan hóa dữ liệu để kể một câu chuyện mạch lạc và hấp dẫn, hướng dẫn người xem khám phá dữ liệu và rút ra kết luận.
C. Việc mã hóa dữ liệu thành các ký tự hình ảnh.
D. Việc tự động tạo ra các báo cáo dữ liệu.
10. Lỗi phổ biến nào trong trực quan hóa dữ liệu có thể dẫn đến việc người xem hiểu sai thông tin?
A. Sử dụng quá nhiều màu sắc khác nhau.
B. Chú thích đầy đủ các trục và tiêu đề biểu đồ.
C. Sử dụng trục tung (Y-axis) không bắt đầu từ 0 khi so sánh giá trị bằng biểu đồ cột.
D. Chọn loại biểu đồ phù hợp với loại dữ liệu.
11. Trong trực quan hóa dữ liệu, `Gestalt principles` (Nguyên tắc Gestalt) được áp dụng để làm gì?
A. Tăng độ phức tạp của biểu đồ.
B. Giảm số lượng màu sắc sử dụng.
C. Tận dụng cách bộ não con người nhận thức hình ảnh để thiết kế biểu đồ dễ hiểu và trực quan hơn.
D. Mã hóa dữ liệu bằng các ký tự đặc biệt.
12. Nguyên tắc `Less is more` trong trực quan hóa dữ liệu nhấn mạnh điều gì?
A. Sử dụng càng ít màu sắc càng tốt.
B. Sử dụng càng nhiều yếu tố trang trí càng tốt để biểu đồ hấp dẫn.
C. Tập trung vào việc truyền tải thông tin một cách rõ ràng và hiệu quả, loại bỏ các yếu tố không cần thiết gây rối mắt.
D. Sử dụng ít dữ liệu nhất có thể để tạo ra biểu đồ đơn giản.
13. Ưu điểm của việc sử dụng công cụ trực tuyến (online) để tạo trực quan hóa dữ liệu so với công cụ ngoại tuyến (offline) là gì?
A. Công cụ trực tuyến luôn có nhiều tính năng hơn công cụ ngoại tuyến.
B. Công cụ trực tuyến thường dễ dàng chia sẻ và cộng tác hơn, có thể truy cập từ nhiều thiết bị mà không cần cài đặt.
C. Công cụ ngoại tuyến luôn an toàn hơn công cụ trực tuyến.
D. Công cụ ngoại tuyến luôn nhanh hơn công cụ trực tuyến.
14. Loại biểu đồ nào sau đây KHÔNG phù hợp để so sánh nhiều chuỗi dữ liệu theo thời gian trên cùng một biểu đồ?
A. Biểu đồ đường (Line chart)
B. Biểu đồ cột chồng (Stacked bar chart)
C. Biểu đồ vùng (Area chart)
D. Biểu đồ bong bóng (Bubble chart)
15. Ưu điểm chính của việc sử dụng trực quan hóa dữ liệu là gì?
A. Tăng độ phức tạp của dữ liệu.
B. Giảm khả năng lưu trữ dữ liệu.
C. Giúp nhận diện xu hướng, mẫu hình và thông tin chi tiết từ dữ liệu một cách nhanh chóng và hiệu quả hơn.
D. Hạn chế khả năng chia sẻ dữ liệu với người khác.
16. Khi thiết kế bảng màu (color palette) cho trực quan hóa dữ liệu, điều quan trọng cần xem xét là:
A. Sử dụng càng nhiều màu sắc tươi sáng càng tốt để biểu đồ nổi bật.
B. Đảm bảo bảng màu dễ phân biệt, phù hợp với loại dữ liệu (ví dụ, bảng màu tuần tự cho dữ liệu thứ tự, bảng màu phân kỳ cho dữ liệu có điểm trung tâm), và có tính đến khả năng tiếp cận (ví dụ, cho người mù màu).
C. Chọn bảng màu ngẫu nhiên từ các tùy chọn có sẵn.
D. Chỉ sử dụng màu đen và trắng để đảm bảo tính chuyên nghiệp.
17. Loại biểu đồ nào sau đây phù hợp nhất để so sánh giá trị giữa các danh mục khác nhau?
A. Biểu đồ đường (Line chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ cột (Bar chart)
D. Biểu đồ phân tán (Scatter plot)
18. Biểu đồ tròn (Pie chart) thích hợp nhất để trực quan hóa loại dữ liệu nào?
A. Xu hướng thay đổi của một biến số theo thời gian.
B. Mối tương quan giữa hai biến số.
C. Tỷ lệ phần trăm của các phần so với tổng thể.
D. Sự phân bố tần suất của một biến số liên tục.
19. Khi trình bày trực quan hóa dữ liệu cho đối tượng KHÔNG chuyên môn, điều gì là quan trọng nhất?
A. Sử dụng các biểu đồ phức tạp và chi tiết để thể hiện sự chuyên nghiệp.
B. Tập trung vào việc sử dụng thuật ngữ chuyên ngành và kỹ thuật cao.
C. Đảm bảo biểu đồ đơn giản, dễ hiểu, tập trung vào thông điệp chính, và sử dụng ngôn ngữ giải thích dễ tiếp cận.
D. Sử dụng càng nhiều dữ liệu càng tốt để chứng minh tính chính xác.
20. Trong quá trình trực quan hóa dữ liệu, bước nào sau đây thường được thực hiện ĐẦU TIÊN?
A. Chọn loại biểu đồ phù hợp.
B. Xác định thông điệp muốn truyền tải và đối tượng mục tiêu.
C. Làm sạch và tiền xử lý dữ liệu.
D. Thiết kế bố cục và màu sắc cho biểu đồ.
21. Trong trực quan hóa dữ liệu, `choropleth map` thường được sử dụng để hiển thị điều gì?
A. Mối quan hệ giữa hai biến số trên bản đồ.
B. Sự phân bố tần suất của dữ liệu trên bản đồ.
C. Giá trị trung bình của dữ liệu tại các điểm trên bản đồ.
D. Giá trị tổng hợp của một biến số cho các khu vực địa lý khác nhau, thường sử dụng màu sắc để mã hóa giá trị.
22. Trong ngữ cảnh trực quan hóa dữ liệu, `data wrangling` (xử lý dữ liệu) đóng vai trò gì?
A. Chọn loại biểu đồ phù hợp nhất.
B. Thiết kế giao diện người dùng cho công cụ trực quan hóa.
C. Quá trình làm sạch, chuyển đổi và định hình dữ liệu thô để chuẩn bị cho việc trực quan hóa và phân tích.
D. Đánh giá hiệu quả của biểu đồ sau khi tạo ra.
23. Khi nào thì việc sử dụng biểu đồ 3D trong trực quan hóa dữ liệu KHÔNG được khuyến khích?
A. Khi muốn tạo ấn tượng mạnh mẽ và thu hút sự chú ý.
B. Khi muốn biểu diễn dữ liệu có nhiều chiều.
C. Khi muốn đảm bảo tính chính xác và dễ đọc của dữ liệu.
D. Khi muốn thể hiện dữ liệu không gian địa lý.
24. Loại công cụ trực quan hóa dữ liệu nào thường được sử dụng trong lĩnh vực khoa học dữ liệu và phân tích thống kê, đặc biệt là trong ngôn ngữ lập trình R và Python?
A. Microsoft Excel
B. Tableau Desktop
C. Các thư viện trực quan hóa như Matplotlib, Seaborn (Python) và ggplot2 (R).
D. Microsoft PowerPoint
25. Công cụ trực quan hóa dữ liệu (Data Visualization Tool) được định nghĩa chính xác nhất là:
A. Phần mềm chỉ dùng để lưu trữ dữ liệu số lượng lớn.
B. Phần mềm chuyển đổi dữ liệu thành định dạng văn bản dễ đọc.
C. Phần mềm sử dụng đồ họa để biểu diễn dữ liệu, giúp con người dễ dàng hiểu và phân tích thông tin.
D. Phần mềm mã hóa dữ liệu thành các ký tự đặc biệt để bảo mật thông tin.
26. Trong trực quan hóa dữ liệu, `dashboard` thường được dùng để:
A. Tạo ra các báo cáo chi tiết dạng văn bản.
B. Tổng hợp và hiển thị trực quan hóa dữ liệu từ nhiều nguồn khác nhau trên một giao diện duy nhất.
C. Phân tích thống kê chuyên sâu cho dữ liệu lớn.
D. Chỉnh sửa và làm sạch dữ liệu thô.
27. Trong trực quan hóa dữ liệu, `tooltip` thường có chức năng gì?
A. Thay đổi màu sắc của biểu đồ.
B. Ẩn hoặc hiện toàn bộ biểu đồ.
C. Hiển thị thông tin chi tiết hơn về một điểm dữ liệu cụ thể khi người dùng tương tác (ví dụ: di chuột qua).
D. Thay đổi loại biểu đồ đang hiển thị.
28. Loại biểu đồ nào phù hợp để thể hiện mối quan hệ giữa hai biến số và xác định các cụm dữ liệu?
A. Biểu đồ đường (Line chart)
B. Biểu đồ cột (Bar chart)
C. Biểu đồ phân tán (Scatter plot)
D. Biểu đồ vùng (Area chart)
29. Trong trực quan hóa dữ liệu, `data-ink ratio` (tỷ lệ mực dữ liệu) là gì và tại sao nó quan trọng?
A. Tỷ lệ giữa lượng mực in màu và mực in đen trắng trong biểu đồ. Quan trọng để tiết kiệm chi phí in ấn.
B. Tỷ lệ giữa lượng `mực` (pixel, nét vẽ) dùng để biểu diễn dữ liệu thực tế so với tổng lượng `mực` sử dụng trong toàn bộ biểu đồ. Quan trọng để tối ưu hóa sự rõ ràng và hiệu quả truyền tải thông tin, giảm yếu tố gây rối.
C. Tỷ lệ giữa kích thước biểu đồ và lượng dữ liệu được hiển thị. Quan trọng để đảm bảo biểu đồ không quá nhỏ hoặc quá lớn.
D. Tỷ lệ giữa thời gian tạo biểu đồ và thời gian phân tích dữ liệu. Quan trọng để đánh giá hiệu quả công việc.
30. Trong trực quan hóa dữ liệu, `annotation` (chú thích) được sử dụng để làm gì?
A. Thay đổi màu sắc của biểu đồ.
B. Ẩn hoặc hiện dữ liệu.
C. Thêm văn bản, mũi tên, hoặc hình dạng để giải thích, làm nổi bật hoặc cung cấp ngữ cảnh cho các phần cụ thể của biểu đồ.
D. Thay đổi loại biểu đồ.