Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData) – Đề 8

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Đề 8 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Công cụ trực quan hóa dữ liệu nào sau đây thường được sử dụng để tạo dashboard và báo cáo tương tác từ dữ liệu lớn?

A. Microsoft PowerPoint.
B. Tableau và Power BI.
C. Microsoft Word.
D. Notepad.

2. Phương pháp `Stream processing` (Xử lý luồng dữ liệu) trong Dữ liệu lớn khác biệt với `Batch processing` (Xử lý theo lô) như thế nào?

A. Stream processing xử lý dữ liệu theo lô lớn, còn Batch processing xử lý dữ liệu liên tục theo thời gian thực.
B. Stream processing xử lý dữ liệu liên tục theo thời gian thực, còn Batch processing xử lý dữ liệu theo lô lớn định kỳ.
C. Cả hai phương pháp đều xử lý dữ liệu theo thời gian thực, chỉ khác nhau về công cụ sử dụng.
D. Cả hai phương pháp đều xử lý dữ liệu theo lô, chỉ khác nhau về kích thước lô dữ liệu.

3. Trong mô hình Lambda Architecture cho Dữ liệu lớn, lớp `Speed Layer` (Tầng tốc độ) được sử dụng để làm gì?

A. Lưu trữ dữ liệu lịch sử.
B. Xử lý dữ liệu theo lô lớn.
C. Xử lý dữ liệu mới nhất theo thời gian thực để cung cấp kết quả nhanh chóng.
D. Trực quan hóa dữ liệu.

4. Trong quá trình xử lý Dữ liệu lớn, `Data Cleansing` (Làm sạch dữ liệu) đóng vai trò gì?

A. Tăng tốc độ truy cập dữ liệu.
B. Loại bỏ hoặc sửa chữa dữ liệu lỗi, không nhất quán, hoặc không đầy đủ.
C. Mã hóa dữ liệu để bảo mật.
D. Nén dữ liệu để tiết kiệm dung lượng.

5. Trong ngữ cảnh Dữ liệu lớn, `Data Lake` (Hồ dữ liệu) khác biệt với `Data Warehouse` (Kho dữ liệu) chủ yếu ở điểm nào?

A. Data Lake chỉ lưu trữ dữ liệu đã qua xử lý và làm sạch.
B. Data Warehouse lưu trữ dữ liệu ở định dạng thô, chưa qua xử lý.
C. Data Lake lưu trữ dữ liệu ở định dạng thô, chưa qua xử lý, trong khi Data Warehouse lưu trữ dữ liệu đã được cấu trúc và xử lý.
D. Không có sự khác biệt đáng kể giữa Data Lake và Data Warehouse.

6. Loại cơ sở dữ liệu nào thường được sử dụng trong các ứng dụng Dữ liệu lớn để lưu trữ dữ liệu phi cấu trúc và bán cấu trúc, thay vì cơ sở dữ liệu quan hệ truyền thống?

A. Cơ sở dữ liệu quan hệ (RDBMS) như MySQL, PostgreSQL.
B. Cơ sở dữ liệu NoSQL (ví dụ: MongoDB, Cassandra, HBase).
C. Microsoft Access.
D. Microsoft Excel.

7. Phương pháp `MapReduce` trong Hadoop hoạt động dựa trên nguyên tắc nào?

A. Xử lý dữ liệu tuần tự trên một máy duy nhất.
B. Chia nhỏ bài toán thành các tác vụ nhỏ hơn và thực hiện song song trên nhiều máy.
C. Lưu trữ toàn bộ dữ liệu trên bộ nhớ RAM để tăng tốc độ truy cập.
D. Sử dụng cơ sở dữ liệu quan hệ để quản lý dữ liệu.

8. Trong bối cảnh Dữ liệu lớn, `Metadata` (Siêu dữ liệu) được sử dụng để làm gì?

A. Lưu trữ dữ liệu chính.
B. Mô tả thông tin về dữ liệu, ví dụ như nguồn gốc, định dạng, chất lượng, quyền truy cập, và ý nghĩa của dữ liệu.
C. Mã hóa dữ liệu.
D. Trực quan hóa dữ liệu.

9. Trong bối cảnh Dữ liệu lớn, `Data Scientist` (Nhà khoa học dữ liệu) là người chịu trách nhiệm chính cho công việc nào?

A. Quản lý cơ sở dữ liệu.
B. Xây dựng và triển khai các mô hình phân tích dữ liệu, cũng như tìm kiếm tri thức giá trị từ dữ liệu.
C. Bảo trì phần cứng máy chủ.
D. Viết báo cáo tài chính.

10. Công nghệ `In-memory computing` (Điện toán trong bộ nhớ) trong Dữ liệu lớn giúp cải thiện hiệu suất xử lý dữ liệu bằng cách nào?

A. Nén dữ liệu để giảm dung lượng lưu trữ.
B. Xử lý dữ liệu trực tiếp trong bộ nhớ RAM thay vì ổ cứng.
C. Sử dụng nhiều CPU hơn để tăng tốc độ tính toán.
D. Tối ưu hóa thuật toán phân tích dữ liệu.

11. Đâu là một ví dụ về ứng dụng của Dữ liệu lớn trong lĩnh vực tài chính - ngân hàng?

A. Quản lý kho hàng.
B. Phát hiện giao dịch gian lận và đánh giá rủi ro tín dụng.
C. Dự báo thời tiết.
D. Điều khiển giao thông thông minh.

12. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Dữ liệu lớn?

A. Dự đoán xu hướng thị trường chứng khoán.
B. Tối ưu hóa lộ trình giao hàng cho các công ty logistics.
C. Quản lý danh bạ điện thoại cá nhân.
D. Cá nhân hóa trải nghiệm người dùng trên các nền tảng thương mại điện tử.

13. Loại dữ liệu nào sau đây thường được coi là `dữ liệu phi cấu trúc` trong bối cảnh Dữ liệu lớn?

A. Dữ liệu từ cơ sở dữ liệu quan hệ (SQL)
B. Dữ liệu nhật ký hệ thống (system logs)
C. Dữ liệu giao dịch ngân hàng
D. Dữ liệu cảm biến IoT với định dạng cố định

14. Đặc điểm nào sau đây KHÔNG phải là một trong `5Vs` thường được dùng để mô tả Dữ liệu lớn (Big Data)?

A. Volume (Khối lượng)
B. Velocity (Tốc độ)
C. Veracity (Độ xác thực)
D. Volatility (Tính biến động)

15. Trong kiến trúc Dữ liệu lớn, tầng `Ingestion` (Tiếp nhận) chịu trách nhiệm chính cho công việc nào?

A. Phân tích và trực quan hóa dữ liệu.
B. Lưu trữ dữ liệu đã qua xử lý.
C. Thu thập dữ liệu từ các nguồn khác nhau.
D. Quản lý metadata (dữ liệu về dữ liệu).

16. Thách thức về `skills gap` (khoảng cách kỹ năng) trong lĩnh vực Dữ liệu lớn đề cập đến vấn đề gì?

A. Thiếu hụt phần cứng mạnh mẽ để xử lý dữ liệu lớn.
B. Thiếu hụt các tiêu chuẩn và quy định về quản lý dữ liệu lớn.
C. Thiếu hụt nhân lực có kỹ năng và kiến thức chuyên môn về Dữ liệu lớn (ví dụ: Data Scientists, Data Engineers).
D. Thiếu hụt các công cụ phần mềm phân tích dữ liệu lớn.

17. Rủi ro nào sau đây có thể xảy ra khi sử dụng các thuật toán phân tích Dữ liệu lớn mà không cẩn thận?

A. Dữ liệu trở nên quá lớn để quản lý.
B. Thuật toán có thể tạo ra kết quả thiên vị (biased) hoặc phân biệt đối xử.
C. Chi phí phần cứng tăng cao.
D. Nhân viên trở nên phụ thuộc quá nhiều vào công nghệ.

18. Công nghệ nào sau đây KHÔNG phải là một thành phần phổ biến trong hệ sinh thái Hadoop?

A. HDFS (Hadoop Distributed File System).
B. Spark.
C. MySQL.
D. MapReduce.

19. Thuật ngữ `Data Mining` (Khai phá dữ liệu) trong Dữ liệu lớn chủ yếu đề cập đến quy trình nào?

A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Làm sạch và chuẩn hóa dữ liệu.
C. Phát hiện các mẫu, xu hướng và tri thức ẩn từ lượng lớn dữ liệu.
D. Lưu trữ dữ liệu vào hệ thống cơ sở dữ liệu.

20. Lợi ích chính của việc sử dụng Dữ liệu lớn trong lĩnh vực y tế là gì?

A. Giảm chi phí quảng cáo sản phẩm y tế.
B. Cải thiện chất lượng chẩn đoán và điều trị bệnh nhân.
C. Tăng số lượng bệnh nhân đến khám bệnh.
D. Giảm thời gian chờ đợi tại bệnh viện cho nhân viên y tế.

21. Khi nói về `khả năng mở rộng` (scalability) của hệ thống Dữ liệu lớn, chúng ta thường đề cập đến khả năng gì?

A. Khả năng giảm chi phí vận hành hệ thống.
B. Khả năng xử lý dữ liệu nhanh hơn trên một máy duy nhất.
C. Khả năng hệ thống có thể xử lý lượng dữ liệu tăng lên hoặc số lượng người dùng tăng lên mà vẫn duy trì hiệu suất chấp nhận được.
D. Khả năng hệ thống tự động sao lưu dữ liệu.

22. Trong lĩnh vực marketing, Dữ liệu lớn thường được sử dụng để thực hiện mục tiêu nào sau đây?

A. Giảm số lượng nhân viên marketing.
B. Tăng giá sản phẩm.
C. Cá nhân hóa trải nghiệm khách hàng và tối ưu hóa chiến dịch quảng cáo.
D. Loại bỏ hoàn toàn quảng cáo.

23. Đâu là một ví dụ về `dữ liệu bán cấu trúc` trong Big Data?

A. Bảng dữ liệu trong cơ sở dữ liệu quan hệ.
B. Tệp tin JSON hoặc XML.
C. Hình ảnh JPEG.
D. Bản ghi âm thanh MP3.

24. Thách thức lớn nhất về mặt đạo đức khi sử dụng Dữ liệu lớn là gì?

A. Chi phí lưu trữ dữ liệu quá cao.
B. Nguy cơ xâm phạm quyền riêng tư và bảo mật dữ liệu cá nhân.
C. Khó khăn trong việc tìm kiếm nhân sự có kỹ năng phân tích dữ liệu.
D. Tốc độ xử lý dữ liệu còn chậm.

25. Khái niệm `Data Governance` (Quản trị dữ liệu) trong Dữ liệu lớn đề cập đến vấn đề gì?

A. Tốc độ truyền tải dữ liệu.
B. Chất lượng và tính toàn vẹn của dữ liệu, cũng như các chính sách và quy trình quản lý dữ liệu.
C. Dung lượng lưu trữ dữ liệu.
D. Phần mềm phân tích dữ liệu.

26. Công cụ nào sau đây thường được sử dụng để thực hiện các truy vấn và phân tích dữ liệu trong hệ sinh thái Hadoop?

A. Microsoft Word
B. Hive và Pig
C. Adobe Photoshop
D. Google Chrome

27. Quy trình `ETL` (Extract, Transform, Load) trong Dữ liệu lớn thường được sử dụng để làm gì?

A. Trực quan hóa dữ liệu.
B. Thu thập, biến đổi và tải dữ liệu vào kho lưu trữ để phân tích.
C. Mã hóa dữ liệu để bảo mật.
D. Sao lưu và phục hồi dữ liệu.

28. Ưu điểm chính của việc sử dụng `Cloud Computing` (Điện toán đám mây) cho các dự án Dữ liệu lớn là gì?

A. Giảm nguy cơ mất dữ liệu do thiên tai.
B. Khả năng mở rộng linh hoạt (scalability) và chi phí hiệu quả.
C. Tăng cường bảo mật dữ liệu tuyệt đối.
D. Giảm sự phụ thuộc vào kết nối internet.

29. Khía cạnh `Veracity` (Độ xác thực) trong 5Vs của Dữ liệu lớn nhấn mạnh điều gì?

A. Tốc độ dữ liệu được tạo ra và xử lý.
B. Sự đa dạng của các loại dữ liệu.
C. Độ tin cậy và chất lượng của dữ liệu.
D. Khối lượng dữ liệu.

30. Công nghệ nào sau đây thường được sử dụng để xử lý và phân tích Dữ liệu lớn phân tán trên nhiều máy tính?

A. Microsoft Excel
B. Hadoop và Spark
C. MySQL
D. Phần mềm diệt virus

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

1. Công cụ trực quan hóa dữ liệu nào sau đây thường được sử dụng để tạo dashboard và báo cáo tương tác từ dữ liệu lớn?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

2. Phương pháp 'Stream processing' (Xử lý luồng dữ liệu) trong Dữ liệu lớn khác biệt với 'Batch processing' (Xử lý theo lô) như thế nào?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

3. Trong mô hình Lambda Architecture cho Dữ liệu lớn, lớp 'Speed Layer' (Tầng tốc độ) được sử dụng để làm gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

4. Trong quá trình xử lý Dữ liệu lớn, 'Data Cleansing' (Làm sạch dữ liệu) đóng vai trò gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

5. Trong ngữ cảnh Dữ liệu lớn, 'Data Lake' (Hồ dữ liệu) khác biệt với 'Data Warehouse' (Kho dữ liệu) chủ yếu ở điểm nào?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

6. Loại cơ sở dữ liệu nào thường được sử dụng trong các ứng dụng Dữ liệu lớn để lưu trữ dữ liệu phi cấu trúc và bán cấu trúc, thay vì cơ sở dữ liệu quan hệ truyền thống?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

7. Phương pháp 'MapReduce' trong Hadoop hoạt động dựa trên nguyên tắc nào?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

8. Trong bối cảnh Dữ liệu lớn, 'Metadata' (Siêu dữ liệu) được sử dụng để làm gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

9. Trong bối cảnh Dữ liệu lớn, 'Data Scientist' (Nhà khoa học dữ liệu) là người chịu trách nhiệm chính cho công việc nào?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

10. Công nghệ 'In-memory computing' (Điện toán trong bộ nhớ) trong Dữ liệu lớn giúp cải thiện hiệu suất xử lý dữ liệu bằng cách nào?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

11. Đâu là một ví dụ về ứng dụng của Dữ liệu lớn trong lĩnh vực tài chính - ngân hàng?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

12. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Dữ liệu lớn?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

13. Loại dữ liệu nào sau đây thường được coi là 'dữ liệu phi cấu trúc' trong bối cảnh Dữ liệu lớn?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

14. Đặc điểm nào sau đây KHÔNG phải là một trong '5Vs' thường được dùng để mô tả Dữ liệu lớn (Big Data)?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

15. Trong kiến trúc Dữ liệu lớn, tầng 'Ingestion' (Tiếp nhận) chịu trách nhiệm chính cho công việc nào?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

16. Thách thức về 'skills gap' (khoảng cách kỹ năng) trong lĩnh vực Dữ liệu lớn đề cập đến vấn đề gì?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

17. Rủi ro nào sau đây có thể xảy ra khi sử dụng các thuật toán phân tích Dữ liệu lớn mà không cẩn thận?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

18. Công nghệ nào sau đây KHÔNG phải là một thành phần phổ biến trong hệ sinh thái Hadoop?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

19. Thuật ngữ 'Data Mining' (Khai phá dữ liệu) trong Dữ liệu lớn chủ yếu đề cập đến quy trình nào?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

20. Lợi ích chính của việc sử dụng Dữ liệu lớn trong lĩnh vực y tế là gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

21. Khi nói về 'khả năng mở rộng' (scalability) của hệ thống Dữ liệu lớn, chúng ta thường đề cập đến khả năng gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

22. Trong lĩnh vực marketing, Dữ liệu lớn thường được sử dụng để thực hiện mục tiêu nào sau đây?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

23. Đâu là một ví dụ về 'dữ liệu bán cấu trúc' trong Big Data?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

24. Thách thức lớn nhất về mặt đạo đức khi sử dụng Dữ liệu lớn là gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

25. Khái niệm 'Data Governance' (Quản trị dữ liệu) trong Dữ liệu lớn đề cập đến vấn đề gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

26. Công cụ nào sau đây thường được sử dụng để thực hiện các truy vấn và phân tích dữ liệu trong hệ sinh thái Hadoop?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

27. Quy trình 'ETL' (Extract, Transform, Load) trong Dữ liệu lớn thường được sử dụng để làm gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

28. Ưu điểm chính của việc sử dụng 'Cloud Computing' (Điện toán đám mây) cho các dự án Dữ liệu lớn là gì?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

29. Khía cạnh 'Veracity' (Độ xác thực) trong 5Vs của Dữ liệu lớn nhấn mạnh điều gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 6

30. Công nghệ nào sau đây thường được sử dụng để xử lý và phân tích Dữ liệu lớn phân tán trên nhiều máy tính?