Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData) – Đề 7

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Đề 7 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Ngoài 3Vs cơ bản (Volume, Velocity, Variety), yếu tố `Veracity` (Độ tin cậy) trong Big Data đề cập đến điều gì?

A. Tốc độ truy cập dữ liệu.
B. Độ chính xác và đáng tin cậy của dữ liệu.
C. Sự đa dạng của nguồn dữ liệu.
D. Khả năng lưu trữ dữ liệu lớn.

2. Vai trò của `Data Scientist` (Nhà khoa học dữ liệu) trong dự án Big Data là gì?

A. Quản lý cơ sở hạ tầng phần cứng Big Data.
B. Phát triển ứng dụng web.
C. Thu thập, phân tích, diễn giải dữ liệu và đưa ra các insight có giá trị.
D. Thiết kế giao diện người dùng.

3. Khái niệm `Data Governance` (Quản trị dữ liệu) trong Big Data nhằm mục đích gì?

A. Tăng tốc độ truy cập dữ liệu.
B. Đảm bảo chất lượng, tính nhất quán, bảo mật và tuân thủ quy định của dữ liệu.
C. Giảm kích thước dữ liệu Big Data.
D. Tối ưu hóa chi phí hạ tầng Big Data.

4. Đâu là một thách thức về đạo đức khi sử dụng Big Data?

A. Sự phức tạp của công nghệ.
B. Khả năng dữ liệu bị sử dụng sai mục đích hoặc xâm phạm quyền riêng tư.
C. Chi phí đầu tư ban đầu cao.
D. Sự thiếu hụt nhân lực có kỹ năng.

5. Lĩnh vực nào sau đây ít có khả năng ứng dụng Big Data nhất?

A. Sản xuất công nghiệp.
B. Nông nghiệp thông minh.
C. Nghiên cứu lịch sử cổ đại.
D. Giao thông vận tải thông minh.

6. Hạn chế lớn nhất của công nghệ Big Data hiện nay là gì?

A. Chi phí phần cứng quá thấp.
B. Khả năng xử lý dữ liệu quá chậm.
C. Vấn đề về quyền riêng tư, bảo mật và đạo đức sử dụng dữ liệu.
D. Sự thiếu hụt dữ liệu.

7. Khái niệm `Data Mining` (Khai phá dữ liệu) liên quan đến Big Data như thế nào?

A. Data Mining là một công cụ thay thế Big Data.
B. Data Mining là quá trình làm sạch dữ liệu trước khi đưa vào hệ thống Big Data.
C. Data Mining là kỹ thuật được sử dụng để khám phá ra các mẫu, xu hướng và tri thức ẩn sâu trong dữ liệu lớn.
D. Data Mining chỉ áp dụng cho dữ liệu có kích thước nhỏ.

8. Thách thức lớn nhất khi làm việc với Big Data là gì?

A. Sự thiếu hụt phần cứng máy tính mạnh mẽ.
B. Chi phí lưu trữ dữ liệu thấp.
C. Sự phức tạp trong việc quản lý, xử lý và phân tích dữ liệu lớn và đa dạng.
D. Sự thiếu hụt các công cụ trực quan hóa dữ liệu.

9. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Big Data?

A. Phân tích dự đoán trong bán lẻ để tối ưu hóa hàng tồn kho.
B. Chẩn đoán bệnh dựa trên hình ảnh y tế.
C. Soạn thảo văn bản thông thường bằng Microsoft Word.
D. Phân tích hành vi người dùng trên mạng xã hội để cải thiện quảng cáo.

10. Công nghệ nào sau đây KHÔNG phải là một phần của hệ sinh thái Hadoop?

A. HDFS (Hadoop Distributed File System).
B. YARN (Yet Another Resource Negotiator).
C. Spark.
D. SQL Server.

11. Trong kiến trúc Big Data, ETL (Extract, Transform, Load) thường được thay thế bằng quy trình nào linh hoạt hơn?

A. OLAP (Online Analytical Processing)
B. ELT (Extract, Load, Transform)
C. CRUD (Create, Read, Update, Delete)
D. API (Application Programming Interface)

12. Khi nào nên sử dụng Big Data thay vì các phương pháp xử lý dữ liệu truyền thống?

A. Khi dữ liệu có kích thước nhỏ và cấu trúc đơn giản.
B. Khi cần xử lý dữ liệu với khối lượng lớn, tốc độ cao và đa dạng mà hệ thống truyền thống không đáp ứng được.
C. Khi chỉ cần thực hiện các báo cáo đơn giản.
D. Khi chi phí đầu tư cho Big Data thấp hơn.

13. `Real-time processing` (Xử lý thời gian thực) trong Big Data có nghĩa là gì?

A. Xử lý dữ liệu với độ trễ lớn.
B. Xử lý dữ liệu sau khi đã lưu trữ trong một thời gian dài.
C. Xử lý dữ liệu ngay khi dữ liệu được tạo ra hoặc gần như tức thì.
D. Xử lý dữ liệu theo lô (batch).

14. Thuật ngữ `Data wrangling` (Chuẩn bị dữ liệu) trong Big Data bao gồm những công việc nào?

A. Chỉ thu thập dữ liệu.
B. Làm sạch, chuyển đổi, và định dạng dữ liệu để sẵn sàng cho phân tích.
C. Phân tích dữ liệu.
D. Trực quan hóa dữ liệu.

15. Loại hình trực quan hóa dữ liệu nào phù hợp nhất để thể hiện mối quan hệ giữa nhiều biến số trong Big Data?

A. Biểu đồ đường (Line chart).
B. Biểu đồ tròn (Pie chart).
C. Biểu đồ phân tán (Scatter plot) hoặc ma trận tương quan (Correlation matrix).
D. Biểu đồ cột (Bar chart).

16. Yếu tố `Velocity` (Tốc độ) trong Big Data ám chỉ điều gì?

A. Tốc độ xử lý dữ liệu của máy tính.
B. Tốc độ tăng trưởng của kích thước dữ liệu theo thời gian.
C. Tốc độ tạo ra và xử lý dữ liệu theo thời gian thực hoặc gần thời gian thực.
D. Tốc độ truyền dữ liệu qua mạng.

17. Data Lake (Hồ dữ liệu) khác biệt với Data Warehouse (Kho dữ liệu) như thế nào?

A. Data Lake chỉ lưu trữ dữ liệu có cấu trúc, còn Data Warehouse lưu trữ mọi loại dữ liệu.
B. Data Lake lưu trữ dữ liệu ở dạng thô, chưa qua xử lý, còn Data Warehouse lưu trữ dữ liệu đã được làm sạch và chuyển đổi.
C. Data Lake được thiết kế cho truy vấn báo cáo, còn Data Warehouse cho khám phá dữ liệu.
D. Data Lake có chi phí lưu trữ cao hơn Data Warehouse.

18. Trong lĩnh vực tài chính ngân hàng, Big Data được sử dụng để làm gì?

A. Tăng lãi suất cho vay.
B. Phát hiện gian lận, đánh giá rủi ro tín dụng và cá nhân hóa dịch vụ khách hàng.
C. Giảm số lượng chi nhánh ngân hàng.
D. Tăng phí giao dịch.

19. Trong bảo mật Big Data, điều gì cần được ưu tiên hàng đầu?

A. Tăng tốc độ xử lý dữ liệu.
B. Đảm bảo tính toàn vẹn, bảo mật và quyền riêng tư của dữ liệu.
C. Giảm chi phí lưu trữ dữ liệu.
D. Tăng cường khả năng mở rộng hệ thống.

20. Hadoop là gì trong bối cảnh Big Data?

A. Một loại ngôn ngữ lập trình để phân tích dữ liệu.
B. Một hệ thống quản lý cơ sở dữ liệu quan hệ.
C. Một framework phần mềm mã nguồn mở để lưu trữ và xử lý dữ liệu lớn phân tán.
D. Một công cụ trực quan hóa dữ liệu.

21. Thuật ngữ `Big Data` đề cập đến điều gì?

A. Dữ liệu có kích thước nhỏ và dễ quản lý.
B. Dữ liệu có cấu trúc rõ ràng và dễ dàng phân tích.
C. Dữ liệu có khối lượng lớn, tốc độ cao và đa dạng, vượt quá khả năng xử lý của các hệ thống truyền thống.
D. Dữ liệu chỉ được tạo ra từ các thiết bị di động.

22. Machine Learning (Học máy) đóng vai trò gì trong phân tích Big Data?

A. Machine Learning làm giảm kích thước dữ liệu Big Data.
B. Machine Learning giúp tự động hóa quá trình phân tích và dự đoán trên Big Data.
C. Machine Learning thay thế hoàn toàn con người trong việc phân tích Big Data.
D. Machine Learning chỉ được sử dụng để trực quan hóa dữ liệu Big Data.

23. Công cụ nào sau đây thường được sử dụng cho trực quan hóa dữ liệu Big Data?

A. Microsoft Excel.
B. Tableau hoặc Power BI.
C. Microsoft Word.
D. Paint.

24. Ưu điểm chính của việc sử dụng điện toán đám mây (Cloud Computing) cho Big Data là gì?

A. Giảm tốc độ xử lý dữ liệu.
B. Khả năng mở rộng linh hoạt, chi phí hiệu quả và dễ dàng truy cập.
C. Tăng độ phức tạp trong quản lý dữ liệu.
D. Giảm tính bảo mật của dữ liệu.

25. Công nghệ NoSQL thường được sử dụng trong Big Data để làm gì?

A. Thay thế hoàn toàn cơ sở dữ liệu quan hệ (SQL).
B. Quản lý dữ liệu có cấu trúc phức tạp.
C. Xử lý dữ liệu giao dịch có tính ACID (Atomicity, Consistency, Isolation, Durability).
D. Lưu trữ và truy vấn dữ liệu phi cấu trúc hoặc bán cấu trúc với khả năng mở rộng cao.

26. Spark khác biệt với Hadoop MapReduce chủ yếu ở điểm nào?

A. Spark chỉ có thể xử lý dữ liệu có cấu trúc.
B. Spark nhanh hơn Hadoop MapReduce vì xử lý dữ liệu trong bộ nhớ (in-memory).
C. Hadoop MapReduce hỗ trợ nhiều ngôn ngữ lập trình hơn Spark.
D. Hadoop MapReduce có khả năng xử lý dữ liệu theo thời gian thực tốt hơn Spark.

27. Thuật ngữ `Variety` (Đa dạng) trong Big Data bao gồm những loại dữ liệu nào?

A. Chỉ dữ liệu dạng văn bản và số.
B. Chỉ dữ liệu có cấu trúc.
C. Dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc.
D. Chỉ dữ liệu từ mạng xã hội.

28. Ứng dụng Big Data trong lĩnh vực y tế có thể giúp cải thiện điều gì?

A. Tăng giá thuốc.
B. Giảm thời gian chờ đợi của bệnh nhân.
C. Cá nhân hóa phương pháp điều trị và dự đoán dịch bệnh.
D. Giảm số lượng bác sĩ cần thiết.

29. Đâu là `V` đầu tiên và cơ bản nhất trong 3Vs của Big Data?

A. Velocity (Tốc độ)
B. Variety (Đa dạng)
C. Volume (Khối lượng)
D. Veracity (Độ tin cậy)

30. Trong kiến trúc Big Data, tầng `Data Ingestion` (Thu nhận dữ liệu) có chức năng gì?

A. Phân tích dữ liệu.
B. Lưu trữ dữ liệu đã qua xử lý.
C. Thu thập dữ liệu từ nhiều nguồn khác nhau.
D. Trực quan hóa dữ liệu.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

1. Ngoài 3Vs cơ bản (Volume, Velocity, Variety), yếu tố 'Veracity' (Độ tin cậy) trong Big Data đề cập đến điều gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

2. Vai trò của 'Data Scientist' (Nhà khoa học dữ liệu) trong dự án Big Data là gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

3. Khái niệm 'Data Governance' (Quản trị dữ liệu) trong Big Data nhằm mục đích gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

4. Đâu là một thách thức về đạo đức khi sử dụng Big Data?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

5. Lĩnh vực nào sau đây ít có khả năng ứng dụng Big Data nhất?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

6. Hạn chế lớn nhất của công nghệ Big Data hiện nay là gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

7. Khái niệm 'Data Mining' (Khai phá dữ liệu) liên quan đến Big Data như thế nào?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

8. Thách thức lớn nhất khi làm việc với Big Data là gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

9. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Big Data?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

10. Công nghệ nào sau đây KHÔNG phải là một phần của hệ sinh thái Hadoop?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

11. Trong kiến trúc Big Data, ETL (Extract, Transform, Load) thường được thay thế bằng quy trình nào linh hoạt hơn?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

12. Khi nào nên sử dụng Big Data thay vì các phương pháp xử lý dữ liệu truyền thống?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

13. 'Real-time processing' (Xử lý thời gian thực) trong Big Data có nghĩa là gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

14. Thuật ngữ 'Data wrangling' (Chuẩn bị dữ liệu) trong Big Data bao gồm những công việc nào?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

15. Loại hình trực quan hóa dữ liệu nào phù hợp nhất để thể hiện mối quan hệ giữa nhiều biến số trong Big Data?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

16. Yếu tố 'Velocity' (Tốc độ) trong Big Data ám chỉ điều gì?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

17. Data Lake (Hồ dữ liệu) khác biệt với Data Warehouse (Kho dữ liệu) như thế nào?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

18. Trong lĩnh vực tài chính ngân hàng, Big Data được sử dụng để làm gì?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

19. Trong bảo mật Big Data, điều gì cần được ưu tiên hàng đầu?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

20. Hadoop là gì trong bối cảnh Big Data?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

21. Thuật ngữ 'Big Data' đề cập đến điều gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

22. Machine Learning (Học máy) đóng vai trò gì trong phân tích Big Data?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

23. Công cụ nào sau đây thường được sử dụng cho trực quan hóa dữ liệu Big Data?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

24. Ưu điểm chính của việc sử dụng điện toán đám mây (Cloud Computing) cho Big Data là gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

25. Công nghệ NoSQL thường được sử dụng trong Big Data để làm gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

26. Spark khác biệt với Hadoop MapReduce chủ yếu ở điểm nào?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

27. Thuật ngữ 'Variety' (Đa dạng) trong Big Data bao gồm những loại dữ liệu nào?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

28. Ứng dụng Big Data trong lĩnh vực y tế có thể giúp cải thiện điều gì?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

29. Đâu là 'V' đầu tiên và cơ bản nhất trong 3Vs của Big Data?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 8

30. Trong kiến trúc Big Data, tầng 'Data Ingestion' (Thu nhận dữ liệu) có chức năng gì?