Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData) – Đề 3

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Đề 3 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Trong ngữ cảnh Dữ liệu lớn, `real-time analytics` (phân tích thời gian thực) có nghĩa là gì?

A. Phân tích dữ liệu lịch sử đã được thu thập từ lâu.
B. Phân tích dữ liệu ngay khi nó được tạo ra, gần như tức thì.
C. Phân tích dữ liệu theo lô định kỳ (ví dụ: hàng ngày, hàng tuần).
D. Phân tích dữ liệu trên các thiết bị di động.

2. Thuật ngữ `Data Governance` (Quản trị dữ liệu) trong Dữ liệu lớn liên quan đến vấn đề gì?

A. Công nghệ lưu trữ dữ liệu hiệu quả
B. Quy trình và chính sách quản lý, bảo mật, chất lượng và sử dụng dữ liệu
C. Phần mềm khai phá dữ liệu tiên tiến
D. Phương pháp trực quan hóa dữ liệu hấp dẫn

3. Một trong những thách thức chính về kỹ năng trong lĩnh vực Dữ liệu lớn hiện nay là gì?

A. Thiếu hụt các công cụ lưu trữ dữ liệu hiệu quả.
B. Thiếu hụt nhân lực có kỹ năng chuyên môn về phân tích dữ liệu, khoa học dữ liệu và các công nghệ Dữ liệu lớn.
C. Chi phí đầu tư vào công nghệ Dữ liệu lớn quá cao.
D. Khó khăn trong việc thu thập dữ liệu từ các nguồn khác nhau.

4. Lợi ích chính của việc sử dụng Dữ liệu lớn trong lĩnh vực y tế là gì?

A. Giảm chi phí sản xuất thuốc
B. Cá nhân hóa phương pháp điều trị và cải thiện kết quả bệnh nhân
C. Tăng số lượng bác sĩ và y tá
D. Xây dựng bệnh viện thông minh hơn

5. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn, giúp người dùng dễ dàng hiểu và phân tích thông tin?

A. Microsoft Word
B. Tableau
C. Microsoft PowerPoint
D. Notepad

6. Công nghệ nào sau đây thường được sử dụng để xử lý Dữ liệu lớn phân tán trên nhiều máy tính?

A. Microsoft Excel
B. Hadoop
C. MySQL
D. Adobe Photoshop

7. Khái niệm `data wrangling` (chuẩn bị dữ liệu) trong Dữ liệu lớn bao gồm các công việc chính nào?

A. Phân tích và trực quan hóa dữ liệu.
B. Thu thập, làm sạch, chuyển đổi và định dạng dữ liệu để chuẩn bị cho phân tích.
C. Bảo mật và quản lý quyền truy cập dữ liệu.
D. Triển khai hệ thống lưu trữ dữ liệu phân tán.

8. Trong Dữ liệu lớn, `machine learning` (học máy) thường được sử dụng để làm gì?

A. Lưu trữ và quản lý dữ liệu hiệu quả hơn.
B. Tự động hóa quá trình phân tích, dự đoán và đưa ra quyết định dựa trên dữ liệu.
C. Trực quan hóa dữ liệu một cách đẹp mắt.
D. Đảm bảo tính bảo mật tuyệt đối cho dữ liệu.

9. Đặc điểm nào sau đây KHÔNG phải là một trong `5Vs` thường được dùng để mô tả Dữ liệu lớn (Big Data)?

A. Volume (Khối lượng)
B. Velocity (Tốc độ)
C. Variety (Đa dạng)
D. Validity (Tính hợp lệ)

10. Khái niệm `Value` (Giá trị) trong `5Vs` của Dữ liệu lớn nhấn mạnh điều gì?

A. Số lượng dữ liệu khổng lồ cần được xử lý
B. Tốc độ dữ liệu được tạo ra
C. Giá trị kinh doanh và thông tin chi tiết có thể thu được từ dữ liệu
D. Sự đa dạng của các nguồn dữ liệu

11. Yếu tố `Velocity` (Tốc độ) trong Dữ liệu lớn đề cập đến khía cạnh nào?

A. Số lượng dữ liệu được tạo ra và lưu trữ
B. Sự đa dạng của các loại dữ liệu
C. Tốc độ dữ liệu được tạo ra và cần được xử lý
D. Tính chính xác và đáng tin cậy của dữ liệu

12. Loại dữ liệu nào sau đây KHÔNG được xem là `phi cấu trúc` trong bối cảnh Dữ liệu lớn?

A. Văn bản (ví dụ: email, bài đăng trên mạng xã hội)
B. Hình ảnh và video
C. Dữ liệu từ cảm biến IoT
D. Dữ liệu trong bảng cơ sở dữ liệu quan hệ

13. Thách thức về `Veracity` (Tính xác thực) trong Dữ liệu lớn có thể ảnh hưởng tiêu cực đến điều gì?

A. Tốc độ xử lý dữ liệu.
B. Chất lượng của các quyết định và phân tích dựa trên dữ liệu.
C. Khả năng lưu trữ dữ liệu.
D. Chi phí đầu tư vào công nghệ Dữ liệu lớn.

14. Công nghệ nào sau đây KHÔNG phải là một thành phần phổ biến trong hệ sinh thái Hadoop?

A. HDFS (Hadoop Distributed File System)
B. Spark
C. Hive
D. SQL Server

15. Trong bối cảnh IoT (Internet of Things), Dữ liệu lớn đóng vai trò quan trọng như thế nào?

A. Giảm chi phí sản xuất thiết bị IoT.
B. Xử lý và phân tích lượng lớn dữ liệu được tạo ra từ các thiết bị IoT để đưa ra quyết định và hành động thông minh.
C. Tăng tuổi thọ pin cho các thiết bị IoT.
D. Cải thiện khả năng kết nối mạng cho các thiết bị IoT.

16. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Dữ liệu lớn?

A. Phân tích hành vi khách hàng trong thương mại điện tử
B. Dự báo thời tiết
C. Soạn thảo văn bản trên Microsoft Word
D. Phát hiện gian lận trong giao dịch tài chính

17. Ứng dụng nào sau đây thể hiện rõ nhất giá trị của Dữ liệu lớn trong lĩnh vực `thành phố thông minh`?

A. Sử dụng mạng xã hội để quảng bá du lịch thành phố.
B. Phân tích dữ liệu giao thông để tối ưu hóa luồng giao thông, giảm ùn tắc và cải thiện giao thông công cộng.
C. Xây dựng ứng dụng di động để người dân tra cứu thông tin thời tiết.
D. Sử dụng máy tính cá nhân để quản lý hệ thống chiếu sáng công cộng.

18. Ưu điểm chính của việc sử dụng `cloud computing` (điện toán đám mây) cho Dữ liệu lớn là gì?

A. Giảm thiểu rủi ro mất dữ liệu.
B. Khả năng mở rộng linh hoạt theo nhu cầu và giảm chi phí đầu tư ban đầu vào hạ tầng.
C. Tăng cường bảo mật dữ liệu tuyệt đối.
D. Tốc độ xử lý dữ liệu luôn nhanh nhất.

19. Loại cơ sở dữ liệu nào thường được sử dụng cho Dữ liệu lớn vì khả năng mở rộng linh hoạt và xử lý dữ liệu phi cấu trúc?

A. Cơ sở dữ liệu quan hệ (RDBMS)
B. Cơ sở dữ liệu NoSQL
C. Cơ sở dữ liệu hướng đối tượng
D. Cơ sở dữ liệu phân cấp

20. Công cụ nào sau đây thường được sử dụng để thực hiện truy vấn và phân tích dữ liệu trong Hadoop?

A. Microsoft Access
B. Hive
C. Microsoft PowerPoint
D. Paint

21. Mô hình lập trình `MapReduce` trong Hadoop hoạt động dựa trên nguyên tắc nào?

A. Xử lý dữ liệu tuần tự trên một máy tính duy nhất.
B. Chia nhỏ bài toán thành các tác vụ nhỏ hơn, thực hiện song song trên nhiều máy tính, sau đó tổng hợp kết quả.
C. Lưu trữ toàn bộ dữ liệu trong bộ nhớ RAM để xử lý nhanh hơn.
D. Sử dụng cơ sở dữ liệu quan hệ để quản lý dữ liệu.

22. Trong kiến trúc Dữ liệu lớn, `Data Lake` (Hồ dữ liệu) khác biệt so với `Data Warehouse` (Kho dữ liệu) chủ yếu ở điểm nào?

A. Data Lake lưu trữ dữ liệu đã qua xử lý và làm sạch, Data Warehouse lưu trữ dữ liệu thô.
B. Data Lake lưu trữ dữ liệu cấu trúc, Data Warehouse lưu trữ dữ liệu phi cấu trúc.
C. Data Lake lưu trữ dữ liệu thô ở định dạng gốc, Data Warehouse lưu trữ dữ liệu đã được chuyển đổi và cấu trúc hóa.
D. Data Lake có tốc độ truy vấn nhanh hơn Data Warehouse.

23. Vấn đề về `quyền riêng tư dữ liệu` trở nên đặc biệt quan trọng trong bối cảnh Dữ liệu lớn vì lý do gì?

A. Dữ liệu lớn thường được lưu trữ trên các thiết bị cá nhân.
B. Dữ liệu lớn thường chứa thông tin cá nhân nhạy cảm và được thu thập từ nhiều nguồn khác nhau.
C. Dữ liệu lớn luôn được mã hóa hoàn toàn.
D. Dữ liệu lớn chỉ được sử dụng cho mục đích nghiên cứu khoa học.

24. Quy trình `Data Mining` (Khai phá dữ liệu) trong Dữ liệu lớn chủ yếu tập trung vào điều gì?

A. Lưu trữ và quản lý dữ liệu hiệu quả
B. Trực quan hóa dữ liệu để dễ hiểu
C. Phân tích và khám phá các mẫu ẩn, tri thức hữu ích từ dữ liệu
D. Bảo mật dữ liệu khỏi truy cập trái phép

25. Vấn đề `data silos` (tổ chức dữ liệu rời rạc) có thể gây trở ngại gì cho việc khai thác giá trị từ Dữ liệu lớn?

A. Tăng tốc độ xử lý dữ liệu.
B. Hạn chế khả năng kết hợp và phân tích dữ liệu từ nhiều nguồn khác nhau để có được bức tranh toàn diện và insights sâu sắc.
C. Giảm chi phí lưu trữ dữ liệu.
D. Đơn giản hóa việc quản lý dữ liệu.

26. Thách thức lớn nhất liên quan đến `Veracity` (Tính xác thực) trong bối cảnh Dữ liệu lớn là gì?

A. Lưu trữ dữ liệu với chi phí thấp
B. Đảm bảo chất lượng và độ tin cậy của dữ liệu
C. Tăng tốc độ xử lý dữ liệu
D. Thu thập dữ liệu từ nhiều nguồn khác nhau

27. Ưu điểm của việc sử dụng `columnar database` (cơ sở dữ liệu cột) so với `row-based database` (cơ sở dữ liệu hàng) trong phân tích Dữ liệu lớn là gì?

A. Dễ dàng cập nhật dữ liệu hơn.
B. Hiệu quả hơn trong việc truy vấn và tổng hợp dữ liệu trên một số lượng lớn bản ghi nhưng chỉ cần một vài cột.
C. Tiết kiệm dung lượng lưu trữ hơn cho dữ liệu giao dịch.
D. Phù hợp hơn cho các ứng dụng OLTP (xử lý giao dịch trực tuyến).

28. Công nghệ `in-memory processing` (xử lý trong bộ nhớ) trong Dữ liệu lớn, như Apache Spark, giúp cải thiện hiệu suất xử lý dữ liệu như thế nào?

A. Giảm dung lượng lưu trữ dữ liệu
B. Tăng tốc độ truy cập dữ liệu bằng cách giảm thiểu việc đọc/ghi đĩa
C. Cải thiện độ tin cậy của dữ liệu
D. Đơn giản hóa việc quản lý dữ liệu phân tán

29. Ngôn ngữ lập trình nào phổ biến trong việc xử lý và phân tích Dữ liệu lớn, đặc biệt trong các framework như Spark?

A. Java
B. Python
C. C++
D. Assembly

30. Trong kiến trúc lambda và kappa cho Dữ liệu lớn, kiến trúc nào tập trung vào xử lý cả dữ liệu theo lô (batch) và dữ liệu luồng (stream) trong cùng một hệ thống?

A. Kiến trúc Lambda
B. Kiến trúc Kappa
C. Cả hai kiến trúc Lambda và Kappa
D. Không kiến trúc nào trong hai kiến trúc trên

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

1. Trong ngữ cảnh Dữ liệu lớn, 'real-time analytics' (phân tích thời gian thực) có nghĩa là gì?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

2. Thuật ngữ 'Data Governance' (Quản trị dữ liệu) trong Dữ liệu lớn liên quan đến vấn đề gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

3. Một trong những thách thức chính về kỹ năng trong lĩnh vực Dữ liệu lớn hiện nay là gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

4. Lợi ích chính của việc sử dụng Dữ liệu lớn trong lĩnh vực y tế là gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

5. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn, giúp người dùng dễ dàng hiểu và phân tích thông tin?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

6. Công nghệ nào sau đây thường được sử dụng để xử lý Dữ liệu lớn phân tán trên nhiều máy tính?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

7. Khái niệm 'data wrangling' (chuẩn bị dữ liệu) trong Dữ liệu lớn bao gồm các công việc chính nào?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

8. Trong Dữ liệu lớn, 'machine learning' (học máy) thường được sử dụng để làm gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

9. Đặc điểm nào sau đây KHÔNG phải là một trong '5Vs' thường được dùng để mô tả Dữ liệu lớn (Big Data)?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

10. Khái niệm 'Value' (Giá trị) trong '5Vs' của Dữ liệu lớn nhấn mạnh điều gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

11. Yếu tố 'Velocity' (Tốc độ) trong Dữ liệu lớn đề cập đến khía cạnh nào?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

12. Loại dữ liệu nào sau đây KHÔNG được xem là 'phi cấu trúc' trong bối cảnh Dữ liệu lớn?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

13. Thách thức về 'Veracity' (Tính xác thực) trong Dữ liệu lớn có thể ảnh hưởng tiêu cực đến điều gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

14. Công nghệ nào sau đây KHÔNG phải là một thành phần phổ biến trong hệ sinh thái Hadoop?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

15. Trong bối cảnh IoT (Internet of Things), Dữ liệu lớn đóng vai trò quan trọng như thế nào?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

16. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Dữ liệu lớn?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

17. Ứng dụng nào sau đây thể hiện rõ nhất giá trị của Dữ liệu lớn trong lĩnh vực 'thành phố thông minh'?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

18. Ưu điểm chính của việc sử dụng 'cloud computing' (điện toán đám mây) cho Dữ liệu lớn là gì?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

19. Loại cơ sở dữ liệu nào thường được sử dụng cho Dữ liệu lớn vì khả năng mở rộng linh hoạt và xử lý dữ liệu phi cấu trúc?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

20. Công cụ nào sau đây thường được sử dụng để thực hiện truy vấn và phân tích dữ liệu trong Hadoop?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

21. Mô hình lập trình 'MapReduce' trong Hadoop hoạt động dựa trên nguyên tắc nào?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

22. Trong kiến trúc Dữ liệu lớn, 'Data Lake' (Hồ dữ liệu) khác biệt so với 'Data Warehouse' (Kho dữ liệu) chủ yếu ở điểm nào?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

23. Vấn đề về 'quyền riêng tư dữ liệu' trở nên đặc biệt quan trọng trong bối cảnh Dữ liệu lớn vì lý do gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

24. Quy trình 'Data Mining' (Khai phá dữ liệu) trong Dữ liệu lớn chủ yếu tập trung vào điều gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

25. Vấn đề 'data silos' (tổ chức dữ liệu rời rạc) có thể gây trở ngại gì cho việc khai thác giá trị từ Dữ liệu lớn?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

26. Thách thức lớn nhất liên quan đến 'Veracity' (Tính xác thực) trong bối cảnh Dữ liệu lớn là gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

27. Ưu điểm của việc sử dụng 'columnar database' (cơ sở dữ liệu cột) so với 'row-based database' (cơ sở dữ liệu hàng) trong phân tích Dữ liệu lớn là gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

28. Công nghệ 'in-memory processing' (xử lý trong bộ nhớ) trong Dữ liệu lớn, như Apache Spark, giúp cải thiện hiệu suất xử lý dữ liệu như thế nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

29. Ngôn ngữ lập trình nào phổ biến trong việc xử lý và phân tích Dữ liệu lớn, đặc biệt trong các framework như Spark?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 3

30. Trong kiến trúc lambda và kappa cho Dữ liệu lớn, kiến trúc nào tập trung vào xử lý cả dữ liệu theo lô (batch) và dữ liệu luồng (stream) trong cùng một hệ thống?