Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData) – Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Đề 10 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý lượng lớn dữ liệu phi cấu trúc trong môi trường Big Data?

A. Hệ quản trị cơ sở dữ liệu quan hệ (RDBMS).
B. Data Warehouse truyền thống.
C. Hadoop và HDFS.
D. Excel.

2. Trong bối cảnh Big Data, thuật ngữ `Schema-on-read` liên quan đến loại kho lưu trữ dữ liệu nào?

A. Data Warehouse.
B. Data Mart.
C. Data Lake.
D. Cơ sở dữ liệu quan hệ.

3. Yếu tố `Veracity` trong Big Data nhấn mạnh khía cạnh nào của dữ liệu?

A. Tính bảo mật của dữ liệu.
B. Tính biến động của dữ liệu.
C. Độ tin cậy và chất lượng của dữ liệu.
D. Giá trị kinh tế tiềm ẩn của dữ liệu.

4. Data mining (khai phá dữ liệu) trong Big Data chủ yếu tập trung vào việc gì?

A. Thu thập và lưu trữ dữ liệu.
B. Trực quan hóa dữ liệu.
C. Tìm kiếm các mẫu, xu hướng và tri thức ẩn trong dữ liệu.
D. Đảm bảo chất lượng dữ liệu.

5. Khái niệm `Data wrangling` (chuẩn bị dữ liệu) trong Big Data bao gồm những công việc nào?

A. Phân tích dữ liệu và xây dựng mô hình.
B. Thu thập, làm sạch, chuyển đổi và định hình dữ liệu để phân tích.
C. Lưu trữ và quản lý cơ sở dữ liệu.
D. Bảo mật dữ liệu và kiểm soát truy cập.

6. Lợi ích chính của việc sử dụng điện toán đám mây (cloud computing) trong Big Data là gì?

A. Tăng cường bảo mật dữ liệu.
B. Giảm chi phí đầu tư ban đầu vào hạ tầng phần cứng và phần mềm.
C. Tăng tốc độ xử lý dữ liệu cục bộ.
D. Đơn giản hóa việc quản lý cơ sở dữ liệu.

7. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Big Data?

A. Phân tích hành vi khách hàng trong bán lẻ.
B. Dự báo thời tiết.
C. Quản lý cơ sở dữ liệu cá nhân trên máy tính đơn lẻ.
D. Phát hiện gian lận trong lĩnh vực tài chính.

8. Yếu tố nào sau đây KHÔNG phải là một trong các thành phần chính của hệ sinh thái Hadoop?

A. HDFS (Hadoop Distributed File System).
B. MapReduce.
C. Spark.
D. MySQL.

9. Công nghệ nào sau đây thường được sử dụng để trực quan hóa dữ liệu Big Data?

A. Hadoop.
B. Spark.
C. Tableau, Power BI.
D. Java.

10. Phân tích `Batch processing` và `Stream processing` khác nhau như thế nào trong Big Data?

A. Batch processing xử lý dữ liệu theo thời gian thực, stream processing xử lý dữ liệu theo lô.
B. Batch processing xử lý dữ liệu lịch sử theo lô lớn, stream processing xử lý dữ liệu liên tục theo thời gian thực.
C. Batch processing nhanh hơn stream processing.
D. Stream processing chỉ áp dụng cho dữ liệu có cấu trúc, batch processing cho dữ liệu phi cấu trúc.

11. Kiến trúc Lambda trong Big Data được thiết kế để giải quyết vấn đề nào?

A. Bảo mật dữ liệu.
B. Tốc độ và độ trễ trong xử lý dữ liệu.
C. Khả năng mở rộng lưu trữ.
D. Đa dạng hóa nguồn dữ liệu.

12. Một thách thức về kỹ thuật khi xử lý Big Data là gì?

A. Sự thiếu hụt nhân lực có kỹ năng phân tích dữ liệu.
B. Khả năng mở rộng hệ thống để xử lý lượng dữ liệu ngày càng tăng.
C. Chi phí đầu tư vào phần mềm phân tích dữ liệu.
D. Quy định về bảo mật dữ liệu.

13. Trong bối cảnh Big Data, `Variety` ám chỉ điều gì?

A. Độ chính xác của dữ liệu.
B. Khả năng mở rộng của hệ thống.
C. Sự khác biệt về nguồn gốc dữ liệu.
D. Tính đa dạng của các loại dữ liệu (cấu trúc, bán cấu trúc, phi cấu trúc).

14. Công cụ lập trình nào phổ biến cho việc xử lý và phân tích dữ liệu trong hệ sinh thái Hadoop?

A. SQL.
B. Java.
C. Python.
D. C++.

15. Đặc điểm `Volume` trong Big Data đề cập đến yếu tố nào?

A. Sự đa dạng của các loại dữ liệu.
B. Tốc độ tạo ra và xử lý dữ liệu.
C. Kích thước khổng lồ của dữ liệu.
D. Tính xác thực và đáng tin cậy của dữ liệu.

16. Data Lake (hồ dữ liệu) khác với Data Warehouse (kho dữ liệu) ở điểm nào?

A. Data Lake lưu trữ dữ liệu đã được làm sạch và chuyển đổi (transformed), trong khi Data Warehouse lưu trữ dữ liệu thô.
B. Data Lake lưu trữ dữ liệu theo lược đồ (schema-on-write), trong khi Data Warehouse lưu trữ dữ liệu theo lược đồ khi đọc (schema-on-read).
C. Data Lake lưu trữ dữ liệu thô ở định dạng gốc, trong khi Data Warehouse lưu trữ dữ liệu đã được cấu trúc và làm sạch.
D. Data Lake chỉ dành cho dữ liệu có cấu trúc, còn Data Warehouse dành cho dữ liệu phi cấu trúc.

17. Thách thức lớn nhất khi làm việc với Big Data thường là gì?

A. Sự thiếu hụt phần cứng máy tính.
B. Đảm bảo chất lượng và tính nhất quán của dữ liệu.
C. Chi phí mua phần mềm phân tích dữ liệu.
D. Sự phức tạp của việc cài đặt hệ điều hành.

18. Một thách thức về mặt đạo đức khi sử dụng Big Data là gì?

A. Khả năng lưu trữ lượng lớn dữ liệu cá nhân.
B. Nguy cơ vi phạm quyền riêng tư và sử dụng dữ liệu cá nhân không đúng mục đích.
C. Sự phức tạp của các thuật toán phân tích dữ liệu.
D. Chi phí cao để thu thập dữ liệu.

19. Thuật ngữ `Velocity` trong Big Data liên quan mật thiết đến khái niệm nào sau đây?

A. Dữ liệu phi cấu trúc.
B. Xử lý dữ liệu theo thời gian thực.
C. Kho lưu trữ dữ liệu phân tán.
D. Phân tích dự đoán.

20. Thuật ngữ `Data Governance` trong Big Data đề cập đến điều gì?

A. Công nghệ lưu trữ dữ liệu.
B. Quy trình và chính sách quản lý dữ liệu, bao gồm chất lượng, bảo mật và tuân thủ.
C. Các phương pháp phân tích dữ liệu nâng cao.
D. Giao diện người dùng để truy vấn dữ liệu.

21. Quy trình ETL (Extract, Transform, Load) thường được sử dụng trong bối cảnh nào của Big Data?

A. Phân tích dữ liệu thời gian thực.
B. Xây dựng mô hình học máy.
C. Di chuyển dữ liệu từ nhiều nguồn vào Data Warehouse.
D. Trực quan hóa dữ liệu.

22. NoSQL (Not Only SQL) khác biệt với cơ sở dữ liệu quan hệ truyền thống (RDBMS) chủ yếu ở điểm nào?

A. Khả năng xử lý giao dịch ACID.
B. Mô hình dữ liệu linh hoạt, không theo lược đồ cố định.
C. Tính nhất quán dữ liệu mạnh mẽ.
D. Khả năng truy vấn dữ liệu phức tạp bằng SQL.

23. Giá trị (Value) trong 5V của Big Data thể hiện điều gì?

A. Độ phức tạp của dữ liệu.
B. Khả năng trực quan hóa dữ liệu.
C. Lợi ích và thông tin hữu ích có thể khai thác từ dữ liệu.
D. Quy trình thu thập và lưu trữ dữ liệu.

24. Khi nào thì nên sử dụng Data Warehouse thay vì Data Lake trong dự án Big Data?

A. Khi cần lưu trữ dữ liệu thô ở định dạng gốc.
B. Khi cần phân tích dữ liệu phi cấu trúc.
C. Khi yêu cầu báo cáo và phân tích có cấu trúc, tập trung vào dữ liệu đã được làm sạch và chuyển đổi.
D. Khi cần xử lý dữ liệu theo thời gian thực.

25. Spark khác biệt với Hadoop MapReduce chủ yếu ở điểm nào?

A. Khả năng xử lý dữ liệu theo lô (batch processing).
B. Khả năng xử lý dữ liệu trong bộ nhớ (in-memory processing).
C. Khả năng lưu trữ dữ liệu phân tán.
D. Khả năng quản lý cụm máy tính.

26. Một ví dụ về dữ liệu `phi cấu trúc` trong Big Data là gì?

A. Dữ liệu trong bảng cơ sở dữ liệu quan hệ.
B. Dữ liệu JSON.
C. Hình ảnh và video.
D. Dữ liệu XML.

27. Machine learning (học máy) được ứng dụng trong Big Data để làm gì?

A. Quản lý cơ sở dữ liệu.
B. Tối ưu hóa truy vấn SQL.
C. Xây dựng mô hình dự đoán và tự động hóa quyết định dựa trên dữ liệu.
D. Sao lưu và phục hồi dữ liệu.

28. Trong lĩnh vực tài chính, Big Data thường được sử dụng để...

A. Quản lý giao dịch ngân hàng hàng ngày.
B. Phát hiện giao dịch gian lận và đánh giá rủi ro tín dụng.
C. In sao kê tài khoản.
D. Gửi thông báo SMS cho khách hàng.

29. Phân tích `Predictive analytics` (phân tích dự đoán) trong Big Data nhằm mục đích gì?

A. Mô tả dữ liệu hiện tại.
B. Dự đoán các sự kiện hoặc xu hướng trong tương lai.
C. Làm sạch và chuẩn hóa dữ liệu.
D. Trực quan hóa dữ liệu lịch sử.

30. Trong lĩnh vực y tế, Big Data được ứng dụng để làm gì?

A. Quản lý hồ sơ bệnh án điện tử.
B. Phân tích dữ liệu di truyền để phát triển phương pháp điều trị cá nhân hóa.
C. Đặt lịch hẹn khám bệnh trực tuyến.
D. In hóa đơn thanh toán viện phí.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

1. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý lượng lớn dữ liệu phi cấu trúc trong môi trường Big Data?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

2. Trong bối cảnh Big Data, thuật ngữ 'Schema-on-read' liên quan đến loại kho lưu trữ dữ liệu nào?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

3. Yếu tố 'Veracity' trong Big Data nhấn mạnh khía cạnh nào của dữ liệu?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

4. Data mining (khai phá dữ liệu) trong Big Data chủ yếu tập trung vào việc gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

5. Khái niệm 'Data wrangling' (chuẩn bị dữ liệu) trong Big Data bao gồm những công việc nào?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

6. Lợi ích chính của việc sử dụng điện toán đám mây (cloud computing) trong Big Data là gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

7. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Big Data?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

8. Yếu tố nào sau đây KHÔNG phải là một trong các thành phần chính của hệ sinh thái Hadoop?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

9. Công nghệ nào sau đây thường được sử dụng để trực quan hóa dữ liệu Big Data?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

10. Phân tích 'Batch processing' và 'Stream processing' khác nhau như thế nào trong Big Data?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

11. Kiến trúc Lambda trong Big Data được thiết kế để giải quyết vấn đề nào?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

12. Một thách thức về kỹ thuật khi xử lý Big Data là gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

13. Trong bối cảnh Big Data, 'Variety' ám chỉ điều gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

14. Công cụ lập trình nào phổ biến cho việc xử lý và phân tích dữ liệu trong hệ sinh thái Hadoop?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

15. Đặc điểm 'Volume' trong Big Data đề cập đến yếu tố nào?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

16. Data Lake (hồ dữ liệu) khác với Data Warehouse (kho dữ liệu) ở điểm nào?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

17. Thách thức lớn nhất khi làm việc với Big Data thường là gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

18. Một thách thức về mặt đạo đức khi sử dụng Big Data là gì?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

19. Thuật ngữ 'Velocity' trong Big Data liên quan mật thiết đến khái niệm nào sau đây?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

20. Thuật ngữ 'Data Governance' trong Big Data đề cập đến điều gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

21. Quy trình ETL (Extract, Transform, Load) thường được sử dụng trong bối cảnh nào của Big Data?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

22. NoSQL (Not Only SQL) khác biệt với cơ sở dữ liệu quan hệ truyền thống (RDBMS) chủ yếu ở điểm nào?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

23. Giá trị (Value) trong 5V của Big Data thể hiện điều gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

24. Khi nào thì nên sử dụng Data Warehouse thay vì Data Lake trong dự án Big Data?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

25. Spark khác biệt với Hadoop MapReduce chủ yếu ở điểm nào?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

26. Một ví dụ về dữ liệu 'phi cấu trúc' trong Big Data là gì?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

27. Machine learning (học máy) được ứng dụng trong Big Data để làm gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

28. Trong lĩnh vực tài chính, Big Data thường được sử dụng để...

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

29. Phân tích 'Predictive analytics' (phân tích dự đoán) trong Big Data nhằm mục đích gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Dữ liệu lớn (BigData)

Tags: Bộ đề 10

30. Trong lĩnh vực y tế, Big Data được ứng dụng để làm gì?