Đề 11 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của khoa học dữ liệu trong lĩnh vực tài chính?
A. Phát hiện gian lận giao dịch thẻ tín dụng.
B. Dự báo giá cổ phiếu.
C. Tối ưu hóa lịch trình bảo trì máy móc trong nhà máy.
D. Đánh giá rủi ro tín dụng cho khách hàng vay vốn.
2. Mục tiêu của `phân tích rủi ro` (risk analysis) trong kinh doanh sử dụng khoa học dữ liệu là:
A. Loại bỏ hoàn toàn mọi rủi ro.
B. Xác định, đánh giá và giảm thiểu các rủi ro tiềm ẩn ảnh hưởng đến hoạt động kinh doanh.
C. Tăng cường rủi ro để tạo ra lợi nhuận cao hơn.
D. Chuyển rủi ro sang cho khách hàng.
3. Trong bối cảnh kinh tế, khoa học dữ liệu có thể giúp các nhà hoạch định chính sách:
A. Tăng thuế để tăng thu ngân sách.
B. Phân tích dữ liệu kinh tế vĩ mô và vi mô để đưa ra quyết định chính sách dựa trên bằng chứng.
C. Hạn chế sự phát triển của doanh nghiệp tư nhân.
D. Giảm chi tiêu công một cách tùy tiện.
4. Trong lĩnh vực nhân sự (HR), khoa học dữ liệu có thể được ứng dụng để:
A. Tự động hóa hoàn toàn quy trình tuyển dụng và quản lý nhân sự.
B. Phân tích tỷ lệ nghỉ việc của nhân viên và dự đoán nhân viên có nguy cơ nghỉ việc.
C. Thay thế hoàn toàn vai trò của chuyên gia nhân sự.
D. Giảm lương của nhân viên dựa trên hiệu suất làm việc.
5. Đâu là một ví dụ về dữ liệu `phi cấu trúc` (unstructured data) trong kinh doanh?
A. Bảng dữ liệu bán hàng với các cột `Mã sản phẩm`, `Số lượng`, `Giá`.
B. Bài đăng trên mạng xã hội và bình luận của khách hàng.
C. Dữ liệu giao dịch ngân hàng.
D. Bảng cân đối kế toán.
6. Trong khoa học dữ liệu, `feature engineering` (kỹ thuật tạo đặc trưng) là quá trình:
A. Chọn thuật toán máy học phù hợp nhất.
B. Chuyển đổi dữ liệu thô thành các đặc trưng (features) phù hợp hơn để mô hình máy học có thể học tốt hơn.
C. Giảm kích thước của dữ liệu.
D. Trực quan hóa dữ liệu.
7. Đâu là lợi ích chính của việc ứng dụng khoa học dữ liệu trong dự báo kinh doanh?
A. Giảm chi phí thuê nhân viên phân tích dữ liệu.
B. Tăng độ chính xác của dự báo, giúp đưa ra quyết định kinh doanh tốt hơn.
C. Tạo ra các báo cáo phức tạp hơn để trình bày với ban lãnh đạo.
D. Thay thế hoàn toàn các phương pháp dự báo truyền thống.
8. Kỹ thuật `khai phá dữ liệu` (data mining) thường được áp dụng để:
A. Nhập dữ liệu từ nhiều nguồn khác nhau vào một hệ thống.
B. Tìm kiếm các mẫu, xu hướng và mối quan hệ ẩn trong lượng lớn dữ liệu.
C. Bảo mật dữ liệu khỏi các truy cập trái phép.
D. Trực quan hóa dữ liệu dưới dạng biểu đồ và đồ thị.
9. Thách thức lớn nhất khi ứng dụng khoa học dữ liệu trong kinh doanh thường là:
A. Sự thiếu hụt các công cụ phần mềm phân tích dữ liệu.
B. Chất lượng dữ liệu kém và khả năng tích hợp dữ liệu từ nhiều nguồn.
C. Chi phí đầu tư vào phần cứng máy tính quá cao.
D. Sự phản đối từ phía khách hàng về việc thu thập dữ liệu cá nhân.
10. Thuật ngữ `Big Data` thường được mô tả bởi 4Vs, trong đó `Volume` đề cập đến:
A. Tốc độ tạo ra và xử lý dữ liệu.
B. Sự đa dạng của các loại dữ liệu.
C. Khối lượng dữ liệu khổng lồ.
D. Độ chính xác và đáng tin cậy của dữ liệu.
11. Khi một doanh nghiệp sử dụng khoa học dữ liệu để `phân khúc khách hàng` (customer segmentation), mục đích chính là:
A. Tăng giá sản phẩm cho tất cả khách hàng.
B. Chia khách hàng thành các nhóm khác nhau dựa trên đặc điểm chung để phục vụ tốt hơn nhu cầu của từng nhóm.
C. Giảm chi phí marketing bằng cách tiếp cận ít khách hàng hơn.
D. Loại bỏ những khách hàng không sinh lợi.
12. Ứng dụng nào sau đây thể hiện việc sử dụng khoa học dữ liệu để cải thiện `trải nghiệm khách hàng` (customer experience)?
A. Tự động hóa quy trình kế toán.
B. Đề xuất sản phẩm cá nhân hóa cho khách hàng trên trang web thương mại điện tử.
C. Giảm chi phí sản xuất.
D. Tăng cường bảo mật hệ thống thông tin.
13. Trong phân tích dữ liệu chuỗi thời gian (time series analysis), mục tiêu thường là:
A. Phân tích mối quan hệ giữa các biến số tại một thời điểm cố định.
B. Nghiên cứu sự biến đổi của một biến số theo thời gian và dự báo giá trị tương lai.
C. Phân nhóm dữ liệu dựa trên thuộc tính thời gian.
D. Loại bỏ yếu tố thời gian khỏi dữ liệu.
14. Đâu là một ví dụ về ứng dụng của khoa học dữ liệu trong quản lý chuỗi cung ứng (supply chain management)?
A. Thiết kế logo sản phẩm.
B. Dự báo nhu cầu sản phẩm và tối ưu hóa tồn kho.
C. Quản lý tài khoản ngân hàng của công ty.
D. Đào tạo nhân viên bán hàng.
15. Trong phân tích dữ liệu, `giả thuyết không` (null hypothesis) thường được sử dụng để:
A. Chứng minh một giả thuyết nghiên cứu là đúng.
B. Bác bỏ một giả định mặc định hoặc hiện trạng.
C. Xây dựng mô hình dự đoán.
D. Trực quan hóa dữ liệu.
16. Khi nói về `trực quan hóa dữ liệu` (data visualization), mục tiêu chính là:
A. Làm cho dữ liệu trở nên đẹp mắt và ấn tượng.
B. Biến dữ liệu phức tạp thành các định dạng dễ hiểu và dễ truyền đạt.
C. Giảm dung lượng lưu trữ dữ liệu.
D. Thay thế hoàn toàn các báo cáo dạng văn bản.
17. Phương pháp `phân cụm` (clustering) trong khoa học dữ liệu được sử dụng để:
A. Dự đoán một giá trị số liên tục.
B. Phân loại dữ liệu vào các nhóm có ý nghĩa dựa trên sự tương đồng.
C. Xây dựng mô hình hồi quy.
D. Giảm số chiều dữ liệu.
18. Phương pháp phân tích `hồi quy tuyến tính` (linear regression) chủ yếu được sử dụng để:
A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự đoán giá trị của một biến số dựa trên một hoặc nhiều biến số khác.
C. Tìm kiếm các cụm dữ liệu tương tự nhau.
D. Giảm số chiều của dữ liệu.
19. Trong khoa học dữ liệu, `dữ liệu lớn` (Big Data) khác biệt với `dữ liệu truyền thống` chủ yếu về:
A. Độ chính xác của dữ liệu.
B. Kích thước, tốc độ và sự đa dạng của dữ liệu (Volume, Velocity, Variety).
C. Khả năng truy cập dữ liệu.
D. Ngôn ngữ lập trình sử dụng để phân tích dữ liệu.
20. Trong quá trình phân tích dữ liệu, `làm sạch dữ liệu` (data cleaning) là bước:
A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Xử lý dữ liệu bị thiếu, dữ liệu nhiễu và dữ liệu không nhất quán.
C. Trực quan hóa dữ liệu.
D. Xây dựng mô hình máy học.
21. Khái niệm `học máy không giám sát` (unsupervised learning) khác với `học máy có giám sát` (supervised learning) ở điểm nào?
A. Học máy không giám sát sử dụng ít dữ liệu hơn học máy có giám sát.
B. Học máy không giám sát không sử dụng dữ liệu có nhãn (labeled data), còn học máy có giám sát thì có.
C. Học máy không giám sát luôn cho kết quả chính xác hơn học máy có giám sát.
D. Học máy không giám sát chỉ áp dụng cho dữ liệu văn bản, còn học máy có giám sát thì không.
22. Khoa học dữ liệu trong kinh tế và kinh doanh chủ yếu tập trung vào việc:
A. Thu thập dữ liệu một cách ngẫu nhiên để lưu trữ.
B. Áp dụng các phương pháp thống kê và máy học để trích xuất tri thức và giá trị từ dữ liệu.
C. Xây dựng các mô hình kinh tế vĩ mô phức tạp.
D. Tối ưu hóa quy trình sản xuất trong nhà máy.
23. Trong khoa học dữ liệu, `overfitting` (quá khớp) xảy ra khi:
A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình học quá kém trên cả dữ liệu huấn luyện và dữ liệu mới.
C. Dữ liệu huấn luyện không đủ lớn.
D. Thuật toán máy học không phù hợp.
24. Để giảm thiểu rủi ro `overfitting` trong mô hình máy học, một biện pháp phổ biến là:
A. Tăng độ phức tạp của mô hình.
B. Sử dụng nhiều dữ liệu huấn luyện hơn.
C. Loại bỏ bớt dữ liệu huấn luyện.
D. Tăng cường độ nhiễu trong dữ liệu huấn luyện.
25. Phương pháp `phân tích cảm xúc` (sentiment analysis) thường được sử dụng để:
A. Dự đoán giá cổ phiếu dựa trên tin tức.
B. Xác định thái độ, ý kiến và cảm xúc của con người từ văn bản.
C. Phân loại khách hàng thành các nhóm dựa trên nhân khẩu học.
D. Phát hiện gian lận trong giao dịch tài chính.
26. Trong bối cảnh kinh doanh, `phân tích mô tả` (descriptive analytics) thường được sử dụng để:
A. Dự đoán xu hướng thị trường trong tương lai.
B. Xác định nguyên nhân gốc rễ của các vấn đề kinh doanh.
C. Tóm tắt và hiểu rõ dữ liệu quá khứ và hiện tại.
D. Đề xuất các hành động tối ưu để cải thiện hiệu suất.
27. Trong marketing, khoa học dữ liệu có thể giúp doanh nghiệp:
A. Giảm số lượng nhân viên marketing.
B. Cá nhân hóa trải nghiệm khách hàng và tối ưu hóa chiến dịch quảng cáo.
C. Loại bỏ hoàn toàn sự cần thiết của nghiên cứu thị trường truyền thống.
D. Đảm bảo tất cả các chiến dịch marketing đều thành công.
28. Đâu là một công cụ hoặc ngôn ngữ lập trình phổ biến được sử dụng trong khoa học dữ liệu?
A. Microsoft Word.
B. Python.
C. Microsoft Excel (chỉ dùng Excel nâng cao).
D. PowerPoint.
29. Khi đánh giá hiệu suất của mô hình phân loại (classification model), chỉ số `độ chính xác` (accuracy) có thể gây hiểu lầm trong trường hợp nào?
A. Khi dữ liệu có quá nhiều thuộc tính.
B. Khi dữ liệu bị mất mát nhiều.
C. Khi các lớp (classes) trong dữ liệu không cân bằng (imbalanced classes).
D. Khi mô hình quá phức tạp.
30. Trong khoa học dữ liệu kinh doanh, `mô hình hóa dự đoán` (predictive modeling) khác biệt với `mô hình hóa mô tả` (descriptive modeling) ở điểm nào?
A. Mô hình hóa dự đoán sử dụng dữ liệu hiện tại, còn mô hình hóa mô tả sử dụng dữ liệu quá khứ.
B. Mô hình hóa dự đoán tập trung vào tương lai, còn mô hình hóa mô tả tập trung vào quá khứ và hiện tại.
C. Mô hình hóa dự đoán dễ thực hiện hơn mô hình hóa mô tả.
D. Mô hình hóa dự đoán chỉ áp dụng cho dữ liệu lớn (Big Data), còn mô hình hóa mô tả thì không.