Đề 4 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Ứng dụng nào sau đây KHÔNG phải là một ví dụ phổ biến của khoa học dữ liệu trong lĩnh vực Marketing?
A. Phân khúc khách hàng (Customer Segmentation) để cá nhân hóa chiến dịch.
B. Dự đoán nhu cầu nguyên vật liệu sản xuất.
C. Đề xuất sản phẩm (Recommendation System) cho khách hàng trực tuyến.
D. Phân tích hiệu quả chiến dịch quảng cáo trên mạng xã hội.
2. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật chính trong khai thác dữ liệu (Data Mining) thường được sử dụng trong kinh tế và kinh doanh?
A. Phân tích hồi quy (Regression Analysis)
B. Phân cụm (Clustering)
C. Phân tích phương sai (ANOVA)
D. Phân lớp (Classification)
3. Trong bối cảnh kinh doanh hiện đại, `dữ liệu lớn` (Big Data) thường được mô tả bằng các đặc điểm `3V`. Ngoại trừ:
A. Volume (Khối lượng)
B. Variety (Đa dạng)
C. Velocity (Tốc độ)
D. Veracity (Tính xác thực)
4. Trong khoa học dữ liệu, `Bias` (Thiên vị) trong dữ liệu hoặc mô hình có thể dẫn đến:
A. Mô hình hoạt động tốt hơn trên dữ liệu huấn luyện.
B. Kết quả phân tích không công bằng hoặc không chính xác, đặc biệt đối với một số nhóm đối tượng.
C. Tăng tốc độ huấn luyện mô hình.
D. Giảm nguy cơ overfitting.
5. Trong phân tích rủi ro tín dụng, biến số nào sau đây có khả năng là một `feature` (đặc trưng) quan trọng để dự đoán khả năng vỡ nợ của khách hàng?
A. Màu sắc yêu thích của khách hàng.
B. Lịch sử thanh toán nợ của khách hàng.
C. Hệ điều hành điện thoại khách hàng sử dụng.
D. Thời gian truy cập website của ngân hàng.
6. Khi lựa chọn mô hình học máy, sự đánh đổi giữa `Bias` (Độ lệch) và `Variance` (Phương sai) đề cập đến:
A. Sự cân bằng giữa tốc độ huấn luyện và độ chính xác của mô hình.
B. Sự cân bằng giữa khả năng mô hình khớp tốt với dữ liệu huấn luyện và khả năng tổng quát hóa trên dữ liệu mới.
C. Sự cân bằng giữa chi phí đầu tư và lợi ích thu được từ mô hình.
D. Sự cân bằng giữa tính dễ diễn giải và độ phức tạp của mô hình.
7. Khi phân tích dữ liệu văn bản lớn (ví dụ: đánh giá sản phẩm trực tuyến), kỹ thuật `Topic Modeling` (Mô hình chủ đề) giúp:
A. Dự đoán xếp hạng sản phẩm.
B. Phân loại đánh giá thành tích cực và tiêu cực.
C. Khám phá các chủ đề chính được thảo luận trong văn bản.
D. Tóm tắt nội dung văn bản.
8. Đâu là một ví dụ về dữ liệu `phi cấu trúc` (Unstructured Data) thường được sử dụng trong khoa học dữ liệu kinh doanh?
A. Bảng dữ liệu doanh số bán hàng hàng tháng.
B. Cơ sở dữ liệu khách hàng với thông tin cá nhân và lịch sử mua hàng.
C. Bài đăng và bình luận trên mạng xã hội về sản phẩm.
D. Báo cáo tài chính hàng quý.
9. Khi triển khai một dự án khoa học dữ liệu trong doanh nghiệp, yếu tố nào sau đây là QUAN TRỌNG NHẤT để đảm bảo thành công?
A. Sử dụng công nghệ và thuật toán học máy tiên tiến nhất.
B. Có đủ dữ liệu lớn và đa dạng.
C. Xác định rõ ràng bài toán kinh doanh cần giải quyết và mục tiêu cụ thể.
D. Tuyển dụng đội ngũ chuyên gia khoa học dữ liệu đông đảo.
10. Kỹ thuật `Dimensionality Reduction` (Giảm chiều dữ liệu) trong khoa học dữ liệu được sử dụng để:
A. Tăng số lượng biến (features) trong dữ liệu.
B. Giảm số lượng biến (features) trong dữ liệu trong khi vẫn giữ lại thông tin quan trọng.
C. Tăng kích thước mẫu dữ liệu.
D. Giảm kích thước mẫu dữ liệu.
11. Đâu là một thách thức ĐẠO ĐỨC lớn khi ứng dụng khoa học dữ liệu trong kinh doanh, đặc biệt liên quan đến dữ liệu khách hàng?
A. Chi phí đầu tư vào công nghệ và nhân lực khoa học dữ liệu quá cao.
B. Sự phức tạp của các thuật toán học máy khiến việc giải thích kết quả trở nên khó khăn.
C. Nguy cơ xâm phạm quyền riêng tư và sử dụng dữ liệu cá nhân không được phép.
D. Khó khăn trong việc tích hợp dữ liệu từ nhiều nguồn khác nhau.
12. Khoa học dữ liệu (Data Science) trong kinh tế và kinh doanh chủ yếu tập trung vào việc:
A. Thu thập và lưu trữ dữ liệu một cách hiệu quả.
B. Phân tích dữ liệu để khám phá thông tin giá trị và hỗ trợ ra quyết định.
C. Xây dựng cơ sở hạ tầng mạng lưới máy tính cho doanh nghiệp.
D. Tự động hóa quy trình sản xuất trong nhà máy.
13. Trong lĩnh vực nhân sự (HR), khoa học dữ liệu có thể ứng dụng để:
A. Dự báo xu hướng thị trường chứng khoán.
B. Tối ưu hóa quy trình tuyển dụng và dự đoán tỷ lệ nghỉ việc của nhân viên.
C. Quản lý rủi ro tín dụng.
D. Cải thiện trải nghiệm khách hàng trực tuyến.
14. Công cụ hoặc ngôn ngữ lập trình nào sau đây thường được sử dụng NHẤT trong khoa học dữ liệu?
A. Java
B. C++
C. Python
D. Swift
15. Trong khoa học dữ liệu, `Overfitting` (Quá khớp) xảy ra khi:
A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình học quá kém trên cả dữ liệu huấn luyện và dữ liệu mới.
C. Dữ liệu huấn luyện không đủ lớn.
D. Dữ liệu có quá nhiều giá trị thiếu.
16. Thuật ngữ `Feature Engineering` (Kỹ thuật đặc trưng) trong khoa học dữ liệu đề cập đến:
A. Quá trình lựa chọn thuật toán học máy tốt nhất.
B. Quá trình tạo ra các biến mới hoặc biến đổi các biến hiện có để cải thiện hiệu suất mô hình.
C. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
D. Quá trình trực quan hóa dữ liệu.
17. Phân tích `Sentiment Analysis` (Phân tích cảm xúc) trong khoa học dữ liệu chủ yếu tập trung vào việc:
A. Phân tích cấu trúc dữ liệu phi cấu trúc.
B. Xác định và phân loại cảm xúc (tích cực, tiêu cực, trung lập) trong văn bản.
C. Dự báo xu hướng thị trường chứng khoán.
D. Phân tích hành vi mua sắm của khách hàng trên website.
18. Phương pháp `Regularization` (Chính quy hóa) trong học máy được sử dụng để:
A. Tăng độ phức tạp của mô hình.
B. Giảm overfitting và cải thiện khả năng tổng quát hóa của mô hình.
C. Tăng tốc độ huấn luyện mô hình.
D. Xử lý dữ liệu thiếu.
19. Khi đánh giá hiệu suất của một mô hình phân loại (Classification) trong kinh doanh, chỉ số `Độ chính xác` (Accuracy) có thể KHÔNG phải là thước đo tốt nhất trong trường hợp nào?
A. Khi dữ liệu huấn luyện rất lớn.
B. Khi các lớp dữ liệu không cân bằng (imbalanced classes).
C. Khi mô hình quá phức tạp (overfitting).
D. Khi thời gian huấn luyện mô hình quá dài.
20. Trong lĩnh vực tài chính, khoa học dữ liệu có thể được ứng dụng để:
A. Tối ưu hóa quy trình sản xuất trong nhà máy.
B. Dự báo rủi ro tín dụng và phát hiện gian lận.
C. Quản lý chuỗi cung ứng hiệu quả hơn.
D. Cải thiện trải nghiệm khách hàng trực tuyến.
21. Mô hình `Decision Tree` (Cây quyết định) trong học máy có ưu điểm nổi bật nào?
A. Khả năng xử lý dữ liệu văn bản tốt.
B. Dễ dàng diễn giải và trực quan hóa.
C. Hiệu suất cao trên dữ liệu nhiễu.
D. Luôn cho kết quả chính xác cao nhất.
22. Trong khoa học dữ liệu, `Ensemble Methods` (Phương pháp tập hợp) như Random Forest hoặc Gradient Boosting thường được sử dụng để:
A. Giảm chiều dữ liệu.
B. Tăng tính dễ diễn giải của mô hình.
C. Cải thiện độ chính xác và độ ổn định của mô hình dự đoán.
D. Xử lý dữ liệu phi cấu trúc.
23. Khi trình bày kết quả phân tích dữ liệu cho các nhà quản lý kinh doanh, điều quan trọng là:
A. Sử dụng ngôn ngữ kỹ thuật và thuật ngữ chuyên ngành sâu.
B. Tập trung vào các chi tiết kỹ thuật của mô hình.
C. Truyền đạt thông tin một cách rõ ràng, dễ hiểu, tập trung vào ý nghĩa kinh doanh và hành động.
D. Trình bày tất cả các bước phân tích dữ liệu một cách chi tiết.
24. Trong bối cảnh kinh doanh, việc sử dụng khoa học dữ liệu để cá nhân hóa trải nghiệm khách hàng (Customer Experience Personalization) có thể mang lại lợi ích nào?
A. Giảm chi phí sản xuất.
B. Tăng sự hài lòng và lòng trung thành của khách hàng.
C. Đơn giản hóa quy trình kế toán.
D. Tăng cường bảo mật dữ liệu.
25. Trong bài toán dự báo doanh số bán hàng, việc sử dụng mô hình chuỗi thời gian (Time Series) là phù hợp nhất khi:
A. Doanh số bán hàng không có xu hướng hoặc tính mùa vụ.
B. Doanh số bán hàng chịu ảnh hưởng mạnh mẽ bởi các yếu tố bên ngoài như quảng cáo và khuyến mãi.
C. Doanh số bán hàng có xu hướng và/hoặc tính mùa vụ rõ ràng theo thời gian.
D. Mục tiêu là phân khúc khách hàng dựa trên hành vi mua sắm.
26. Phương pháp `Cross-validation` (Kiểm định chéo) được sử dụng để:
A. Tăng kích thước dữ liệu huấn luyện.
B. Đánh giá khả năng tổng quát hóa của mô hình học máy trên dữ liệu mới.
C. Chuẩn bị dữ liệu trước khi đưa vào mô hình.
D. Trực quan hóa kết quả phân tích dữ liệu.
27. Trong quy trình khoa học dữ liệu, giai đoạn `chuẩn bị dữ liệu` (Data Preparation) đóng vai trò:
A. Xây dựng và lựa chọn mô hình học máy phù hợp.
B. Thu thập dữ liệu từ các nguồn khác nhau.
C. Làm sạch, chuyển đổi và định dạng dữ liệu để sẵn sàng cho phân tích.
D. Trình bày kết quả phân tích dữ liệu dưới dạng trực quan.
28. Đâu là một ví dụ về ứng dụng của khoa học dữ liệu trong lĩnh vực kinh tế vĩ mô?
A. Phân tích hành vi mua sắm của từng cá nhân khách hàng.
B. Dự báo tăng trưởng GDP và tỷ lệ lạm phát của một quốc gia.
C. Tối ưu hóa chiến dịch quảng cáo trực tuyến cho một doanh nghiệp.
D. Phân tích rủi ro tín dụng cho từng khoản vay cá nhân.
29. Trong bài toán phân cụm khách hàng (Customer Clustering), mục tiêu chính là:
A. Dự đoán hành vi mua sắm của từng khách hàng.
B. Phân nhóm khách hàng thành các nhóm có đặc điểm tương đồng.
C. Xếp hạng khách hàng dựa trên giá trị đóng góp.
D. Xác định khách hàng có nguy cơ rời bỏ.
30. Trong lĩnh vực quản lý chuỗi cung ứng, khoa học dữ liệu có thể giúp:
A. Thiết kế sản phẩm mới.
B. Tối ưu hóa tồn kho và dự báo nhu cầu.
C. Tuyển dụng và đào tạo nhân viên.
D. Xây dựng chiến lược marketing tổng thể.