Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên – Đề 1

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Đề 1 - Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

1. Ứng dụng nào sau đây KHÔNG phải là ứng dụng của Xử lý ngôn ngữ tự nhiên (NLP)?

A. Dịch máy (Machine Translation).
B. Nhận dạng khuôn mặt (Facial Recognition).
C. Phân tích cảm xúc văn bản (Sentiment Analysis).
D. Trợ lý ảo (Chatbot).

2. Mạng nơ-ron hồi quy (RNN) đặc biệt phù hợp với dữ liệu ngôn ngữ tự nhiên vì lý do gì?

A. Khả năng xử lý song song dữ liệu.
B. Khả năng ghi nhớ thông tin từ các bước xử lý trước đó trong chuỗi dữ liệu tuần tự.
C. Yêu cầu ít dữ liệu huấn luyện hơn.
D. Khả năng xử lý dữ liệu phi cấu trúc tốt hơn.

3. Mục tiêu của `semantic analysis` (phân tích ngữ nghĩa) trong NLP là gì?

A. Phân tích cấu trúc câu về mặt hình thức (ví dụ: chủ ngữ, vị ngữ).
B. Hiểu ý nghĩa của từ, cụm từ, câu và văn bản.
C. Tách văn bản thành các từ riêng lẻ.
D. Chuyển đổi văn bản thành dạng vector số.

4. Kỹ thuật `Named Entity Recognition` (NER) trong NLP nhằm mục đích gì?

A. Phân tích cấu trúc ngữ pháp của câu.
B. Xác định và phân loại các thực thể có tên riêng trong văn bản (ví dụ: tên người, tổ chức, địa điểm).
C. Tìm ra mối quan hệ giữa các câu trong văn bản.
D. Tóm tắt nội dung chính của văn bản.

5. Công đoạn nào sau đây KHÔNG thuộc quy trình tiền xử lý văn bản (text preprocessing) thường gặp trong NLP?

A. Tách từ (Tokenization).
B. Chuẩn hóa văn bản (Normalization).
C. Phân tích cảm xúc (Sentiment Analysis).
D. Loại bỏ stop words.

6. Phương pháp nào sau đây thuộc nhóm kỹ thuật `word embeddings` trong NLP?

A. Bag-of-Words.
B. TF-IDF.
C. Word2Vec.
D. Regular Expression.

7. Ứng dụng nào sau đây của NLP có thể hỗ trợ trong việc phát hiện tin giả (fake news)?

A. Dịch máy.
B. Phân tích cảm xúc và phân tích văn phong.
C. Tóm tắt văn bản.
D. Nhận dạng thực thể có tên riêng.

8. Đánh giá hiệu quả của mô hình dịch máy thường sử dụng độ đo nào sau đây?

A. Accuracy.
B. Precision.
C. BLEU score.
D. F1-score.

9. Trong NLP, `zero-shot learning` (học không mẫu) có nghĩa là gì?

A. Mô hình được huấn luyện mà không cần bất kỳ dữ liệu huấn luyện nào.
B. Mô hình có khả năng thực hiện các tác vụ hoặc phân loại các lớp mà nó chưa từng được huấn luyện trực tiếp trên dữ liệu của các lớp đó.
C. Mô hình được huấn luyện trên dữ liệu tổng hợp.
D. Mô hình chỉ được huấn luyện trên một lượng dữ liệu rất nhỏ.

10. Trong quá trình xây dựng chatbot, `intent recognition` (nhận dạng ý định) là bước quan trọng để làm gì?

A. Tạo ra câu trả lời tự nhiên và mạch lạc.
B. Xác định mục đích hoặc ý định của người dùng đằng sau câu hỏi hoặc yêu cầu của họ.
C. Lưu trữ lịch sử hội thoại với người dùng.
D. Đánh giá mức độ hài lòng của người dùng.

11. Trong ngữ cảnh của mô hình Transformer, `attention mechanism` (cơ chế chú ý) đóng vai trò gì?

A. Tăng tốc độ huấn luyện mô hình.
B. Cho phép mô hình tập trung vào các phần quan trọng nhất của dữ liệu đầu vào khi xử lý.
C. Giảm thiểu hiện tượng overfitting.
D. Chuẩn hóa dữ liệu đầu vào.

12. Thuật ngữ `stop words` trong NLP chỉ điều gì?

A. Các từ mang ý nghĩa quan trọng nhất trong văn bản.
B. Các từ phổ biến, ít mang lại thông tin ngữ nghĩa trong nhiều ngữ cảnh, và thường được loại bỏ.
C. Các từ khóa được sử dụng để tìm kiếm thông tin.
D. Các từ mới xuất hiện gần đây trong ngôn ngữ.

13. Ưu điểm chính của mô hình Transformer so với các mô hình RNN (Recurrent Neural Network) truyền thống trong NLP là gì?

A. Khả năng xử lý dữ liệu tuần tự tốt hơn.
B. Khả năng song song hóa tính toán tốt hơn, giúp huấn luyện nhanh hơn.
C. Yêu cầu ít dữ liệu huấn luyện hơn.
D. Độ chính xác trên các tác vụ phân loại văn bản cao hơn.

14. Trong NLP, `knowledge graph` (biểu đồ tri thức) được sử dụng để làm gì?

A. Biểu diễn văn bản dưới dạng đồ thị.
B. Lưu trữ và quản lý thông tin dưới dạng các thực thể và mối quan hệ giữa chúng, hỗ trợ suy luận và trả lời câu hỏi.
C. Phân tích mạng xã hội.
D. Trực quan hóa dữ liệu văn bản.

15. Trong NLP, `word sense disambiguation` (giải nghĩa từ đa nghĩa) là quá trình làm gì?

A. Loại bỏ các từ gây nhiễu trong văn bản.
B. Xác định nghĩa chính xác của một từ đa nghĩa trong ngữ cảnh cụ thể.
C. Tìm ra các từ đồng nghĩa và trái nghĩa.
D. Phân tích cấu trúc ngữ pháp của câu.

16. Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực khoa học máy tính tập trung vào điều gì?

A. Phát triển các thuật toán để giải các bài toán tối ưu hóa.
B. Xây dựng hệ thống máy tính có khả năng hiểu, diễn giải và tạo ra ngôn ngữ của con người.
C. Nghiên cứu về cấu trúc dữ liệu và thuật toán hiệu quả.
D. Phát triển phần cứng máy tính mạnh mẽ hơn.

17. Mục đích chính của việc `tách từ` (tokenization) trong NLP là gì?

A. Giảm kích thước dữ liệu văn bản.
B. Chia văn bản thành các đơn vị nhỏ hơn, thường là từ hoặc cụm từ, để máy tính có thể xử lý.
C. Tìm ra chủ đề chính của văn bản.
D. Chuyển đổi văn bản sang dạng số.

18. Kỹ thuật `transfer learning` (học chuyển giao) có lợi ích gì trong NLP?

A. Tăng tốc độ suy luận của mô hình.
B. Cho phép sử dụng mô hình đã được huấn luyện trên một lượng lớn dữ liệu cho các tác vụ mới với dữ liệu hạn chế hơn.
C. Giảm độ phức tạp của mô hình.
D. Cải thiện khả năng diễn giải của mô hình.

19. Phương pháp `stemming` và `lemmatization` trong NLP có chung mục đích gì?

A. Phân tích cấu trúc ngữ pháp của câu.
B. Tìm ra các thực thể có tên riêng trong văn bản.
C. Chuẩn hóa các từ về dạng gốc của chúng.
D. Đếm tần suất xuất hiện của các từ trong văn bản.

20. Trong NLP, `parsing` (phân tích cú pháp) là quá trình làm gì?

A. Tìm ra các từ khóa quan trọng trong văn bản.
B. Phân tích cấu trúc ngữ pháp của câu và xác định vai trò của từng từ trong câu.
C. Dịch câu từ ngôn ngữ này sang ngôn ngữ khác.
D. Tóm tắt nội dung chính của văn bản.

21. Vấn đề `ambiguity` (đa nghĩa) trong ngôn ngữ tự nhiên gây khó khăn gì cho NLP?

A. Làm giảm tốc độ xử lý văn bản.
B. Khiến máy tính khó hiểu đúng ý nghĩa của văn bản do một từ hoặc cụm từ có thể có nhiều nghĩa.
C. Tăng kích thước dữ liệu văn bản.
D. Gây khó khăn trong việc loại bỏ stop words.

22. Phương pháp TF-IDF được sử dụng để làm gì trong NLP?

A. Phân tích cảm xúc văn bản.
B. Đo lường tầm quan trọng của một từ trong một tài liệu so với một tập hợp các tài liệu.
C. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
D. Tạo ra các vector biểu diễn từ.

23. Ứng dụng nào sau đây thể hiện khả năng `Natural Language Generation` (NLG) của NLP?

A. Phân loại tin nhắn spam.
B. Tự động tóm tắt văn bản thành đoạn văn bản ngắn gọn hơn.
C. Nhận dạng giọng nói thành văn bản.
D. Tìm kiếm thông tin trên web bằng từ khóa.

24. Khái niệm `n-gram` trong NLP dùng để chỉ điều gì?

A. Một phương pháp biểu diễn từ thành vector số.
B. Một chuỗi gồm n từ liên tiếp trong văn bản.
C. Một loại mô hình ngôn ngữ dựa trên mạng nơ-ron.
D. Một kỹ thuật loại bỏ nhiễu trong dữ liệu văn bản.

25. Một trong những thách thức lớn hiện nay trong NLP là xử lý ngôn ngữ mang tính `sarcasm` (mỉa mai) hoặc `irony` (châm biếm). Tại sao?

A. Vì sarcasm và irony thường sử dụng ngôn ngữ hình thể.
B. Vì ý nghĩa bề mặt của câu chữ trái ngược với ý nghĩa thực sự muốn truyền đạt, đòi hỏi khả năng hiểu ngữ cảnh và ý định sâu sắc.
C. Vì sarcasm và irony hiếm khi xuất hiện trong văn bản.
D. Vì các mô hình NLP hiện tại không đủ mạnh mẽ để xử lý ngôn ngữ.

26. Độ đo `perplexity` thường được sử dụng để đánh giá điều gì trong mô hình ngôn ngữ?

A. Độ chính xác của mô hình trong việc phân loại văn bản.
B. Khả năng dự đoán từ tiếp theo của mô hình ngôn ngữ; perplexity càng thấp, mô hình càng tốt.
C. Tốc độ huấn luyện của mô hình.
D. Kích thước của mô hình ngôn ngữ.

27. Kỹ thuật `topic modeling` (mô hình hóa chủ đề) trong NLP được sử dụng để làm gì?

A. Phân loại văn bản theo thể loại.
B. Tìm ra các chủ đề ẩn trong một tập hợp văn bản lớn.
C. Dịch văn bản sang nhiều ngôn ngữ khác nhau.
D. Đánh giá mức độ tin cậy của thông tin trong văn bản.

28. Mô hình ngôn ngữ (Language Model) trong NLP được sử dụng để làm gì?

A. Phân loại văn bản theo chủ đề.
B. Dự đoán từ tiếp theo trong một chuỗi văn bản.
C. Trích xuất thông tin từ văn bản.
D. Đánh giá mức độ tích cực hay tiêu cực của văn bản.

29. Thách thức nào sau đây đặc biệt lớn đối với NLP khi xử lý ngôn ngữ tiếng Việt so với tiếng Anh?

A. Số lượng từ vựng ít hơn.
B. Ngữ pháp đơn giản hơn.
C. Tính đa dạng về phương ngữ và cách diễn đạt vùng miền.
D. Ít tài liệu và nguồn dữ liệu huấn luyện hơn.

30. Phương pháp `Bag-of-Words` biểu diễn văn bản như thế nào?

A. Bằng cách giữ nguyên thứ tự từ trong câu.
B. Bằng cách tạo ra một vector tần số từ, bỏ qua thứ tự từ và chỉ đếm số lần xuất hiện của mỗi từ.
C. Bằng cách sử dụng mạng nơ-ron để học biểu diễn văn bản.
D. Bằng cách mã hóa văn bản thành chuỗi nhị phân.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

1. Ứng dụng nào sau đây KHÔNG phải là ứng dụng của Xử lý ngôn ngữ tự nhiên (NLP)?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

2. Mạng nơ-ron hồi quy (RNN) đặc biệt phù hợp với dữ liệu ngôn ngữ tự nhiên vì lý do gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

3. Mục tiêu của 'semantic analysis' (phân tích ngữ nghĩa) trong NLP là gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

4. Kỹ thuật 'Named Entity Recognition' (NER) trong NLP nhằm mục đích gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

5. Công đoạn nào sau đây KHÔNG thuộc quy trình tiền xử lý văn bản (text preprocessing) thường gặp trong NLP?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

6. Phương pháp nào sau đây thuộc nhóm kỹ thuật 'word embeddings' trong NLP?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

7. Ứng dụng nào sau đây của NLP có thể hỗ trợ trong việc phát hiện tin giả (fake news)?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

8. Đánh giá hiệu quả của mô hình dịch máy thường sử dụng độ đo nào sau đây?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

9. Trong NLP, 'zero-shot learning' (học không mẫu) có nghĩa là gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

10. Trong quá trình xây dựng chatbot, 'intent recognition' (nhận dạng ý định) là bước quan trọng để làm gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

11. Trong ngữ cảnh của mô hình Transformer, 'attention mechanism' (cơ chế chú ý) đóng vai trò gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

12. Thuật ngữ 'stop words' trong NLP chỉ điều gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

13. Ưu điểm chính của mô hình Transformer so với các mô hình RNN (Recurrent Neural Network) truyền thống trong NLP là gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

14. Trong NLP, 'knowledge graph' (biểu đồ tri thức) được sử dụng để làm gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

15. Trong NLP, 'word sense disambiguation' (giải nghĩa từ đa nghĩa) là quá trình làm gì?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

16. Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực khoa học máy tính tập trung vào điều gì?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

17. Mục đích chính của việc 'tách từ' (tokenization) trong NLP là gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

18. Kỹ thuật 'transfer learning' (học chuyển giao) có lợi ích gì trong NLP?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

19. Phương pháp 'stemming' và 'lemmatization' trong NLP có chung mục đích gì?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

20. Trong NLP, 'parsing' (phân tích cú pháp) là quá trình làm gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

21. Vấn đề 'ambiguity' (đa nghĩa) trong ngôn ngữ tự nhiên gây khó khăn gì cho NLP?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

22. Phương pháp TF-IDF được sử dụng để làm gì trong NLP?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

23. Ứng dụng nào sau đây thể hiện khả năng 'Natural Language Generation' (NLG) của NLP?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

24. Khái niệm 'n-gram' trong NLP dùng để chỉ điều gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

25. Một trong những thách thức lớn hiện nay trong NLP là xử lý ngôn ngữ mang tính 'sarcasm' (mỉa mai) hoặc 'irony' (châm biếm). Tại sao?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

26. Độ đo 'perplexity' thường được sử dụng để đánh giá điều gì trong mô hình ngôn ngữ?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

27. Kỹ thuật 'topic modeling' (mô hình hóa chủ đề) trong NLP được sử dụng để làm gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

28. Mô hình ngôn ngữ (Language Model) trong NLP được sử dụng để làm gì?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

29. Thách thức nào sau đây đặc biệt lớn đối với NLP khi xử lý ngôn ngữ tiếng Việt so với tiếng Anh?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 1

30. Phương pháp 'Bag-of-Words' biểu diễn văn bản như thế nào?