Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên – Đề 3

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Đề 3 - Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

1. Ứng dụng nào sau đây thường sử dụng coreference resolution?

A. Phân loại email spam.
B. Trả lời câu hỏi tự động và trích xuất thông tin.
C. Dịch văn bản theo thời gian thực.
D. Phân tích độ phổ biến của từ khóa trên mạng xã hội.

2. Thuật toán nào sau đây là một ví dụ phổ biến của phương pháp topic modeling?

A. Support Vector Machine (SVM).
B. Latent Dirichlet Allocation (LDA).
C. K-Nearest Neighbors (KNN).
D. Decision Tree.

3. Trong NLP, `coreference resolution` là gì?

A. Giải quyết vấn đề ngôn ngữ đa nghĩa.
B. Xác định tất cả các tham chiếu đến cùng một thực thể trong văn bản.
C. Phân giải cấu trúc cú pháp phức tạp.
D. Giải quyết các lỗi chính tả và ngữ pháp.

4. Trong bối cảnh của chatbot, `intent recognition` là gì?

A. Khả năng chatbot tạo ra câu trả lời tự nhiên và mạch lạc.
B. Quá trình chatbot hiểu được mục đích hoặc ý định của người dùng đằng sau câu hỏi hoặc yêu cầu.
C. Kỹ thuật chatbot ghi nhớ lịch sử hội thoại.
D. Phương pháp chatbot xử lý các ngôn ngữ khác nhau.

5. Trong phân tích cảm xúc (sentiment analysis), `polarity` đề cập đến điều gì?

A. Cường độ cảm xúc (mạnh hay yếu).
B. Loại cảm xúc (ví dụ: vui, buồn, tức giận).
C. Hướng cảm xúc (tích cực, tiêu cực, trung lập).
D. Sự thay đổi cảm xúc theo thời gian.

6. Chỉ số đánh giá BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá chất lượng của hệ thống nào?

A. Hệ thống phân loại văn bản.
B. Hệ thống dịch máy.
C. Hệ thống chatbot.
D. Hệ thống tóm tắt văn bản.

7. Trong ngữ cảnh của mô hình ngôn ngữ, `perplexity` là gì?

A. Độ phức tạp của thuật toán mô hình.
B. Đo lường khả năng mô hình dự đoán chính xác chuỗi văn bản.
C. Số lượng tham số trong mô hình.
D. Thời gian huấn luyện mô hình.

8. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của NLP?

A. Dự báo thời tiết.
B. Phân tích cảm xúc.
C. Chatbot.
D. Dịch máy.

9. Phương pháp nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại văn bản?

A. Perplexity.
B. BLEU score.
C. Accuracy, Precision, Recall, F1-score.
D. ROUGE score.

10. Thuật ngữ `n-gram` trong NLP đề cập đến điều gì?

A. Một loại mô hình mạng nơ-ron.
B. Chuỗi n từ liên tiếp trong văn bản.
C. Một phương pháp giảm chiều dữ liệu văn bản.
D. Một kỹ thuật để xử lý ngôn ngữ ký hiệu.

11. Trong NLP, `part-of-speech tagging` (POS tagging) là quá trình gì?

A. Phân tích ý nghĩa của câu.
B. Gán nhãn từ loại (ví dụ: danh từ, động từ, tính từ) cho mỗi từ trong câu.
C. Chia câu thành các cụm từ.
D. Loại bỏ các từ không quan trọng trong câu.

12. Mô hình `Recurrent Neural Network` (RNN) đặc biệt phù hợp với tác vụ NLP nào?

A. Phân loại hình ảnh.
B. Xử lý dữ liệu chuỗi tuần tự như văn bản.
C. Phát hiện đối tượng trong video.
D. Dự báo giá cổ phiếu.

13. Cơ chế `attention` trong mô hình Transformer giúp giải quyết vấn đề gì của RNN trong xử lý chuỗi dài?

A. Vấn đề vanishing gradient.
B. Khả năng song song hóa tính toán.
C. Khả năng nắm bắt sự phụ thuộc xa trong chuỗi.
D. Tốc độ huấn luyện chậm.

14. Mục đích của `stop word removal` trong tiền xử lý văn bản là gì?

A. Tăng độ dài của văn bản để cải thiện hiệu suất mô hình.
B. Loại bỏ các từ phổ biến, ít mang lại thông tin ngữ nghĩa cho một số tác vụ NLP.
C. Thay thế các từ đồng nghĩa để chuẩn hóa văn bản.
D. Phân tích cảm xúc của văn bản.

15. Kỹ thuật `Named Entity Recognition` (NER) trong NLP nhằm mục đích gì?

A. Phân tích cấu trúc ngữ pháp của câu.
B. Xác định và phân loại các thực thể có tên trong văn bản (ví dụ: tên người, tổ chức, địa điểm).
C. Tạo ra tóm tắt văn bản.
D. Dịch văn bản sang ngôn ngữ khác.

16. Giải pháp nào sau đây KHÔNG thường được sử dụng để xử lý vấn đề OOV?

A. Sử dụng subword tokenization (ví dụ: Byte Pair Encoding).
B. Mở rộng từ vựng huấn luyện.
C. Thay thế từ OOV bằng một token đặc biệt (ví dụ: ).
D. Loại bỏ tất cả các từ ít xuất hiện trong dữ liệu huấn luyện.

17. Phương pháp `topic modeling` trong NLP nhằm mục đích gì?

A. Phân loại văn bản theo chủ đề định trước.
B. Khám phá các chủ đề ẩn trong một tập hợp văn bản.
C. Tóm tắt văn bản theo chủ đề.
D. Dịch văn bản sang ngôn ngữ khác theo chủ đề.

18. Mục tiêu chính của `machine translation` là gì?

A. Phân tích cảm xúc của văn bản nguồn.
B. Chuyển đổi văn bản từ ngôn ngữ nguồn sang ngôn ngữ đích một cách tự động.
C. Tóm tắt nội dung văn bản nguồn.
D. Nhận dạng thực thể có tên trong văn bản nguồn.

19. Kỹ thuật `dependency parsing` trong NLP tập trung vào việc gì?

A. Tìm ra các thực thể có tên trong câu.
B. Xác định mối quan hệ phụ thuộc giữa các từ trong câu để phân tích cấu trúc cú pháp.
C. Phân loại câu theo chủ đề.
D. Dự đoán từ tiếp theo trong chuỗi văn bản.

20. Trong NLP, `contextual word embedding` (ví dụ: BERT, ELMo) khác biệt so với `word embedding` truyền thống (ví dụ: Word2Vec) như thế nào?

A. Contextual word embedding chỉ hoạt động với tiếng Anh.
B. Contextual word embedding tạo ra biểu diễn vector duy nhất cho mỗi từ, bất kể ngữ cảnh.
C. Contextual word embedding tạo ra biểu diễn vector khác nhau cho cùng một từ tùy thuộc vào ngữ cảnh sử dụng.
D. Word embedding truyền thống không thể xử lý từ ngoài từ vựng (out-of-vocabulary words).

21. Mô hình ngôn ngữ `BERT` (Bidirectional Encoder Representations from Transformers) nổi tiếng với khả năng gì?

A. Khả năng sinh văn bản sáng tạo.
B. Khả năng hiểu ngữ cảnh hai chiều của từ trong câu.
C. Khả năng dịch văn bản sang nhiều ngôn ngữ cùng lúc.
D. Khả năng tóm tắt văn bản dài thành văn bản ngắn hơn.

22. Kỹ thuật `stemming` trong NLP có mục đích chính là gì?

A. Chuyển đổi văn bản sang dạng chữ thường.
B. Tìm dạng nguyên gốc (lemma) của từ.
C. Rút gọn từ về dạng gốc bằng cách loại bỏ các hậu tố và tiền tố.
D. Phân loại văn bản theo chủ đề.

23. Vấn đề `out-of-vocabulary` (OOV) trong NLP đề cập đến điều gì?

A. Vấn đề xử lý văn bản có quá nhiều từ phức tạp.
B. Vấn đề khi mô hình gặp phải các từ không có trong từ vựng huấn luyện.
C. Vấn đề khi mô hình dự đoán sai từ loại.
D. Vấn đề khi mô hình không thể xử lý ngôn ngữ đa nghĩa.

24. Phương pháp nào sau đây KHÔNG thuộc về kỹ thuật `word embedding`?

A. Word2Vec
B. GloVe
C. TF-IDF
D. FastText

25. Trong NLP, `Bag of Words` (BoW) là gì?

A. Một mô hình ngôn ngữ phức tạp dựa trên mạng nơ-ron sâu.
B. Một phương pháp biểu diễn văn bản bằng cách đếm tần suất xuất hiện của từ, bỏ qua thứ tự từ.
C. Một kỹ thuật để tạo ra các câu văn có nghĩa.
D. Một thuật toán để dịch ngôn ngữ tự động.

26. Trong Xử lý ngôn ngữ tự nhiên (NLP), `tokenization` đề cập đến quá trình nào?

A. Phân tích cú pháp câu để xác định cấu trúc ngữ pháp.
B. Chia văn bản thành các đơn vị nhỏ hơn, thường là từ hoặc cụm từ.
C. Gán nhãn từ loại (POS tagging) cho mỗi từ trong câu.
D. Loại bỏ các từ dừng (stop words) khỏi văn bản.

27. Sự khác biệt chính giữa `stemming` và `lemmatization` trong NLP là gì?

A. Stemming phức tạp hơn lemmatization.
B. Lemmatization luôn tạo ra một từ có nghĩa, trong khi stemming có thể không.
C. Stemming sử dụng từ điển, còn lemmatization thì không.
D. Lemmatization nhanh hơn stemming.

28. Trong NLP, `zero-shot learning` đề cập đến khả năng gì của mô hình?

A. Khả năng học mà không cần dữ liệu huấn luyện.
B. Khả năng nhận biết và phân loại các chủ đề chưa từng gặp trong dữ liệu huấn luyện.
C. Khả năng học từ dữ liệu không có nhãn.
D. Khả năng thích ứng nhanh chóng với ngôn ngữ mới.

29. Ưu điểm chính của mô hình Transformer so với RNN trong NLP là gì?

A. Transformer có khả năng xử lý chuỗi tuần tự tốt hơn RNN.
B. Transformer có thể song song hóa tính toán, giúp huấn luyện nhanh hơn.
C. RNN yêu cầu ít dữ liệu huấn luyện hơn Transformer.
D. RNN ít phức tạp hơn Transformer.

30. Phương pháp `transfer learning` trong NLP mang lại lợi ích gì?

A. Giảm độ phức tạp của mô hình.
B. Tăng tốc độ xử lý văn bản.
C. Cho phép sử dụng kiến thức đã học từ một tác vụ hoặc tập dữ liệu lớn để cải thiện hiệu suất trên tác vụ khác với dữ liệu hạn chế.
D. Cải thiện khả năng xử lý đa ngôn ngữ.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

1. Ứng dụng nào sau đây thường sử dụng coreference resolution?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

2. Thuật toán nào sau đây là một ví dụ phổ biến của phương pháp topic modeling?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

3. Trong NLP, 'coreference resolution' là gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

4. Trong bối cảnh của chatbot, 'intent recognition' là gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

5. Trong phân tích cảm xúc (sentiment analysis), 'polarity' đề cập đến điều gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

6. Chỉ số đánh giá BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá chất lượng của hệ thống nào?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

7. Trong ngữ cảnh của mô hình ngôn ngữ, 'perplexity' là gì?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

8. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của NLP?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

9. Phương pháp nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại văn bản?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

10. Thuật ngữ 'n-gram' trong NLP đề cập đến điều gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

11. Trong NLP, 'part-of-speech tagging' (POS tagging) là quá trình gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

12. Mô hình 'Recurrent Neural Network' (RNN) đặc biệt phù hợp với tác vụ NLP nào?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

13. Cơ chế 'attention' trong mô hình Transformer giúp giải quyết vấn đề gì của RNN trong xử lý chuỗi dài?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

14. Mục đích của 'stop word removal' trong tiền xử lý văn bản là gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

15. Kỹ thuật 'Named Entity Recognition' (NER) trong NLP nhằm mục đích gì?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

16. Giải pháp nào sau đây KHÔNG thường được sử dụng để xử lý vấn đề OOV?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

17. Phương pháp 'topic modeling' trong NLP nhằm mục đích gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

18. Mục tiêu chính của 'machine translation' là gì?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

19. Kỹ thuật 'dependency parsing' trong NLP tập trung vào việc gì?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

20. Trong NLP, 'contextual word embedding' (ví dụ: BERT, ELMo) khác biệt so với 'word embedding' truyền thống (ví dụ: Word2Vec) như thế nào?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

21. Mô hình ngôn ngữ 'BERT' (Bidirectional Encoder Representations from Transformers) nổi tiếng với khả năng gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

22. Kỹ thuật 'stemming' trong NLP có mục đích chính là gì?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

23. Vấn đề 'out-of-vocabulary' (OOV) trong NLP đề cập đến điều gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

24. Phương pháp nào sau đây KHÔNG thuộc về kỹ thuật 'word embedding'?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

25. Trong NLP, 'Bag of Words' (BoW) là gì?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

26. Trong Xử lý ngôn ngữ tự nhiên (NLP), 'tokenization' đề cập đến quá trình nào?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

27. Sự khác biệt chính giữa 'stemming' và 'lemmatization' trong NLP là gì?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

28. Trong NLP, 'zero-shot learning' đề cập đến khả năng gì của mô hình?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

29. Ưu điểm chính của mô hình Transformer so với RNN trong NLP là gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 3

30. Phương pháp 'transfer learning' trong NLP mang lại lợi ích gì?