Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên – Đề 8

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Đề 8 - Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

1. Kỹ thuật `topic modeling` (mô hình chủ đề) như LDA (Latent Dirichlet Allocation) được sử dụng để làm gì trong NLP?

A. Phân loại văn bản theo chủ đề định trước
B. Khám phá và xác định các chủ đề ẩn trong tập hợp văn bản
C. Tóm tắt văn bản theo chủ đề
D. Dịch văn bản theo chủ đề

2. Kỹ thuật `Backtranslation` (dịch ngược) thường được sử dụng để làm gì trong NLP?

A. Đánh giá chất lượng bản dịch máy
B. Tăng cường dữ liệu huấn luyện cho dịch máy
C. Phát hiện ngôn ngữ của văn bản
D. Tóm tắt văn bản đa ngôn ngữ

3. Trong đánh giá hệ thống dịch máy, `BLEU score` (Bilingual Evaluation Understudy score) đo lường điều gì?

A. Tốc độ dịch
B. Độ trôi chảy của bản dịch
C. Mức độ tương đồng giữa bản dịch máy và bản dịch tham khảo của con người
D. Khả năng xử lý ngôn ngữ đa ngôn ngữ

4. Ưu điểm chính của việc sử dụng mô hình ngôn ngữ tiền huấn luyện (pre-trained language model) như BERT hoặc GPT là gì?

A. Giảm thời gian suy luận (inference time)
B. Cần ít dữ liệu huấn luyện hơn cho các nhiệm vụ cụ thể
C. Độ chính xác tuyệt đối trên mọi nhiệm vụ NLP
D. Dễ dàng giải thích kết quả dự đoán

5. Trong lĩnh vực phân tích tình cảm (sentiment analysis), `aspect-based sentiment analysis` (phân tích tình cảm dựa trên khía cạnh) khác biệt với phân tích tình cảm thông thường như thế nào?

A. Chỉ áp dụng cho văn bản tiếng Anh
B. Phân tích tình cảm cho từng khía cạnh cụ thể của đối tượng được nhắc đến, thay vì toàn bộ văn bản
C. Sử dụng từ điển tình cảm thay vì mô hình học máy
D. Chỉ xác định tình cảm tích cực hoặc tiêu cực, không xác định trung lập

6. Thách thức nào sau đây KHÔNG phải là thách thức lớn trong nghiên cứu và ứng dụng NLP hiện nay?

A. Xử lý ngôn ngữ đa nghĩa và ẩn dụ
B. Thiếu dữ liệu huấn luyện cho hầu hết các ngôn ngữ
C. Khả năng hiểu `ngữ cảnh chung` và `kiến thức thế giới` của máy
D. Tốc độ xử lý văn bản quá chậm

7. Trong các mô hình word embedding, Word2Vec (Skip-gram và CBOW) học biểu diễn từ dựa trên nguyên tắc nào?

A. Tần suất xuất hiện của từ trong văn bản
B. Ngữ cảnh xuất hiện của từ (các từ xung quanh)
C. Cấu trúc ngữ pháp của câu chứa từ
D. Mối quan hệ đồng nghĩa và trái nghĩa giữa các từ

8. Thuật ngữ `n-gram` trong NLP đề cập đến điều gì?

A. Một loại mô hình mạng nơ-ron đặc biệt
B. Một chuỗi gồm n từ liên tiếp trong văn bản
C. Một phương pháp mã hóa ký tự
D. Một kỹ thuật giảm nhiễu trong dữ liệu văn bản

9. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu trong biểu diễn từ (word embeddings)?

A. Mã hóa One-hot
B. TF-IDF
C. Phân tích thành phần chính (PCA)
D. Bag-of-Words

10. Phương pháp `Chunking` (phân đoạn) trong NLP nhằm mục đích gì?

A. Phân chia văn bản thành các câu
B. Nhóm các từ liên tiếp thành các cụm từ ngữ pháp (chunks) như cụm danh từ, cụm động từ
C. Loại bỏ các từ không quan trọng
D. Tìm kiếm các từ khóa trong văn bản

11. Mục tiêu chính của việc `token hóa` (tokenization) trong NLP là gì?

A. Chuyển đổi văn bản thành giọng nói
B. Chia văn bản thành các đơn vị nhỏ hơn, có ý nghĩa (ví dụ: từ, cụm từ)
C. Loại bỏ các từ dừng (stop words) khỏi văn bản
D. Tìm kiếm các thực thể có tên (named entities) trong văn bản

12. Khó khăn chính trong việc xử lý ngôn ngữ tự nhiên đối với các ngôn ngữ `nguồn tài nguyên thấp` (low-resource languages) là gì?

A. Thiếu các thuật toán NLP phù hợp
B. Ít dữ liệu văn bản được gán nhãn để huấn luyện mô hình
C. Cấu trúc ngữ pháp quá phức tạp
D. Không có đủ chuyên gia NLP cho các ngôn ngữ này

13. Trong xử lý ngôn ngữ hình thái học (morphological processing), `lemmatization` khác với `stemming` ở điểm nào?

A. Lemmatization nhanh hơn stemming
B. Lemmatization trả về từ gốc có nghĩa (lemma), trong khi stemming có thể trả về gốc từ không có nghĩa
C. Lemmatization chỉ áp dụng cho tiếng Anh, stemming áp dụng cho nhiều ngôn ngữ
D. Lemmatization loại bỏ stop words, stemming thì không

14. Ứng dụng nào sau đây thể hiện sự kết hợp giữa NLP và Thị giác máy tính (Computer Vision)?

A. Phân tích tình cảm văn bản trên mạng xã hội
B. Chú thích ảnh tự động (Image captioning)
C. Chatbot hỗ trợ khách hàng trực tuyến
D. Công cụ kiểm tra đạo văn

15. Trong quy trình xây dựng một hệ thống NLP, bước `feature engineering` (kỹ thuật đặc trưng) đóng vai trò gì?

A. Thu thập dữ liệu văn bản
B. Lựa chọn và biến đổi dữ liệu đầu vào thành các đặc trưng số học phù hợp để mô hình học máy có thể xử lý
C. Đánh giá hiệu suất mô hình
D. Triển khai mô hình vào ứng dụng thực tế

16. Mục đích của việc sử dụng `stop word removal` (loại bỏ từ dừng) trong tiền xử lý văn bản là gì?

A. Tăng cường ý nghĩa của văn bản
B. Giảm kích thước dữ liệu và tăng hiệu quả xử lý
C. Phát hiện các thực thể có tên
D. Chuẩn hóa văn bản về dạng viết thường

17. Kỹ thuật `dependency parsing` (phân tích cú pháp phụ thuộc) trong NLP giúp xác định điều gì?

A. Chủ đề chính của văn bản
B. Mối quan hệ ngữ pháp phụ thuộc giữa các từ trong câu
C. Nghĩa của từ trong ngữ cảnh
D. Tình cảm thể hiện trong văn bản

18. Nhiệm vụ nào sau đây KHÔNG thuộc lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP)?

A. Phân tích tình cảm văn bản
B. Dịch máy
C. Nhận dạng khuôn mặt
D. Tóm tắt văn bản

19. Phương pháp `TF-IDF` (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì trong NLP?

A. Phân tích cú pháp câu
B. Tính trọng số của từ trong một văn bản và trong tập hợp văn bản
C. Xác định chủ đề chính của văn bản
D. Dịch văn bản tự động

20. Trong ngữ cảnh của mô hình Transformer, `attention mechanism` (cơ chế chú ý) có vai trò chính là gì?

A. Tăng tốc độ huấn luyện mô hình
B. Giảm thiểu hiện tượng `vanishing gradients`
C. Cho phép mô hình tập trung vào các phần quan trọng nhất của dữ liệu đầu vào khi xử lý
D. Cải thiện khả năng xử lý dữ liệu tuần tự của mô hình

21. Trong lĩnh vực sinh tổng hợp ngôn ngữ tự nhiên (NLG), `coherence` (tính mạch lạc) đề cập đến khía cạnh nào của văn bản được tạo ra?

A. Tính đúng ngữ pháp
B. Sự liên kết logic và ý nghĩa giữa các câu, đoạn văn
C. Sự đa dạng về từ vựng
D. Tính trôi chảy và tự nhiên của ngôn ngữ

22. Trong mô hình ngôn ngữ, `perplexity` được dùng để đánh giá điều gì?

A. Tốc độ huấn luyện mô hình
B. Độ chính xác của mô hình trong việc dự đoán từ tiếp theo
C. Mức độ phức tạp của mô hình
D. Khả năng khái quát hóa của mô hình trên dữ liệu mới

23. Kỹ thuật `Named Entity Recognition` (NER) trong NLP dùng để làm gì?

A. Phân loại văn bản theo chủ đề
B. Nhận diện và phân loại các thực thể có tên (ví dụ: tên người, tổ chức, địa điểm)
C. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác
D. Tóm tắt nội dung chính của văn bản

24. Trong ngữ cảnh của chatbot, `intent recognition` (nhận diện ý định) là quá trình xác định điều gì?

A. Tình cảm của người dùng
B. Mục đích hoặc mong muốn của người dùng khi đưa ra câu lệnh
C. Ngôn ngữ mà người dùng đang sử dụng
D. Thông tin cá nhân của người dùng

25. Ứng dụng nào sau đây KHÔNG phải là ứng dụng trực tiếp của NLP?

A. Chatbot
B. Hệ thống khuyến nghị sản phẩm
C. Công cụ kiểm tra chính tả
D. Phần mềm dịch thuật

26. Mô hình `Encoder-Decoder` thường được sử dụng trong nhiệm vụ NLP nào?

A. Phân loại văn bản
B. Dịch máy và tóm tắt văn bản
C. Phân tích tình cảm
D. Nhận diện thực thể có tên

27. Mô hình ngôn ngữ Transformer vượt trội hơn các mô hình RNN (Recurrent Neural Network) truyền thống trong việc xử lý dữ liệu tuần tự chủ yếu nhờ yếu tố nào?

A. Khả năng xử lý song song các phần của chuỗi đầu vào
B. Sử dụng nhiều lớp mạng nơ-ron hơn
C. Kích thước từ vựng lớn hơn
D. Sử dụng hàm kích hoạt phức tạp hơn

28. Phương pháp `Stemming` trong NLP có thể dẫn đến nhược điểm nào?

A. Tăng kích thước từ vựng
B. Mất thông tin về nghĩa của từ do rút gọn quá mức
C. Giảm tốc độ xử lý văn bản
D. Khó khăn trong việc xử lý ngôn ngữ đa ngôn ngữ

29. Kỹ thuật `Word Sense Disambiguation` (WSD) trong NLP nhằm mục đích gì?

A. Phân loại văn bản theo chủ đề
B. Xác định nghĩa đúng của một từ trong ngữ cảnh cụ thể
C. Tạo ra các từ đồng nghĩa
D. Phát hiện lỗi chính tả trong văn bản

30. Phương pháp biểu diễn văn bản `Bag-of-Words` có nhược điểm chính nào?

A. Không thể xử lý văn bản dài
B. Mất thông tin về thứ tự và ngữ pháp của từ trong câu
C. Khó khăn trong việc xử lý tiếng Anh
D. Yêu cầu lượng lớn dữ liệu huấn luyện

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

1. Kỹ thuật 'topic modeling' (mô hình chủ đề) như LDA (Latent Dirichlet Allocation) được sử dụng để làm gì trong NLP?

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

2. Kỹ thuật 'Backtranslation' (dịch ngược) thường được sử dụng để làm gì trong NLP?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

3. Trong đánh giá hệ thống dịch máy, 'BLEU score' (Bilingual Evaluation Understudy score) đo lường điều gì?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

4. Ưu điểm chính của việc sử dụng mô hình ngôn ngữ tiền huấn luyện (pre-trained language model) như BERT hoặc GPT là gì?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

5. Trong lĩnh vực phân tích tình cảm (sentiment analysis), 'aspect-based sentiment analysis' (phân tích tình cảm dựa trên khía cạnh) khác biệt với phân tích tình cảm thông thường như thế nào?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

6. Thách thức nào sau đây KHÔNG phải là thách thức lớn trong nghiên cứu và ứng dụng NLP hiện nay?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

7. Trong các mô hình word embedding, Word2Vec (Skip-gram và CBOW) học biểu diễn từ dựa trên nguyên tắc nào?

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

8. Thuật ngữ 'n-gram' trong NLP đề cập đến điều gì?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

9. Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu trong biểu diễn từ (word embeddings)?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

10. Phương pháp 'Chunking' (phân đoạn) trong NLP nhằm mục đích gì?

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

11. Mục tiêu chính của việc 'token hóa' (tokenization) trong NLP là gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

12. Khó khăn chính trong việc xử lý ngôn ngữ tự nhiên đối với các ngôn ngữ 'nguồn tài nguyên thấp' (low-resource languages) là gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

13. Trong xử lý ngôn ngữ hình thái học (morphological processing), 'lemmatization' khác với 'stemming' ở điểm nào?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

14. Ứng dụng nào sau đây thể hiện sự kết hợp giữa NLP và Thị giác máy tính (Computer Vision)?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

15. Trong quy trình xây dựng một hệ thống NLP, bước 'feature engineering' (kỹ thuật đặc trưng) đóng vai trò gì?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

16. Mục đích của việc sử dụng 'stop word removal' (loại bỏ từ dừng) trong tiền xử lý văn bản là gì?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

17. Kỹ thuật 'dependency parsing' (phân tích cú pháp phụ thuộc) trong NLP giúp xác định điều gì?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

18. Nhiệm vụ nào sau đây KHÔNG thuộc lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP)?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

19. Phương pháp 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì trong NLP?

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

20. Trong ngữ cảnh của mô hình Transformer, 'attention mechanism' (cơ chế chú ý) có vai trò chính là gì?

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

21. Trong lĩnh vực sinh tổng hợp ngôn ngữ tự nhiên (NLG), 'coherence' (tính mạch lạc) đề cập đến khía cạnh nào của văn bản được tạo ra?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

22. Trong mô hình ngôn ngữ, 'perplexity' được dùng để đánh giá điều gì?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

23. Kỹ thuật 'Named Entity Recognition' (NER) trong NLP dùng để làm gì?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

24. Trong ngữ cảnh của chatbot, 'intent recognition' (nhận diện ý định) là quá trình xác định điều gì?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

25. Ứng dụng nào sau đây KHÔNG phải là ứng dụng trực tiếp của NLP?

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

26. Mô hình 'Encoder-Decoder' thường được sử dụng trong nhiệm vụ NLP nào?

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

27. Mô hình ngôn ngữ Transformer vượt trội hơn các mô hình RNN (Recurrent Neural Network) truyền thống trong việc xử lý dữ liệu tuần tự chủ yếu nhờ yếu tố nào?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

28. Phương pháp 'Stemming' trong NLP có thể dẫn đến nhược điểm nào?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

29. Kỹ thuật 'Word Sense Disambiguation' (WSD) trong NLP nhằm mục đích gì?

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 6

30. Phương pháp biểu diễn văn bản 'Bag-of-Words' có nhược điểm chính nào?