Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên – Đề 11

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Đề 11 - Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

1. Trong NLP, `knowledge graph` (đồ thị tri thức) được sử dụng để:

A. Biểu diễn mối quan hệ giữa các từ trong từ vựng.
B. Biểu diễn tri thức về thế giới thực dưới dạng đồ thị, với các nút là thực thể và cạnh là mối quan hệ giữa chúng.
C. Phân tích cấu trúc ngữ pháp của văn bản.
D. Mô hình hóa quá trình suy luận logic.

2. Mục tiêu chính của việc `token hóa` (tokenization) trong NLP là gì?

A. Loại bỏ các từ dừng (stop words).
B. Chia văn bản thành các đơn vị nhỏ hơn, có ý nghĩa.
C. Chuẩn hóa văn bản về dạng chữ thường.
D. Tìm gốc từ (stemming) của các từ.

3. Ứng dụng nào sau đây KHÔNG phải là ứng dụng trực tiếp của NLP?

A. Dịch máy (Machine Translation).
B. Phân tích chứng khoán tự động.
C. Trợ lý ảo (Chatbots).
D. Phân loại email spam.

4. Kỹ thuật `transfer learning` (học chuyển giao) được ứng dụng trong NLP như thế nào?

A. Để dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
B. Để sử dụng kiến thức đã học từ một tác vụ NLP (ví dụ: mô hình ngôn ngữ huấn luyện trên tập dữ liệu lớn) cho một tác vụ khác hoặc trên một tập dữ liệu nhỏ hơn.
C. Để tóm tắt văn bản dài thành văn bản ngắn hơn.
D. Để tạo ra văn bản mới từ dữ liệu huấn luyện.

5. Kỹ thuật `backpropagation` được sử dụng trong huấn luyện mô hình mạng nơ-ron (neural network) cho các tác vụ NLP để làm gì?

A. Tăng tốc độ suy luận của mô hình.
B. Tính toán và cập nhật trọng số của mạng nơ-ron dựa trên lỗi dự đoán.
C. Tránh overfitting (quá khớp) trên dữ liệu huấn luyện.
D. Khởi tạo ngẫu nhiên trọng số của mạng nơ-ron.

6. Trong NLP, `corpus` (ngữ liệu) thường được hiểu là gì?

A. Một thuật toán xử lý ngôn ngữ tự nhiên cụ thể.
B. Một tập hợp lớn các văn bản được sử dụng để huấn luyện hoặc đánh giá mô hình NLP.
C. Một thư viện phần mềm cho NLP.
D. Một phương pháp biểu diễn từ vựng.

7. Độ đo `Perplexity` thường được sử dụng để đánh giá chất lượng của:

A. Mô hình phân loại văn bản.
B. Mô hình ngôn ngữ.
C. Hệ thống nhận dạng thực thể có tên.
D. Hệ thống dịch máy.

8. Vấn đề `ambiguity` (đa nghĩa) trong ngôn ngữ tự nhiên gây khó khăn gì cho các hệ thống NLP?

A. Làm giảm tốc độ xử lý văn bản.
B. Khiến máy tính khó khăn trong việc hiểu đúng ý nghĩa của văn bản, do một từ hoặc cụm từ có thể có nhiều nghĩa khác nhau tùy theo ngữ cảnh.
C. Tăng yêu cầu về bộ nhớ lưu trữ dữ liệu văn bản.
D. Khó khăn trong việc dịch văn bản sang ngôn ngữ khác.

9. Phương pháp `TF-IDF` được sử dụng trong NLP để làm gì?

A. Giảm chiều dữ liệu word embedding.
B. Tính trọng số quan trọng của từ trong một văn bản so với tập hợp văn bản.
C. Phân tích cú pháp phụ thuộc.
D. Phát hiện ngôn ngữ của văn bản.

10. Phương pháp `n-gram` trong NLP được sử dụng để:

A. Phân tích ngữ pháp của câu.
B. Chia văn bản thành các câu.
C. Mô hình hóa chuỗi các đơn vị (ví dụ: từ, ký tự) liên tiếp trong văn bản.
D. Tìm kiếm và thay thế các cụm từ cố định.

11. Mục tiêu của `coreference resolution` (giải quyết đồng tham chiếu) trong NLP là gì?

A. Phân tích cấu trúc cú pháp của câu.
B. Xác định các thực thể có tên trong văn bản.
C. Xác định các cụm từ hoặc đại từ nào đề cập đến cùng một thực thể trong văn bản.
D. Phân loại văn bản theo chủ đề.

12. Mô hình ngôn ngữ (Language Model) trong NLP có chức năng chính là gì?

A. Phân loại văn bản.
B. Dự đoán xác suất xuất hiện của một chuỗi từ.
C. Trích xuất thông tin từ văn bản.
D. Tạo ra các câu hỏi từ văn bản.

13. Khái niệm `semantic similarity` (tương đồng ngữ nghĩa) trong NLP đo lường điều gì?

A. Sự giống nhau về chính tả giữa hai từ.
B. Sự giống nhau về âm thanh giữa hai từ.
C. Mức độ tương đồng về ý nghĩa giữa hai từ, câu hoặc đoạn văn bản.
D. Mức độ tương đồng về cấu trúc cú pháp giữa hai câu.

14. Trong phân tích cảm xúc (Sentiment Analysis), `polarity` (cực tính) thường đề cập đến điều gì?

A. Độ dài của văn bản.
B. Cường độ cảm xúc (mạnh hay yếu).
C. Hướng cảm xúc (tích cực, tiêu cực, trung lập).
D. Chủ đề chính của văn bản.

15. Ứng dụng nào sau đây thể hiện việc sử dụng NLP để `hiểu` ngôn ngữ tự nhiên?

A. Chương trình kiểm tra chính tả.
B. Hệ thống trả lời câu hỏi tự động.
C. Công cụ dịch văn bản.
D. Phần mềm soạn thảo văn bản.

16. Kỹ thuật `Bag of Words` (Túi từ) trong NLP có nhược điểm chính nào?

A. Không hiệu quả với văn bản dài.
B. Mất thông tin về thứ tự của từ trong câu.
C. Khó xử lý từ đồng nghĩa.
D. Yêu cầu tài nguyên tính toán lớn.

17. Trong NLP, `parsing` (phân tích cú pháp) thường tạo ra cấu trúc dữ liệu nào để biểu diễn cấu trúc ngữ pháp của câu?

A. Ma trận đồng xuất hiện từ (co-occurrence matrix).
B. Cây cú pháp (parse tree) hoặc đồ thị phụ thuộc (dependency graph).
C. Vector đặc trưng TF-IDF.
D. Danh sách các thực thể có tên.

18. Độ đo `F1-score` thường được sử dụng để đánh giá hiệu suất của mô hình NLP trong các tác vụ nào?

A. Sinh văn bản tự động.
B. Phân loại văn bản và nhận dạng thực thể có tên.
C. Dịch máy.
D. Tóm tắt văn bản.

19. Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực tập trung vào:

A. Phát triển phần mềm hệ thống.
B. Tương tác giữa máy tính và ngôn ngữ loài người.
C. Thiết kế cơ sở dữ liệu.
D. Phân tích dữ liệu số.

20. Trong lĩnh vực chatbot và hệ thống đối thoại, `intent recognition` (nhận dạng ý định) là quá trình:

A. Tạo ra phản hồi tự nhiên từ chatbot.
B. Xác định mục đích hoặc ý định của người dùng thông qua câu nói của họ.
C. Quản lý trạng thái hội thoại.
D. Lưu trữ lịch sử hội thoại.

21. Thách thức chính của việc xử lý ngôn ngữ tự nhiên đối với ngôn ngữ tiếng Việt so với tiếng Anh là gì?

A. Tiếng Việt có số lượng từ vựng lớn hơn tiếng Anh.
B. Tiếng Việt là ngôn ngữ đơn lập, không biến hình, và có tính đa nghĩa cao, gây khó khăn cho việc phân tích hình thái và ngữ nghĩa.
C. Tiếng Việt ít tài nguyên dữ liệu huấn luyện NLP hơn tiếng Anh.
D. Tiếng Việt không có bảng chữ cái.

22. Trong lĩnh vực NLP, `zero-shot learning` (học không mẫu) có nghĩa là gì?

A. Mô hình học mà không cần bất kỳ dữ liệu huấn luyện nào.
B. Mô hình có khả năng thực hiện một tác vụ mà không cần được huấn luyện trực tiếp trên tác vụ đó, mà chỉ dựa trên kiến thức đã học từ các tác vụ liên quan.
C. Mô hình chỉ được huấn luyện trên dữ liệu tổng hợp (synthetic data).
D. Mô hình có độ chính xác bằng 0 trên dữ liệu kiểm tra.

23. Trong NLP, độ đo `BLEU score` thường được sử dụng để đánh giá hiệu suất của hệ thống nào?

A. Hệ thống phân loại văn bản.
B. Hệ thống dịch máy.
C. Hệ thống tóm tắt văn bản.
D. Hệ thống trả lời câu hỏi.

24. Mô hình Transformer, nền tảng của nhiều mô hình ngôn ngữ lớn hiện nay (ví dụ: BERT, GPT), khắc phục nhược điểm chính nào của mô hình RNN (Recurrent Neural Network) trong NLP?

A. Khả năng xử lý văn bản đa ngôn ngữ.
B. Khả năng xử lý song song và vấn đề `vanishing gradient`.
C. Độ chính xác trong phân tích cú pháp.
D. Tốc độ học nhanh hơn trên dữ liệu nhỏ.

25. Trong NLP, `word embedding` (nhúng từ) được sử dụng để:

A. Mã hóa từ thành dạng số vector.
B. Phân tích cảm xúc của văn bản.
C. Dịch ngôn ngữ tự động.
D. Tóm tắt văn bản.

26. Trong ngữ cảnh của mô hình ngôn ngữ lớn, `fine-tuning` (tinh chỉnh) là quá trình:

A. Huấn luyện lại toàn bộ mô hình từ đầu trên một tập dữ liệu mới.
B. Tiếp tục huấn luyện một mô hình đã được huấn luyện trước đó (pre-trained model) trên một tập dữ liệu cụ thể cho một tác vụ cụ thể.
C. Giảm kích thước của mô hình để triển khai trên thiết bị di động.
D. Tối ưu hóa tốc độ suy luận của mô hình.

27. Trong NLP, `stop words` (từ dừng) là gì và tại sao chúng thường được loại bỏ trong quá trình tiền xử lý văn bản?

A. Các từ mang nghĩa tiêu cực, cần loại bỏ để phân tích cảm xúc chính xác hơn.
B. Các từ phổ biến, ít mang thông tin ngữ nghĩa (ví dụ: `là`, `của`, `và`), thường được loại bỏ để giảm nhiễu và tăng hiệu quả xử lý.
C. Các từ hiếm gặp, có thể gây lỗi trong mô hình ngôn ngữ.
D. Các từ viết tắt, cần được mở rộng để chuẩn hóa văn bản.

28. Công đoạn nào sau đây KHÔNG thuộc quy trình xử lý ngôn ngữ tự nhiên điển hình?

A. Phân tích cú pháp (Parsing).
B. Phân tích cảm xúc (Sentiment Analysis).
C. Biên dịch mã nguồn (Code Compilation).
D. Nhận dạng thực thể có tên (Named Entity Recognition).

29. Kỹ thuật `Named Entity Recognition` (NER) trong NLP nhằm mục đích:

A. Phân loại văn bản theo chủ đề.
B. Xác định và phân loại các thực thể có tên trong văn bản (ví dụ: tên người, tổ chức, địa điểm).
C. Tạo ra bản tóm tắt ngắn gọn của văn bản.
D. Dịch văn bản sang ngôn ngữ khác.

30. Phương pháp `stemming` và `lemmatization` trong NLP có chung mục đích gì?

A. Phân tích cú pháp câu.
B. Giảm số lượng chiều dữ liệu văn bản.
C. Chuẩn hóa từ về dạng gốc.
D. Nhận dạng các thực thể có tên.

1 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

1. Trong NLP, 'knowledge graph' (đồ thị tri thức) được sử dụng để:

2 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

2. Mục tiêu chính của việc 'token hóa' (tokenization) trong NLP là gì?

3 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

3. Ứng dụng nào sau đây KHÔNG phải là ứng dụng trực tiếp của NLP?

4 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

4. Kỹ thuật 'transfer learning' (học chuyển giao) được ứng dụng trong NLP như thế nào?

5 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

5. Kỹ thuật 'backpropagation' được sử dụng trong huấn luyện mô hình mạng nơ-ron (neural network) cho các tác vụ NLP để làm gì?

6 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

6. Trong NLP, 'corpus' (ngữ liệu) thường được hiểu là gì?

7 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

7. Độ đo 'Perplexity' thường được sử dụng để đánh giá chất lượng của:

8 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

8. Vấn đề 'ambiguity' (đa nghĩa) trong ngôn ngữ tự nhiên gây khó khăn gì cho các hệ thống NLP?

9 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

9. Phương pháp 'TF-IDF' được sử dụng trong NLP để làm gì?

10 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

10. Phương pháp 'n-gram' trong NLP được sử dụng để:

11 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

11. Mục tiêu của 'coreference resolution' (giải quyết đồng tham chiếu) trong NLP là gì?

12 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

12. Mô hình ngôn ngữ (Language Model) trong NLP có chức năng chính là gì?

13 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

13. Khái niệm 'semantic similarity' (tương đồng ngữ nghĩa) trong NLP đo lường điều gì?

14 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

14. Trong phân tích cảm xúc (Sentiment Analysis), 'polarity' (cực tính) thường đề cập đến điều gì?

15 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

15. Ứng dụng nào sau đây thể hiện việc sử dụng NLP để 'hiểu' ngôn ngữ tự nhiên?

16 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

16. Kỹ thuật 'Bag of Words' (Túi từ) trong NLP có nhược điểm chính nào?

17 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

17. Trong NLP, 'parsing' (phân tích cú pháp) thường tạo ra cấu trúc dữ liệu nào để biểu diễn cấu trúc ngữ pháp của câu?

18 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

18. Độ đo 'F1-score' thường được sử dụng để đánh giá hiệu suất của mô hình NLP trong các tác vụ nào?

19 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

19. Xử lý ngôn ngữ tự nhiên (NLP) là lĩnh vực tập trung vào:

20 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

20. Trong lĩnh vực chatbot và hệ thống đối thoại, 'intent recognition' (nhận dạng ý định) là quá trình:

21 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

21. Thách thức chính của việc xử lý ngôn ngữ tự nhiên đối với ngôn ngữ tiếng Việt so với tiếng Anh là gì?

22 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

22. Trong lĩnh vực NLP, 'zero-shot learning' (học không mẫu) có nghĩa là gì?

23 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

23. Trong NLP, độ đo 'BLEU score' thường được sử dụng để đánh giá hiệu suất của hệ thống nào?

24 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

24. Mô hình Transformer, nền tảng của nhiều mô hình ngôn ngữ lớn hiện nay (ví dụ: BERT, GPT), khắc phục nhược điểm chính nào của mô hình RNN (Recurrent Neural Network) trong NLP?

25 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

25. Trong NLP, 'word embedding' (nhúng từ) được sử dụng để:

26 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

26. Trong ngữ cảnh của mô hình ngôn ngữ lớn, 'fine-tuning' (tinh chỉnh) là quá trình:

27 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

27. Trong NLP, 'stop words' (từ dừng) là gì và tại sao chúng thường được loại bỏ trong quá trình tiền xử lý văn bản?

28 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

28. Công đoạn nào sau đây KHÔNG thuộc quy trình xử lý ngôn ngữ tự nhiên điển hình?

29 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

29. Kỹ thuật 'Named Entity Recognition' (NER) trong NLP nhằm mục đích:

30 / 30

Category: Đề thi, bài tập trắc nghiệm online Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 11

30. Phương pháp 'stemming' và 'lemmatization' trong NLP có chung mục đích gì?