FANDOM


Tạm dịch là “kế thừa văn bản”, bài toán quan tâm: phát hiện kế thừa văn bản (Recognizing TE: RTE). Cho hai đoạn văn bản, bài toán kế thừa có mục đích xác định xem nghĩa của văn bản này có thể được suy luận (kế thừa) từ một văn bản còn lại hay không. Định nghĩa logic “t (text) entails h (hypothesis)” t => h. Được ứng dụng trong mở rộng truy vấn, phân tích ngữ nghĩa tiềm ẩn cho tìm kiếm thông tin; so khớp từ vựng, so khớp cú pháp và suy luận logic cho hệ thống hỏi đáp; sử dụng độ trùng lặp n – gram cho hệ thống dịch máy; độ trùng lặp về từ vựng, sự tương đồng về cú pháp, ngữ nghĩa cho kế thừa văn bản. Nhãn được dùng – Balanced classification: entailment/positive (môn bóng đá được nhiều bạn nam tham gia => một số bạn nam đang chơi thể thao), contradiction/negative (một chiếc xe đang lao vào đám đông != một người đàn ông đang lái xe ở nơi vắng vẻ), và neutral/non (một ông già và một đứa trẻ đang cười ~ hai đứa trẻ đang cười vì một con mèo đang chơi cuộn len). – Bài toán binary classification: entailment/not entailment.