Truy hồi thông tin (Information Retrieval)
Information Security (ITT3005)
Mô tả học phần
- Học phần Truy hồi thông tin là môn học bắt buộc thuộc khối kiến thức chuyên ngành cung cấp những kiến thức về tra cứu thông tin là môn học cần thiết cung cấp các khái niệm cơ bản, các kỹ năng về xây dựng hệ thống cho học viên. Môn học này đề cập tới việc xây dựng các ứng dụng tra cứu dựa trên nền tảng web, như tra cứu thông tin văn bản, tra cứu ảnh, tra cứu multimedia,… Đồng thời cung cấp các phương pháp đánh giá các hệ thống tra cứu.
- Học phần này có quan hệ trực tiếp với các học phần thuộc khối kiến thức cơ sở, khối kiến thức ngành.
Mục tiêu học phần
- Về kiến thức: trang bị cho người học những kiến thức cơ bản về tra cứu thông tin, các kỹ thuật tra cứu thông tin cơ bản như: quét toàn bộ văn bản, tra cứu dựa trên phân cụm,…
- Về kỹ năng: dựa trên những kiến thức cơ bản, học viên có các kỹ năng hiểu về hệ thống tra cứu, các phương pháp tra cứu để có thể xây dựng hệ thống, đáp ứng được các yêu cầu của một hệ thống trong thực tế.
Yêu cầu cho người học và kiến thức cần đạt
- Dự lớp học: dự lớp đầy đủ, không đến muộn, không nghỉ quá 20% giờ học
- Bài tập/tự học: hoàn thành các bài tập/tiểu luận được giao
Phương pháp, hình thức kiểm tra, đánh giá kết quả học tập của học phần
- Phương pháp kiểm tra, đánh giá: Kết hợp kiểm tra - đánh giá thường xuyên, định kỳ với thi kết thúc học phần. Bảo đảm đầy đủ khối lượng kiến thức, kỹ năng thu được thông qua các hình thức hoạt động dạy - học: lên lớp, thực hành, thí nghiệm, thực tập, thảo luận và tự học v.v. Đồng thời, đánh giá ý thức học tập chuyên cần và tính độc lập, sáng tạo của học viên;
- Hình thức kiểm tra, đánh giá: Kiểm tra viết hoặc báo cáo tiểu luận
- Điểm tổng kết học phần là tổng điểm quá trình học tập và điểm thi kết thúc học phần cụ thể như sau:
- Điểm quá trình học tập có hệ số 30%, bao gồm điểm đánh giá mức độ chuyên cần, nhận thức và thái độ tham gia quá trình học tập và bài kiểm tra giữa kỳ;
- Điểm thi kết thúc học phần có hệ số 70%;
- Thang điểm đánh giá: Điểm được chấm theo thang điểm 10, làm tròn đến một chữ số thập phân sau dấu phẩy
Nội dung môn học
Chương 1. Tổng quan về tra cứu thông tin học
- 1.1 Khái niệm tra cứu thông tin
- 1.2 Các mô hình tra cứu thông tin
- 1.3 Các kỹ thuật tra cứu thông tin
- 1.4 Một số hệ thống tra cứu thông tin điển hình
- 1.5 Ứng dụng của tra cứu thông tin
- 1.6. Thảo luận chương 1
Chương 2. Phương pháp trích chọn đặc trưng
- 2.1 Khái niệm
- 2.2 Mô hình không gian vecto
- 2.3 Một số phương pháp trích chọn khác
- 2.4 Giảm chiều
- 2.5. Thảo luận chương 2
Chương 3. Kỹ thuật phân cụm và đánh chỉ số
- 3.1 Giới thiệu
- 3.2 Phương pháp đánh chỉ số
- 3.3 Phương pháp phân cụm phân cấp
- 3.4 Phương pháp phân cụm K-means
- 3.5 Một số phương pháp khác
- 3.6. Thảo luận chương 3
Chương 4. Kỹ thuật tra cứu và đánh giá tra cứu
- 4.1 Giới thiệu
- 4.2 Biểu diễn câu hỏi
- 4.3 Đối sánh với kho dữ liệu
- 4.4 Một số phương pháp tối ưu
- 4.5 Đánh giá tra cứu thông tin
- 4.6. Thảo luận chương 4.
Chương 5. Ứng dụng xây dựng hệ thống tra cứu thông tin
- 5.1 Yêu cầu hệ thống tra cứu thông tin
- 5.2 Phân tích yêu cầu
- 5.3 Xây dựng hệ thống tra cứu thông tin
- 5.4 Đánh giá hệ thống tra cứu thông tin
Giáo trình, tài liệu tham khảo
- Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2009.
- Ricardo Baeza-Yates and Berthier Ribeiro-Neto, Modern Information Retrieval: The Concepts and Technology behind Search, Addison-Wesley Professional, 2011.
- Bruce Croft, Donald Metzler and Trevor Strohman, Search Engines: Information Retrieval in Practice, Addison-Wesley, 2009.
- Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack, Information Retrieval: Implementing and Evaluating Search Engines, The MIT Press, 2016.
- ChengXiang Zhai, Statistical Language Models for Information Retrieval Synthesis Lectures on Human Language Technologies, Now Publishers Inc, 2008.