Курс читался в семестрах:
математический спецкурс осеннего семестра 2013/2014-го года
Введение в обработку текстов

Турдаков Д. Ю.

Пятница, 18:00,
ауд. 612

Спецкурс предназначен для студентов 3-5 курсов. Первое занятие состоится 28 сентября.

Курс знакомит слушателей с основными проблемами компьютерной обработки текстов и современными подходами к их решению. Рассматриваются как фундаментальные понятия и идеи, так и современные исследования в данной области. Особое внимание уделяется применению методов машинного обучения, которые активно развиваются в настоящее время и показывают лучшие результаты.

Актуальность обработки текстовой информации на естественном языке связана с ростом количества документов, доступных для автоматической обработки, потребностью в их анализе и наличием вычислительных ресурсов. Слушатели получат базовые знания в области обработки текстов на естественном языке, понимание проблем, возникающих при разработке систем текстового анализа, и подходов к их решению.

Сайт

http://modis.ispras.ru/tpc

План

  1. Введение 
  2. Регулярные выражения и конечные автоматы 
  3. Методы поиска словосочетаний
  4. N-граммы и определение частей речи слов 
  5. Скрытые марковские модели 
  6. Контекстно-свободные грамматики и синтаксический анализ 
  7. Статистические методы синтаксического анализа 
  8. Лексическая семантика 
  9. Вопросно-ответные системы и автоматическое реферирование 
  10. Машинный перевод

Литература

  • Daniel Jurafsky and James H. Martin. 2008. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Second Edition.Prentice Hall.
  • Christopher D. Manning and Hinrich Schütze. 1999. Foundations of Statistical Natural Language Processing. MIT Press.
  • Steven Bird, Ewan Klein, and Edward Loper. Natural Language Processing with Python. O'Reilly Media, 2009 (http://www.nltk.org/book)
Комментарии и отзывы
Web hosting by Somee.com