Машинное обучение в автоматической обработке текстов

Курс читался в семестрах:

Весна 2018 Весна 2019

математический спецкурс весеннего семестра 2017/2018-го года

Лукашевич Н.В.

Пятница, 16:20,
ауд. 524

Спецкурс для студентов магистратуры. Первое занятие 2 марта.

В связи с доступностью в настоящее время большого количества электронных документов важным является умение обрабатывать большие объемы текстовых данных для извлечения знания о языке, предметной области, а также информации о конкретных сущностях. Такие знания включают извлечение синонимов, родовидных отношений и значений многозначных слов; именованных сущностей, их типов и отношений между ними; анализ тональности. Извлеченные знания могут использоваться для автоматизации составления разного рода компьютерных ресурсов, а также в информационно-аналитических системах.

Программа

Введение, задачи автоматической обработки текстов, этапы обработки текстов, компьютерные лингвистические ресурсы, интеллектуальные системы обработки текстовой информации;
Дистрибутивные семантические модели, извлечение семантического сходства слов на основе больших текстовых коллекций;
Нейронные сети, дистрибутивное представление слов (word embedding);
Подходы к извлечению таксономий (синонимов, родо-видовых отношений) на основе дистрибутивных представлений слов;
Извлечение отношений на основе шаблонов, обобщений шаблонов и применений нейронных сетей;
Извлечение именованных сущностей, фактов из текстов. Частичное обучение, обучение в открытой предметной области, distant supervision;
Извлечение мнений из текстов. Анализ тональности. Извлечение оценочной лексики из текстов;
Извлечение устойчивых словосочетаний, терминов, ключевых слов;
Автоматический вывод значений многозначных слов.

Страница курса: http://vmk.somee.com/Details/6077

Комментарии и отзывы