математический спецкурс осеннего семестра 2017/2018-го года
Аналитические модели данных и их визуализация

Майсурадзе А.И.

Понедельник, 16:20,
ауд. 582

Вводное занятие состоится 11 сентября 2017 г.

В данном курсе излагаются теоретические и практические знания, которые понадобятся всем будущим аналитикам, ведь всем им предстоит собирать и хранить данные, "разглядывать" их самим и показывать другим. Модели данных - это стандартные в области аналитической деятельности "языки", на которых аналитики рассказывают друг другу о данных. Курс учит пользоваться этими общераспространенными "языками", что обеспечивает взаимопонимание при аналитической деятельности. Визуализация - это тоже форма рассказа о данных, соответственно, она тоже происходит в рамках таких "языков". Важнейшую роль такие "языки" получили в консалтинговых и аналитических подразделениях "Большой четверки".

В современном анализе данных принято выделять три уровня задач, методов и соответствующих технологий: сбор и хранение данных, оперативная аналитика и визуализация, интеллектуальный анализ. Обычно бизнес, опирающийся на анализ данных, последовательно проходит все эти уровни. Всем сотрудниками компаний, непосредственно занимающимся или поддерживающим аналитическую деятельность, постоянно приходится работать с первыми двумя уровнями. Сложные математические модели преобразования информации (машинное обучение) относятся к последнему третьему уровню. Разумеется, в эру больших данных в первую очередь выросла сложность задач и технологий первых двух уровней. Общеизвестным примером является система Google Analytics.

Будут рассмотрены основные модели данных - разные способы мыслить и формализовать представление информации в аналитике. В связи с этим будет рассмотрена "аналитическая" часть SQL. В свою очередь, о визуализации будет рассказано одновременно с позиций аналитических целей и моделей данных. Будут рассмотрены "гиганты визуализации" - системы QlikView и Tableau, - развивающие технологию OLAP. Будут рассмотрены практики "рассказывания историй по данным" (storytelling with data) и "интерактивных панелей".

В курсе основное внимание уделяется "языку" аналитического общения, соответственно, большая его часть доступна бакалаврам первого-второго курсов. Предполагается, что студенты подготовят панель и сделают доклад о данных по актуальной для них жизненной проблеме.

Комментарии и отзывы
Web hosting by Somee.com