Программирование [ЭКСКЛЮЗИВ] Data Scientist. Научитесь строить и обучать предиктивные модели с помощью алгоритмов машинного обучения и нейросетей.

b791e0e067.png

Мощнейший курс по программированию от Нетологии. В сети были некоторые части материала, которые вызывали дикий восторг у людей. В этой раздаче находится весь материал.

Курс состоит из более чем 180 часов видео и домашних заданий от ведущих специалистов по Data Scientist компаний Mail.ru, Ivi и Avito.


Первые два набора уже удачно состоялись, и студенты вовсю погрузились в базовые алгоритмы ML, feature engineering, машинное зрение, Data Scientist в e-commerce, временные ряды и прогнозирование стоимости акций и других товаров. Их преподавателями стали эксперты из Yandex Data Factory, Rambler&Co, Сбербанк Технологии и теперь у вас появится возможность получить все необходимые знания и навыки для работы в области больших данных.

Программа обучения:

I Подготовительный блок:

Экспресс-обучение основным инструментам: Python 3, git, библиотеки numpy, pandas. Обзор основного математического аппарата: матричные операции, введение в статистику и проверку гипотез.

II Введение в data science, основные инструменты:
Что такое data science, big data, как это работает и где применяется. Эксплоративный анализ и библиотеки визуализации данных. Обзор методов машинного обучения в бибилотеке scikit-learn.

III Базовые алгоритмы и понятия машинного обучения:
Разбор основных задач и алгоритмов машинного обучения: деревья решений, метод k ближайших соседей, линейный классификатор и логистическая регрессия, кластеризация. Проверка точности модели. Проблема переобучения и борьба с ней: регуляризация, ансамблирование.

IV Feature engineering:
Проблемы качества и размерности данных. Уменьшение размерности данных. Методы декомпозиции. Cпрямляющие пространства.

V Рекомендательные системы:
Введение в рекомендательные системы. Неперсонализированные рекомендации. Персонализированные рекомендации. Развитие рекомендательных систем.

VI Распознавание изображений, машинное зрение:
Базовая теория. Обзор кейсов применения. Нейросети. Разбор реальных задач: рукописный ввод, детекция и сегментация объектов на изображении.

VII Обработка естественного языка (NLP):
Введение в обработку текста. Обзор существующих библиотек, их использование и доработка. Использование внешних ресурсов. Грязные тексты: что это такое и как с ними работать. Дистрибутивная семантика. Чатботы: разбор генерации текстов. Нейросети для NLP.

VIII Анализ временных рядов, прогнозирование:
Временные ряды, модели ARMA/ARIMA. Сложные модели прогнозирования. Эксплоративный анализ временных рядов.

IX Общение с заказчиком:
Проекты машинного обучения: как выявить требования и оценить проект. Составление отчетов по исследованиям. Мастер-класс по презентации результатов.

X Data Science в маркетинге и e-commerce:
Цели, задачи, решения и критерии успешности применения Data Science. Маркетинг Data-Driven vs интуиция. Типы данных и примеры датасетов. Методы сбора из разных источников. Подготовка и обработка данных, извлечение смысла и визуализация. Разбор атрибуции маркетинговых расходов для увеличения дохода интернет-магазина.

XI Дополнительные инструменты, среды:
Экосистема Google: BigQuery, Dataflow, Dataproc, Datalab и др. Коммерческие решения HP: Vertica, Haven, IDOL, коннекторы данных. Решения от Amazon (AWS). Хранение и обработка данных в Clickhouse.

XII Дипломная работа:
Разработка и внедрение собственного ML-решения/проекта либо разработка предложенного нами кейса.

СКАЧАТЬ КУРС:
 


Рекламное сообщение

🤑 Реальная история заработка на таргетированной рекламе с 0 до 3000$ за 2 месяца от ученика PirateHUB Academy.

Ученик PirateHUB Academy согласился продемонстрировать свой путь наглядно, рассказать с какими трудностями он столкнулся в нише таргетированной рекламы и многое другое. Все это происходит в открытом формате без цензуры. Каждый из вас может задать вопрос ученику и проверить его информацию.

Залетайте, это интересно!

➡️➡️➡️ @pirate_target_story
👉 Бесплатный чат по таргетированной рекламе, где вы можете задать свой вопрос
 

Я замарочился и скачал. Могу попробовать раздать торрент. Правда до этого я никогда торренты не создавал, так что не судите строго, если что-то не полчилось.
На выходные оставляю рабочий комп включенный
UPD. Не качайте пока с моего торрента - что-то не получается раздать, возможно сеть локальная блокирует. Если разберусь в чем проблема, отпишусь в ветке. А вообще там ниже koguja предлагает для скачки с облака использовать JDownloader. Может есть смысл прислушаться ))

UPD2 - вроде заработало. Файл торрент обновил, и надо добавить список трекеров вот отсюда
 

Последнее редактирование:
Я замарочился и скачал. Могу попробовать раздать торрент. Правда до этого я никогда торренты не создавал, так что не судите строго, если что-то не полчилось. Скрытое содержимое
На выходные оставляю рабочий комп включенный
Жду с нетерпением раздачи, спасибо!
 

Жду с нетерпением раздачи, спасибо!
А разве счас нет раздачи? Я вроде сначала запустил, а потом сделал тут запись. Разве что комп на работе мог включиться. Тогда уж в понедельник только...
 

А разве счас нет раздачи? Я вроде сначала запустил, а потом сделал тут запись. Разве что комп на работе мог включиться. Тогда уж в понедельник только...
К сожалению, нет. Будем ждать понедельника, спасибо!
 


Может какой-нибудь брандмауэр порты заблокировал на исходящие?
Попробуйте счас. Я с другого компа попробовал скачать - качает. Правда тот другой комп в той же подсети, не знаю влият ли. но ведь попробовать стоит ))
 

Попробуйте счас. Я с другого компа попробовал скачать - качает. Правда тот другой комп в той же подсети, не знаю влият ли. но ведь попробовать стоит ))
Не идет. Видно не судьба..
 

Я давно качаю с облаков с помощью JDownloader. Программа сама парсит структуру и качает так, что 100Мбит на 100% занят, выйгрыша от торрента я не вижу.
 

Поставил другой торрент-клиент, добавил список трекеров отсюда, запустил на виртуалке на амазоне загрузку - и таки пошло )) Правда скорость до неприличия низкая, хотя на раздаче я пока даже ограничений не ставил. Может это амазоновский сервер ограничивает?
Screenshot
(тут я только один файл качаю на пробу)

ах да, торрент файл другой сделал, обновил ссылку в своем первом посте
 

Последнее редактирование:
Поставил другой торрент-клиент, добавил список трекеров отсюда, запустил на виртуалке на амазоне загрузку - и таки пошло ))
ах да, торрент файл другой сделал, обновил ссылку в своем первом посте
Пошла загрузка ночью! Даже без обновления торрент-файла.

Правда скорость до неприличия низкая, хотя на раздаче я пока даже ограничений не ставил. Может это амазоновский сервер ограничивает?
Скорость приемлемая ~1Мб/c. Не хуже чем с диска мейла.

Я давно качаю с облаков с помощью JDownloader. Программа сама парсит структуру и качает так, что 100Мбит на 100% занят, выйгрыша от торрента я не вижу.
Попробовал поставить, но Антивирус обнаружил какую-то малварь. Решил не рисковать.
 

В паблике уже лежит полгода, причем можно смотреть с браузера и не качать всю эти тучу гб, в поисковике введите : Программа обучения Data Scientist - Полный список уроков
 

Прога классная, но качает все в кучу.. легче кусками с облака качать, чем все сортировать.. может, я не знаю чего-то
Я давно качаю с облаков с помощью JDownloader. Программа сама парсит структуру и качает так, что 100Мбит на 100% занят, выйгрыша от торрента я не вижу.
 

Обратите внимание

Назад
Сверху