Машинное обучение на ФКН ВШЭ

Overview

Курс "Машинное обучение" на ФКН ВШЭ

Конспекты лекций, материалы семинаров и домашние задания (теоретические, практические, соревнования) по курсу "Машинное обучение", проводимому на бакалаврской программе "Прикладная математика и информатика" Факультета компьютерных наук Высшей школы экономики.

Страницы курсов:

Записи лекций и семинаров 2020/2021 года, осень:

Записи лекций и семинаров 2020/2021 года, весна:

Видеозаписи некоторых лекций 2018/19 года:

Comments
  • Теор.дз №9, второе неравенство

    Теор.дз №9, второе неравенство

    Есть несколько вопросов к выводу неравенства из номера 3. Во-первых, в формуле (0.6) явно потерялось деление на двойку в правой части. Во-вторых, для использования этого неравенства выпуклость $\phi$ не нужна, зато она нужна в первом неравенстве формулы (0.8) – мне кажется, что стоило бы явно написать, какое свойство/определение выпуклых функций было использовано в этом переходе, раз уж приводится решение.

    opened by ks-korovina 4
  • ДЗ#3, разделение в вершине

    ДЗ#3, разделение в вершине

    Мы считаем критерий Джини для каждого разбиения - но он меняется при смене порога для правого и левого дерева, а не вершины. Из этого получается, что ответом тогда должен быть функционал качества, использующий посчитанные критерии для поддеревьев. Как понимаю, в Q(R) не используется H(R_m) как раз ввиду константности.

    opened by Kokhtev 4
  • 2019-fall/hw/01

    2019-fall/hw/01

    4. [1 балл] Постройте график зависимости денег за товар от купленного количества (scatter plot).

    По каким подмножествам мы считаем деньги и количество товара?

    opened by peinrules 3
  • 2019-fall/hw/01

    2019-fall/hw/01

    1. [0.25 баллов] Какие 5 товаров были самыми дешёвыми и самыми дорогими? (по choice_description)

    Что здесь подразумевается под (по choice_description)?

    opened by TmLev 3
  • homework-practice-03 HuberRegressor

    homework-practice-03 HuberRegressor

    Когда сдаю файл с HuberRegressor в яндекс контест чекер выдает следующее:

    test_2_predict (__main__.Test) ... ERROR
    test_3_calc_loss (__main__.Test) ... ERROR
    test_4_calc_gradient (__main__.Test) ... ERROR
    
    ======================================================================
    ERROR: test_2_predict (__main__.Test)
    ----------------------------------------------------------------------
    Traceback (most recent call last):
      File "./tester.py", line 33, in test_2_predict
        hr = got.HuberReg(delta=1.0, gd_type='full',
    AttributeError: 'module' object has no attribute 'HuberReg'
    
    ======================================================================
    ERROR: test_3_calc_loss (__main__.Test)
    ----------------------------------------------------------------------
    Traceback (most recent call last):
      File "./tester.py", line 60, in test_3_calc_loss
        hr = got.HuberReg(delta=1.0, gd_type='full',
    AttributeError: 'module' object has no attribute 'HuberReg'
    
    ======================================================================
    ERROR: test_4_calc_gradient (__main__.Test)
    -------------------------
    
    File is too long to be displayed fully
    

    Что с этим делать?

    opened by Kurt212 3
  • Ошибка в Лекции 5, SVM (2020)?

    Ошибка в Лекции 5, SVM (2020)?

    В лекции 5 в формуле 2.2 указано, что минимизация нормы ||w|| ^ 2 весов производится по двум параметрам: вектору весов w и смещению b. Вопрос: Если смещение b не входит в вектор весов в данном случае, то нужно ли его указывать? Аналогично в формуле 2.3.

    opened by Crowbar97 2
  • 2019-fall/hw/03

    2019-fall/hw/03

    Я правильно понимаю, что в домашке при реализации метода momentum предполагается использовать аппроксимацию градиента как в SGD? А то нигде не уточнено или я не нашел

    opened by Kirili4ik 2
  • Доступность авторских решений

    Доступность авторских решений

    В своем решении первого домашнего задания мне было непонятно, как сделать пункты 1.12, 2.2, 2.3 и 2.4. Я написал об этом в файле работы, а также попросил рассказать правильное решение этих задачек. Ответа так и не получил.

    Я спросил об авторских решениях у Дани Яшкова (семинариста), Даня попросил задать этот вопрос здесь.

    Мне действительно хочется узнать правильное и красивое решение особенно части 2 Д/З, так как навыки рисования графиков потребуются не только в следующих заданиях, но и по жизни 😊

    Соответственно, прошу рассказать, как парсить колонку choice_description и как подготавливать данные в задачах 2.2-2.4.

    opened by SerVB 2
  • Задания 9-10, homework-practice-01

    Задания 9-10, homework-practice-01

    Что является мерой популярности товара в задании 9, количество заказов, в которые он входит, или общее количество купленных единиц товара (сумма по quantity). Аналогичный вопрос по заданию 10, что учитывать как частоту покупки?

    opened by ivanashev-ilya 2
  • ДЗ 3, опечатка в задании 12

    ДЗ 3, опечатка в задании 12

    В задании 12:

    1. 4й датасет называется nursery, а не nurcery
    2. В описании 4го датасета не такие значения ответов, должно быть написано "читаем, что not_recom и recommend - класс 0, very_recom, priority, spec_prior - класс 1"
    opened by shihova-asya 2
  • Домашнее задание по GLM

    Домашнее задание по GLM

    Подправьте, пожалуйста, уже написанный вами код, он либо в некоторых местах не работает (train_test_split), либо сигнатура соответствует старым версиям библиотек (OneHotEncoder больше не имеет аргумента categorical_features). Если это конечно не является частью задания.

    opened by iknunyants 1
Owner
Evgeny Sokolov
Evgeny Sokolov