Основные математические навыки для машинного обучения

СохранитьСохраненоУдалён 0

Прежде чем обсуждать 4 математических навыка, необходимых для машинного обучения, давайте прежде всего опишем процесс машинного обучения.

Процесс машинного обучения включает в себя 4 основных этапа:

Станьте Data Scientist
Подробнее

После курса Вы будете хорошо разбираться в математическом аппарате, необходимом для успешной карьеры в Data Science.

  1. Постановка проблемы: Вы решаете, какую проблему вы пытаетесь решить, например. модель для классификации электронных писем как спама или не спама, модель для классификации опухолевых клеток как злокачественных или доброкачественных, модель для улучшения качества обслуживания клиентов путем распределения вызовов по различным категориям.
    Модель для прогнозирования возможности получения кредита будет списываться по истечении срока кредита, модели для прогнозирования цены дома на основе различных характеристик или предикторов и так далее.
  2. Анализ данных: Вы обрабатываете данные, доступные для построения модели. Он включает в себя визуализацию данных функций, обработку отсутствующих данных, обработку категориальных данных, кодирование меток классов, нормализацию и стандартизацию функций, разработку функций, уменьшение размерности, разделение данных на наборы обучения, проверки и тестирования и т. д.
  3. Построение модели. Ыы выбираете модель, которую хотите использовать, например, линейная регрессия, логистическая регрессия, KNN, SVM, K-средства, моделирование по методу Монте-Карло, анализ временных рядов и т. д.
    Набор данных должен быть разделен на наборы обучения, проверки и тестирования. Гиперпараметрическая настройка используется для точной настройки модели с целью предотвращения переоснащения.
    Перекрестная проверка выполняется, чтобы гарантировать, что модель хорошо работает на наборе проверки. После тонкой настройки параметров модели модель применяется к набору данных испытаний.
    Производительность модели на наборе тестовых данных приблизительно равна ожидаемой при использовании модели для прогнозирования невидимых данных.
  4. Применение: На этом этапе, окончательная модель машинного обучения запускается в производство, чтобы начать улучшать качество обслуживания клиентов или повышать производительность, или решать, должен ли банк утверждать кредит для заемщика и т. д. Модель оценивается в производственных условиях для того чтобы оценить его производительность.
    Это можно сделать, сравнив производительность решения для машинного обучения с базовым или контрольным решением, используя такие методы, как A / B-тестирование.
    Любые ошибки, возникающие при преобразовании экспериментальной модели в ее фактическую производительность на производственной линии, должны быть проанализированы. Это может быть использовано для тонкой настройки оригинальной модели.
    Большинство математических навыков, необходимых для построения модели машинного обучения, используются на этапах 2, 3 и 4, а именно: анализ данных, построение модели и приложение.

4 математических навыка для машинного обучения

Статистика и вероятность

Статистика и вероятность используются для визуализации объектов, предварительной обработки данных, преобразования объектов, вменения данных, уменьшения размерности, разработки функций, оценки моделей и т. д.

Вот темы, с которыми вам необходимо ознакомиться:

  • Mean
  • Median
  • Режим
  • Стандартное отклонение / дисперсия
  • Коэффициент корреляции и ковариационная матрица
  • Распределения вероятностей (бином, пуассон, нормаль)
  • р-значение
  • Теорема Байя (Точность, напоминание, положительное прогнозирующее значение, отрицательное прогнозирующее значение, матрица путаницы, кривая ROC)
  • A / B Тестирование
  • Monte Carlo Simulation
Станьте Data Scientist
Подробнее

После курса Вы будете хорошо разбираться в математическом аппарате, необходимом для успешной карьеры в Data Science.

Многовариантное исчисление

Большинство моделей машинного обучения построены с набором данных, имеющим несколько функций или предикторов.

Следовательно, знакомство с многовариантным исчислением чрезвычайно важно для построения модели машинного обучения. Вот темы, с которыми вам нужно ознакомиться:

  1. Функции нескольких переменных
  2. Производные и градиенты
  3. Шаговая функция, сигмовидная функция, функция логита, функция ReLU (выпрямленная линейная единица)
  4. Функция стоимости
  5. Построение функций
  6. Минимальные и максимальные значения функции

Линейная алгебра

Линейная алгебра — самый важный математический навык в машинном обучении. Набор данных представлен в виде матрицы.

Линейная алгебра используется в предварительной обработке данных, преобразовании данных и оценке модели. Вот темы, с которыми вам нужно ознакомиться:

  1. Векторы
  2. Матрицы
  3. Транспонирование матрицы
  4. Обратная матрица
  5. Определение матрицы
  6. Скалярное произведение
  7. Собственные значения
  8. Собственный вектор

Методы оптимизации

Большинство алгоритмов машинного обучения выполняют прогнозное моделирование, сводя к минимуму целевую функцию, тем самым изучая веса, которые должны применяться к данным тестирования, чтобы получить прогнозируемые метки.

Вот темы, с которыми вам нужно ознакомиться:

  1. Функция стоимости / Целевая функция
  2. Функция правдоподобия
  3. Функция ошибки
  4. Алгоритм градиентного спуска и его варианты (например, алгоритм стохастического градиентного спуска)
Есть вопрос или дополнение?

      Оставить отзыв

      EdAdvisor
      Регистрация
      Сброс пароля
      Сравнить товары
      • Итого (0)
      Сравнить
      0