Как начать изучение машинному обучению?

СохранитьСохраненоУдалён 0

Артур Самуэль ввел термин «машинное обучение» в 1959 году и определил его как «область обучения, которая дает компьютерам возможность учиться без явного программирования».

И это было началом машинного обучения! В наше время машинное обучение — один из самых популярных (если не самый!) вариантов карьеры.

Действительно, инженер по машинному обучению — лучшая работа 2019 года с ростом на 344% и средней базовой зарплатой в 146 085 долларов в год.

Станьте специалистом machine learning
Подробнее

За 5 месяцев Вы научитесь строить полносвязную нейросеть, создавать чат-бот для поиска авиабилетов и построить классификатор изображений.

Learning ML

Но все еще остается много сомнений относительно того, что такое машинное обучение и как начать его изучение? Эта статья посвящена основам машинного обучения, а также пути, которым вы можете следовать, чтобы в конечном итоге стать полноценным инженером машинного обучения.

Что такое машинное обучение?

Машинное обучение включает в себя использование искусственного интеллекта, позволяющего машинам учиться на опыте, не программируя их специально для этой задачи.

Этот процесс начинается с подачи им данных хорошего качества, а затем обучения машин путем построения различных моделей машинного обучения с использованием данных и различных алгоритмов.

Выбор алгоритмов зависит от того, какой тип данных у нас есть и какую задачу мы пытаемся автоматизировать.

вернуться в меню ↑

Как начать изучать ML?

Это грубая дорожная карта, которой вы можете следовать, чтобы стать безумно талантливым инженером машинного обучения. Конечно, вы всегда можете изменить шаги в соответствии с вашими потребностями для достижения желаемой конечной цели!

Шаг 1 — Понимание предпосылок

Если вы гений, вы можете запустить ML напрямую, но обычно есть некоторые предварительные условия, которые вам необходимо знать, в том числе линейная алгебра, многомерное исчисление, статистика и Python.

И если вы этого не знаете, никогда не бойтесь! Вам не нужен доктор философии степень в этих темах, чтобы начать, но вам нужно базовое понимание.

(а) Изучение линейной алгебры и многомерного исчисления

Линейная алгебра и многомерное исчисление важны в машинном обучении. Однако степень их потребности зависит от вашей роли ученого в области данных.

Если вы больше сосредоточены на машинном обучении, то не будете так сильно сосредоточены на математике, так как доступно много общих библиотек.

Но если вы хотите сосредоточиться на исследованиях и разработках в области машинного обучения, то овладение линейной алгеброй и многофакторным исчислением очень важно, так как вам придется реализовать множество алгоритмов ML с нуля.

(б) Изучение статистики

Данные играют огромную роль в машинном обучении. Фактически, около 80% вашего времени в качестве эксперта по ОД будет потрачено на сбор и очистку данных.

А статистика — это поле, которое занимается сбором, анализом и представлением данных. Так что не удивительно, что вам нужно научиться этому.

Некоторые из ключевых понятий в статистике, которые важны, это статистическая значимость, распределение вероятностей, проверка гипотез, регрессия и т. д.

Кроме того, байесовское мышление также является очень важной частью ML, которая имеет дело с различными понятиями, такими как условная вероятность, априорные значения и постеры, максимальная вероятность и т. д.

(в) Изучение Python

Некоторые люди предпочитают пропускать линейную алгебру, многовариантное исчисление и статистику и изучать их по мере проб и ошибок.

Но одна вещь, которую вы абсолютно не можете пропустить, это Python! Хотя есть и другие языки, которые вы можете использовать для машинного обучения, такие как R, Scala и т. д. Python в настоящее время является самым популярным языком для ML.

Фактически, есть много библиотек Python, которые особенно полезны для искусственного интеллекта и машинного обучения, таких как Keras, TensorFlow, Scikit-learn и т. д.

Шаг 2 — Изучение различных концепций ML

Теперь, когда вы закончили с предварительными условиями, вы можете перейти к собственному изучению ML. Лучше начать с основ, а затем перейти к более сложным вещам. Некоторые из основных понятий в ML:

(а) Терминология машинного обучения

  • Модель — это конкретное представление, полученное из данных с применением некоторого алгоритма машинного обучения. Модель также называется гипотезой.
  • Функция — это отдельное измеримое свойство данных. Набор числовых признаков может быть удобно описан вектором признаков. Векторы объектов подаются как входные данные для модели. Например, чтобы предсказать плод, могут быть такие особенности, как цвет, запах, вкус и т. д.
  • Target (Label) — целевая переменная или метка — это значение, прогнозируемое нашей моделью. Для примера с фруктами, обсуждаемого в разделе функций, метка с каждым набором входных данных будет называться фруктом, таким как яблоко, апельсин, банан и т. д.
  • Обучение. Идея состоит в том, чтобы дать набор входных данных (функций) и ожидаемых результатов (меток), поэтому после обучения у нас будет модель (гипотеза), которая затем отобразит новые данные в одной из обучаемых категорий.
  • Прогнозирование. Как только наша модель будет готова, ей можно подать набор входных данных, на которые она будет предоставлять прогнозируемый результат (метку).
Станьте специалистом machine learning
Подробнее

За 5 месяцев Вы научитесь строить полносвязную нейросеть, создавать чат-бот для поиска авиабилетов и построить классификатор изображений.

(б) Типы машинного обучения

  • Контролируемое обучение — включает в себя обучение из учебного набора данных с помеченными данными с использованием моделей классификации и регрессии. Этот процесс обучения продолжается до тех пор, пока не будет достигнут необходимый уровень производительности.
  • Неподготовленное обучение — включает использование немаркированных данных, а затем поиск базовой структуры в данных, чтобы узнать все больше и больше о самих данных с использованием моделей факторного и кластерного анализа.
  • Обучаемое обучение под контролем — включает использование немаркированных данных, таких как необучаемое обучение, с небольшим количеством помеченных данных. Использование помеченных данных значительно повышает точность обучения, а также является более экономичным, чем контролируемое обучение.
  • Усиление обучения — включает в себя обучение оптимальным действиям методом проб и ошибок. Поэтому следующее действие определяется изучением поведения, основанного на текущем состоянии и максимизирующего вознаграждение в будущем.

(в) Как практиковать машинное обучение?

  • Самая трудоемкая часть ML — это сбор, интеграция, очистка и предварительная обработка данных. Поэтому обязательно попрактикуйтесь с этим, потому что вам нужны высококачественные данные.
  • Изучите различные модели и попрактикуйтесь на реальных наборах данных. Это поможет вам создать интуицию относительно того, какие типы моделей подходят для различных ситуаций.
  • Наряду с этими шагами, одинаково важно понимать, как интерпретировать результаты, полученные с использованием различных моделей. Это легче сделать, если вы понимаете различные параметры настройки и методы регуляризации, применяемые в разных моделях.

(d) Ресурсы для обучения машинному обучению:

Существуют различные онлайн и оффлайн ресурсы (бесплатные и платные!), Которые можно использовать для изучения машинного обучения. Некоторые из них представлены здесь:

  • Если вам нужно руководство для самообучения по машинному обучению, тогда вам пригодится ускоренный курс машинного обучения от Google, поскольку он предоставит вам введение в машинное обучение с видеолекциями, практическими примерами из практики и практическими упражнениями.
  • Если Вам хочется найти другой курс, курс Машинное обучение от Нетологии- то,что нужно для Вас. Этот курс научит вас различным концепциям машинного обучения, а также практическому опыту их применения в школьной среде.

Шаг 3 — принять участие в соревнованиях

После того, как вы поняли основы машинного обучения, вы можете перейти к самой интересной части- соревнованиям. Это в основном сделает вас еще более опытным в ML, сочетая в основном ваши теоретические знания с практической реализацией.

Вот некоторые из основных соревнований, которые вы можете начать на Kaggle, которые помогут вам обрести уверенность:

  • Titanic: машинное обучение от стихийных бедствий» — очень популярный проект для начинающих для ML, поскольку в нем доступно несколько учебных пособий. Таким образом, это отличное введение в концепции ML, такие как исследование данных, разработка функций и настройка моделей.
  • Digit Recognizer: — это проект, важный после того, как вы освоите основы Python и ML. Это отличное введение в захватывающий мир нейронных сетей с использованием классического набора данных, который включает в себя предварительно извлеченные функции.

После того, как вы закончили эти соревнования и другие такие простые задачи … поздравляем! Вы уже на пути к тому, чтобы стать полноправным инженером по машинному обучению, и вы можете продолжать совершенствовать свои навыки, работая над все большим количеством задач и в конечном итоге создавая все более и более творческие и сложные проекты машинного обучения.

Есть вопрос или дополнение?

      Оставить отзыв

      EdAdvisor
      Регистрация
      Сброс пароля
      Сравнить товары
      • Итого (0)
      Сравнить
      0