Компьютерное зрение — Введение

СохранитьСохраненоУдалён 0

Компьютерное зрение - Введение

Эта статья специально посвящена компьютерному визуальному восприятию, также известному как компьютерное зрение.

Что такое компьютерное зрение?

Компьютерное зрение существует уже более 50 лет, но в последнее время мы наблюдаем значительный всплеск интереса к тому, как «видят» машины и как компьютерное зрение можно использовать для создания продуктов для потребителей и предприятий.

Станьте Data Scientist
Подробнее

После курса Вы научитесь решать задачи компьютерного зрения; будете работать с генеративными состязательными сетями и поймете, как можно использовать GANs для состязательных атак и как реализовать super resolution GANs

Немного примеров таких приложений — Amazon Go, Google Lens, автономные транспортные средства, распознавание лиц. Основным движущим фактором всего этого является Computer Vision.

Проще говоря, Computer Vision — это дисциплина в широкой области искусственного интеллекта, которая обучает машины видеть. Его цель — извлечь значение из пикселей.

С точки зрения биологической науки, его целью является создание вычислительных моделей зрительной системы человека. С инженерной точки зрения компьютерное зрение направлено на создание автономных систем, которые могли бы выполнять некоторые задачи, которые может выполнять зрительная система человека.

вернуться в меню ↑

Краткая история

Летом 1966 года Сеймур Паперт и Марвин Мински из группы MIT Artificial Intelligence начали проект Summer Vision Project. Целью проекта было построить систему, которая может анализировать сцену и идентифицировать объекты на сцене.

Таким образом, огромная, загадочная область компьютерного зрения, которую исследователи и технические гиганты все еще пытаются расшифровать, вначале считалась достаточно простой для студенческого летнего проекта теми же людьми, которые первыми создали искусственный интеллект.

В 70-х годах Дэвид Марр, невролог из Массачусетского технологического института, опираясь на идеи исследования мозжечка, гиппокампа и коры головного мозга для человеческого восприятия, создал строительные блоки для современного компьютерного зрения и, таким образом, известен как отец современного компьютерного зрения. Большинство его мыслей завершается в основной книге под названием VISION.

вернуться в меню ↑

Глубокое видение

Глубокое обучение началось с 2012 года. Глубокое обучение — это разновидность машинного обучения, где искусственные нейронные сети, алгоритмы, вдохновленные человеческим мозгом, учатся на больших объемах данных.

Благодаря мощным системам рекомендаций, идентификации и маркировке друзей на фотографиях, переводу вашего голоса в текст, переводу текста на разные языки, Deep Learning преобразовал компьютерное зрение, ведущее к превосходной производительности.

Частота ошибок классификации изображений с течением времени
Частота ошибок классификации изображений с течением времени, резкое падение после введения глубокого обучения. источник — tractable.ai
Tensor Flow

Эти основанные на Deep Learning алгоритмы компьютерного зрения, такие как Convolutional Neural Networks, начали давать многообещающие результаты с превосходной точностью, даже превосходя точность человеческого уровня в некоторых задачах.

вернуться в меню ↑

Приложения

Смартфоны: QR-коды, компьютерная фотография (Android Lens Blur, iPhone Portrait Mode), построение панорамы (Google Photo Spheres), распознавание лиц, определение выражений (улыбка), фильтры Snapchat (отслеживание лиц), Google Lens, Night Sight (Pixel)

Web: поиск изображений, фотографии Google (распознавание лиц, распознавание объектов, распознавание сцен, геолокация по зрению), Facebook (субтитры изображений), аэрофотосъемка карт Google (сшивание изображений), YouTube (категоризация контента)

VR / AR: внешнее отслеживание (HTC VIVE), внутреннее отслеживание (одновременная локализация и отображение, HoloLens), окклюзия объекта (оценка плотности по глубине)

Медицинская визуализация: реконструкция CAT / MRI, вспомогательная диагностика, автоматическая патология, коннектомика, хирургия под контролем ИИ.

Станьте Data Scientist
Подробнее

После курса Вы научитесь решать задачи компьютерного зрения; будете работать с генеративными состязательными сетями и поймете, как можно использовать GANs для состязательных атак и как реализовать super resolution GANs

Медиа: визуальные эффекты для кино, ТВ (реконструкция), виртуальные спортивные трансляции (реконструкция), авто-редактирование на основе семантики (реконструкция, распознавание)

Страхование: автоматизация претензий, анализ ущерба, проверка имущества

Источник Roadzen

Полный список приложений Computer Vision для промышленности приведен на этой странице, которую ведет Дэвид Лоу, старший научный сотрудник Google.

вернуться в меню ↑

Проблемы

Даже после огромного количества опубликованных работ, компьютерное зрение не решает все проблемы. Это работает только при нескольких ограничениях. Одной из основных причин этой трудности является то, что зрительная система человека просто слишком хороша для многих задач, например распознавания лиц.

Человек может распознавать лица при любых различиях в освещении, взгляде, выражении и т. д., которые компьютер испытывает в таких ситуациях.

Конфиденциальность и этика. Используя надзор, передовая отрасль страхования включает в себя корректировку премий и полисов путем мониторинга поведения вождения, но, с другой стороны, системы видеонаблюдения на основе Vision представляют большой риск для конфиденциальности и этики.

В качестве примера мы видим Китай, использующий распознавание лиц для отслеживания этнических меньшинств. Совсем недавно Сан-Франциско стал первым городом США, который запретил использование распознавания лиц своим правительством.

Отсутствие объяснения. Современные алгоритмы на основе нейронных сетей все еще остаются черным ящиком. Поэтому, когда модель классифицирует изображение как автомобиль, мы на самом деле не знаем, что послужило причиной этого.

Объясняемость является ключевым требованием в нескольких областях, таких как страхование и автономное вождение, которое в настоящее время отсутствует в этих алгоритмах.

Глубокие подделки — С одной стороны, решение, основанное на глубоком обучении, — это решение многих реальных проблем, но с другой стороны, это также создает некоторые проблемы.

Используя методы глубокого обучения, теперь любой человек с мощным графическим процессором и обучающими данными может создать правдоподобное поддельное изображение или видео с DeepFakes.

1

Эта проблема настолько опасна, что Пентагон через Агентство перспективных исследовательских проектов в области обороны (DARPA) сотрудничает с несколькими крупнейшими исследовательскими институтами страны для решения проблемы DeepFakes.

Состязательные атаки. Состязательные примеры — это исходные данные для моделей машинного обучения, которые злоумышленник намеренно спроектировал, чтобы заставить модель совершить ошибку; они как оптические иллюзии для машин.

Модель компьютерного зрения
Модель компьютерного зрения не распознает человека, когда к нему прикреплен клочок бумаги
вернуться в меню ↑

Будущее компьютерного зрения

Согласно отчету, рынок Computer Vision был оценен в 2,37 млрд. долларов США в 2017 году, и ожидается, что к 2023 году он достигнет 25,32 млрд. долларов США при CAGR 47,54%.

Мир переживает глубокую цифровую трансформацию, где нет признаков замедления. Среднемесячное потребление данных только для Jio составляет 10,8 ГБ.

Согласно этому отчету, каждую минуту :

  • Пользователи смотрят 4 146 600 видео на YouTube
  • Пользователи Instagram опубликовали 46 740 фотографий
  • Пользователи Snapchat делятся 527 760 фотографиями

Даже несмотря на все увлекательные разработки, ИИ и область компьютерного зрения особенно нуждаются в решении проблем, связанных с ним в настоящее время, таких как предвзятость, неосведомленность о риске и отсутствие объяснимости.

Чтобы решить такие проблемы, такие компании, как Ping An, начали предпринимать шаги, используя Symbolic AI, раннюю форму AI, современные алгоритмы AI.

Есть вопрос или дополнение?

      Оставить отзыв

      EdAdvisor
      Регистрация
      Сброс пароля
      Сравнить товары
      • Итого (0)
      Сравнить
      0