Подписка
2025/11/01
Как машинное зрение повышает безопасность и эффективность автоматизации

Машинное зрение — это совокупность технологий, обеспечивающих автоматизированному оборудованию высокоуровневое понимание окружающей среды на основе изображений. Без программного обеспечения для машинного зрения цифровые изображения представляли бы собой всего лишь набор разрозненных пикселей. Машинное зрение позволяет компьютерам обнаруживать контуры и формы на изображениях, позволяя более высокоуровневым программам обработки идентифицировать заранее определённые объекты. В этом смысле изображения не обязательно ограничиваются фотографическими снимками в видимом спектре; они также могут включать изображения, полученные с помощью инфракрасных, лазерных, рентгеновских и ультразвуковых сигналов.

Сегодня одним из распространённых применений машинного зрения в промышленности является идентификация конкретной детали в контейнере, содержащем случайно размещённые детали. В этом случае машинное зрение может помочь роботам-погрузчикам автоматически подобрать нужную деталь. Конечно, распознавание таких деталей с помощью обратной связи по изображению было бы относительно простым, если бы все они были аккуратно разложены и одинаково ориентированы на поддоне. Однако надёжные алгоритмы машинного зрения способны распознавать объекты как на разном расстоянии от камеры, так и в разных ориентациях.

Самые сложные системы машинного зрения позволили создать новые и перспективные проекты, гораздо более сложные, чем сбор мусора в мусорных контейнерах.

Технологии машинного зрения

Термин «машинное зрение» иногда используется для обозначения более устоявшихся и эффективных математических методов извлечения информации из изображений. В отличие от этого, термин «компьютерное зрение» обычно описывает более современные и ресурсоёмкие системы, включая подходы «чёрного ящика», использующие машинное обучение или искусственный интеллект (ИИ). Однако машинное зрение может также служить общим термином, охватывающим все методы извлечения высокоуровневой информации из изображений.

Технологии извлечения высокоуровневой информации из изображений получают всё большее распространение. В исследовательском сообществе такие технологии часто рассматриваются как отличные от машинного зрения. Однако на практике все они представляют собой различные способы реализации машинного зрения и во многих случаях пересекаются.

Цифровая обработка изображений — это разновидность цифровой обработки сигналов, включающая улучшение, восстановление, кодирование и сжатие изображений. Преимуществами по сравнению с аналоговой обработкой изображений являются минимизация шума и искажений, а также наличие гораздо большего количества алгоритмов. Цифровое улучшение изображений часто включает повышение контрастности и может также включать геометрическую коррекцию угла обзора и искажений объектива. Сжатие обычно достигается путём аппроксимации комплексного сигнала комбинацией косинусных функций.

Фотограмметрия использует определённый метод идентификации объектов для извлечения данных из изображений. Эти данные могут включать трёхмерную информацию, если несколько изображений одной и той же сцены получены с разных точек. Простейшие системы фотограмметрии измеряют расстояние между двумя точками на изображении, используя определённую шкалу. Для этого обычно требуется включить в изображение известную точку отсчёта масштаба.

Обнаружение объектов позволяет компьютерам определять края и углы или точки на изображении. Это необходимый первый шаг для фотограмметрии, а также для идентификации объектов и движения. Обнаружение пятен позволяет выявлять области со слишком гладкими краями для обнаружения краев или углов.

Распознавание образов используется для идентификации конкретных объектов. В простейшем случае это может означать поиск определённой, чётко определённой механической детали на конвейере.

3D-реконструкция определяет трёхмерную форму объектов по двумерным изображениям. Это достигается фотограмметрическими методами, в которых высоты общих элементов рельефа (обнаруженных на изображениях с разных точек наблюдения) определяются методом триангуляции. 3D-реконструкция также возможна по одному двумерному изображению.

Как упорядочиваются задачи машинного зрения

Многие системы машинного зрения постепенно объединяют вышеперечисленные методы, начиная с низкоуровневых операций и постепенно переходя к более высокоуровневым. На самом низком уровне все пиксели изображения хранятся в виде данных с высокой пропускной способностью. Затем каждая операция в последовательности идентифицирует особенности изображения и представляет интересную информацию с помощью относительно небольших объёмов данных.

Сначала выполняются низкоуровневые операции улучшения и восстановления изображений, а затем – обнаружение объектов. При использовании нескольких датчиков низкоуровневые операции могут выполняться распределенными процессами, предназначенными для каждого датчика. После обнаружения объектов на отдельных изображениях могут быть выполнены более высокоуровневые фотограмметрические измерения, а также идентификация объектов и другие задачи, основанные на объединенных данных с нескольких изображений и датчиков.

 

Прямые вычисления и алгоритмы обучения

Прямые вычисления в контексте машинного зрения представляют собой набор математических функций, вручную определяемых программистом. Они принимают входные данные, такие как значения пикселей изображения, и выдают выходные данные, такие как координаты границ объекта. В отличие от этого, алгоритмы обучения не пишутся людьми напрямую, а обучаются на примерах наборов данных, связывающих входные данные с желаемыми выходными данными. Работая по принципу «чёрных ящиков», машинное обучение теперь использует для своих вычислений глубокое обучение на основе искусственных нейронных сетей.

Простое машинное обучение для промышленных приложений часто оказывается более надёжным и менее ресурсоёмким, если основано на прямых вычислениях. Конечно, существуют ограничения в возможностях прямых вычислений. Например, прямые вычисления не могут обеспечить продвинутое распознавание образов, необходимое для идентификации людей по лицам, особенно на видеотрансляции из многолюдного общественного пространства. В отличие от них, машинное обучение отлично справляется с такими задачами. Неудивительно, что машинное обучение всё чаще применяется для низкоуровневых операций машинного зрения, включая улучшение, восстановление изображений и обнаружение особенностей.

 

Машинное зрение для промышленной безопасности

Машинное зрение больше не является узкоспециализированной технологией. Эта технология переживает самый бурный рост внедрения в промышленных приложениях. Наиболее впечатляющим достижением является то, как машинное зрение теперь дополняет системы безопасности промышленных предприятий, которые подают звуковой сигнал тревоги или воспроизводят звуковые оповещения, когда персонал предприятия входит в рабочую зону без каски, маски или других необходимых средств защиты. Машинное зрение также может дополнять системы, оповещающие о приближении мобильной техники, например, вилочных погрузчиков, слишком близко к людям.

Эти и аналогичные системы машинного зрения иногда могут заменить жёсткие ограждения вокруг промышленных роботов, обеспечивая более эффективную работу. Они также могут заменить или улучшить системы безопасности, основанные на световых барьерах, которые просто останавливают оборудование, если работник входит в производственную ячейку. Когда машинное зрение контролирует производственный цех вокруг рабочей ячейки, роботы в таких ячейках могут постепенно замедляться по мере приближения людей.

Проектирование промышленных объектов развивается с учётом использования коллаборативных роботов и другого оборудования рабочих ячеек, безопасного для персонала, даже во время работы оборудования. Эти и другие системы, основанные на машинном зрении, станут гораздо более распространённой частью производственных процессов.

Понимая принципы проектирования и внедрения интеллектуальных систем машинного зрения, инженеры и производители могут эффективно интегрировать инструменты визуального интеллекта на производственных предприятиях, повышая безопасность и эффективность. В условиях стремительного развития технологий DigiKey продолжает предлагать инновационные решения для автоматизации — от Интернета вещей до искусственного интеллекта и машинного зрения.

Источник

Еще больше новостей
в нашем телеграмм-канале

Вернуться к списку новостей