Блог

Что такое точность распознавания изображений в ритейле

Производители стремятся быть уверенными, что все их усилия по продвижению своей продукции в магазинах - эффективны и приносят большую прибыль. Им нужно понимать, какие товары их конкурентов сейчас продаются вместе с их товарами в магазинах, их цену и вес, места на полках.

Один из методов, который является отраслевым стандартом, — это распознавание фотографий товаров на полках и дальнейший анализ необработанных данных. Основная цель такого анализа — определить атрибуты продукта, извлечь информацию в базу данных и позволить производителю принимать обоснованные решения на основе научного подхода.

Решение на основе компьютерного зрения Inspector Cloud эффективно выполняет все эти задачи. Благодаря хорошо обученным и постоянно обновляемым моделям нейронных сетей платформа может легко идентифицировать, извлекать и анализировать данные (атрибуты продукта) по фотографиям.

Что лучше: компьютер или человеческий мозг?

В нашей отрасли существует несколько разных подходов к обработке изображений. Некоторые поставщики решений набирают и обучают сотни людей для ручной обработки необработанных данных, полученных в ходе распознавания изображений. Ключевая задача персонала — вручную маркировать товары на изображениях и определять их атрибуты на глаз. Результатом их труда является база пригодных для анализа данных.

Это не относится к нашему решению. Нейронные сети, интегрированные в платформу, полностью основаны на статистике. Распознавание изображений, выполняемое Inspector Cloud, является полностью автоматизированным процессом и работает в режиме реального времени.

Должны ли мы доверять компьютеру больше, чем человеку, или наоборот?

На данный момент компьютерное зрение — передовая технология, и в некоторых случаях оно справляется с подобными задачами лучше, чем человек. Однако очевидно, что и компьютер, и человек могут выйти из строя.

Мы считаем, что единственный способ исключить человеческий фактор — это правильно обучить персонал. Мы также понимаем, как постоянно контролировать и повышать производительность решения на основе компьютерного зрения. В платформу Inspector Cloud мы интегрировали множество количественных характеристик, которые помогают отслеживать правильность работы системы на каждом этапе, выявлять ключевые проблемы и устранять их.

Почему точность?

В области машинного обучения существует ряд хорошо известных метрик качества для задачи обнаружения и классификации объектов. Точность, полнота, оценка F1, матрица путаницы, средняя точность — все это часто используется исследователями для оценки качества решения и указания относительной частоты различных типов ошибок. Несмотря на их несомненную полезность для анализа и совершенствования систем компьютерного зрения, все эти метрики требуют специальных знаний и профессиональной подготовки для правильной интерпретации. В том числе со стороны наших клиентов.

Мы сотрудничали с несколькими производителями, и в результате мы поняли, что клиентам, внедряющим решения на основе компьютерного зрения, удобно смотреть только на один показатель, который определяет, хорошо ли работает решение и можно ли ему доверять, и это точность распознавания изображений.

Несмотря на то, что большинство поставщиков на рынке предпочитают использовать эту метрику, некоторые предлагают применять другие метрики. На рынке нет стандартизированного подхода к точности распознавания изображений.

В Inspector Cloud мы разработали подход к расчету точности распознавания изображений для решения конкретных задач. По определению, точность распознавания изображений — это метрика, определяющая производительность решения, предназначенного для извлечения атрибутов продуктов, зафиксированных в изображениях, сохранения необработанных данных в базе данных и их анализа.

Точность выражается в процентах, где:

  • 0% означает, что решение по распознаванию изображений вообще не работает; оно не может правильно распознать ни один товар на полках.
  • 100% означает идеальное функционирование, когда каждый товар на изображении определен и для анализа доступна исчерпывающая информация о любом товаре. На практике 100% точность недостижима.

Насколько точность точна?

Некоторые клиенты требуют уровень точности 99% (или даже 99,9%). Мы считаем, что клиенты должны иметь четкое представление о том, как работает технология, чтобы они могли правильно использовать решения, основанные на распознавании изображений, без нереалистичных ожиданий.

Мы хотим подчеркнуть, что ожидать 100% точности нереально и контрпродуктивно. По нашему опыту, самый высокий уровень точности распознавания розничных изображений, которого можно достичь на практике, составляет около 98%. Если ваш поставщик обещает 100%-ю точность распознавания изображений, подумайте дважды.

Обычно мы определяем целевой уровень точности и штрафы за его невыполнение в контрактах с клиентами. В большинстве случаев мы гарантируем уровень точности 95% и используем нашу формулу для его оценки. Тем не менее, на практике средний уровень точности выше и может достигать 98%. Средний уровень точности рассчитывается как сумма значений за определенный период времени. В нашем решении мы ежедневно отслеживаем уровень точности.

Уровень точности 95% является нормой в нашей отрасли. Этого уровня точности достаточно для задач, для которых производителям нужны решения на основе компьютерного зрения, и позволяет рассчитывать вознаграждения сотрудников и отслеживать ситуацию на рынке.