Понедельник, 22 Апрель 2019 18:30

Запущен сервис Yandex Vision, который будет конкурировать с Abbyy и распознавать лица

«Яндекс.облако» открыло доступ к собственной технологии компьютерного зрения, ранее применявшейся только в проектах «Яндекса». Теперь сторонние разработчики смогут встроить в свои программы функции распознавания текста, классификации изображений и определения пристутствия людей на фотографиях.[CNews]

Новый сервис в облаке «Яндекса»

«Яндекс» запустил на своей облачной платформе «Яндекс.облако» сервис Yandex Vision. Новый сервис предназначен исключительно для разработчиков ПО и предлагает набор технологий компьютерного зрения «Яндекса» для распознавания информации на изображениях. Он объединяет технологии оптического распознавания символов (OCR, Optical character recognition), классификации изображений и обнаружения лиц.

Ранее Yandex Vision, как рассказали CNews в компании, использовался только во внутренних проектах, в частности в поисковом движке и переводчике «Яндекса».

Представители «Яндекса» в разговоре с CNews в числе конкурентов Yandex Vision назвали решения Google‎ и Abbyy. Действительно, Google Cloud Vision API и Abbyy OCR Cloud SDK схожи по назначению и функциональности с новым облачным сервисом «Яндекса».

Yandex Vision, как утверждают представители компании, легко интегрируется с приложениями через интерфейсы REST API или gRPC API, а для осуществления интеграции от разработчика не требуется наличие опыта в области машинного обучения.

Распознавание текста

С помощью сервиса Yandex Vision разработчики могут добавлять в собственные продукты функцию распознавания текста в документах и изображениях. Если оцифрованное изображение (фотография, сканированная страница) содержит текст, то Yandex Vision его распознает. На данный момент сервис поддерживает более 40 языков, в том числе языки стран СНГ.

Такие показатели достигаются при распознавании машинописных источников хорошего качества. Согласно документации, опубликованной на сайте «Яндекс.облака», сейчас сервис работает с некоторыми ограничениями, к примеру, алгоритм Yandex Vision не лучшим образом распознает рукописный, вертикальный или очень крупный текст.

Главными конкурентными преимуществами нового сервиса в «Яндексе» считают низкую цену – около 0,1 руб. за страницу распознанного текста, высокую скорость работы алгоритма (1–2 секунды на страницу документа), а также высокое качество итогового результата. По данным «Яндекса», для набора сфотографированных и отсканированных документов русский и английский тексты распознаются со средней точностью около 96%, казахский – 94%.

Обнаружение лиц и классификация изображений

Помимо распознавания текста Yandex Vision также позволяет определить наличие лиц на изображении и их количество, а также получить их координаты для последующей обработки. Например, возможно найти все лица на загруженных пользователем фотографиях и предложить отметить знакомых людей.

Технология классификации изображений поможет проанализировать контент, который загружают пользователи, чтобы, к примеру, выявить нарушение авторских прав по наличию водяных знаков или отфильтровать нежелательный контент.

Возможности Yandex Vision по обнаружению лиц и классификации изображений в настоящее время находятся на стадии превью, поэтому предоставляются бесплатно.

Планы по развитию сервиса

Отвечая на вопрос CNews о планах по развитию Yandex Vision, представители «Яндекса» рассказали, что планируют работать над увеличением количества сервисов компьютерного зрения как для обработки документов, так и для работы с фотографиями и видеопотоком.

Напомним, что разработкой ПО для распознавания символов в видеопотоке занимается другая российская компания – Smart Engines. CNews ранее рассказывал о некоторых ее проектах, в частности о системе распознавания паспортов, модуле для мобильного приложения 6profis, используемого легальными секс-работниками Германии, а также программе распознавания танков.

Первый опыт применения

Рассказывая о примерах практического применения Yandex Vision вне «Яндекса», представители компании цитируют слова Сергея Юдовского, главы компании Electroneek Robotics, занимающейся развитием платформы для автоматизации бизнес-задач: «Мы внедрили Yandex Vision в нашу платформу для автоматизации бизнес-задач и получили десятикратное ускорение обработки документов, возможность полностью исключить ручной труд при переносе данных системы документооборота».

Отдельно Юдовский отмечает высокое качество работы сервиса с текстами на языках стран СНГ.

Подробнее о «Яндекс.облаке»

О доступности набора инфраструктурных и платформенных сервисов, объединенных под брендом «Яндекс.облако», для всех желающих стало известно в декабре 2018 г., а публично о запуске «Облака» было объявлено в начале сентября 2018 г.

«Облако» позволяет получить доступ к масштабируемой виртуальной инфраструктуре, сервисам управления базами данных, распознавания и синтеза речи, машинного перевода и прочим услугам. Центры обработки данных «Яндекс.облака» расположены в России, что позволяет пользователям облачных услуг соблюдать закон 152-ФЗ «О персональных данных» с учетом последних поправок, которые обязывают компании, имеющие дело с персональными данными россиян, хранить эти данные на территории России. По состоянию на 2018 г. «Яндекс» владеет четырьмя ЦОДами в Москве и Подмосковье, по одному – в Рязанской области и Финляндии, а также одним дата-центром во Владимире.

По данным «Яндекса», в первые три месяца с момента анонса «Облаком» заинтересовались свыше 10 тыс. российских и международных компаний, а с апреля 2018 г. по сентябрь 2018 г. им воспользовались более 50 компаний, специально приглашенных «Яндексом» для участия в тестировании. Среди них «Тинькофф банк», X5 Retail Group (магазины «Пятерочка», «Карусель», «Перекресток»), авиакомпания S7, платформа для управления бизнесом «Битрикс24».

В числе известных пользователей платформы также назывались: российское представительство американского издательства Condé Nast, выбравшее ее с целью размещения мультимедийных веб-сайтов; MerlionCloud, российский дистрибьютор облачных решений, который предложил услугу резервного копирования и восстановления данных на базе продуктов Commvault с использованием объектного хранилища «Облака»; отечественный поставщик услуг в сфере Wi-Fi-маркетинга Hot-Wi-Fi, развернувший свои базы данных на инфраструктуре «Яндекса»; онлайн-школа английского языка Skyeng, которая также перенесла свою среду разработки в облако «Яндекса».

В начале апреля 2019 г. в облаке был запущен сервис визуализации и сопоставления пользователями своих корпоративных данных, позволив «Яндексу» выйти на рынок облачной бизнес-аналитики, где своими конкурентами компания видит Google Data Studio и Microsoft Power BI.

Заявка на участие в тренинге
Личные данные

ФИО (англ.яз)
Неверный ввод

ФИО (рус.яз)
Неверный ввод

ФИО (каз.яз)
Неверный ввод

Дата рождения
Неверный ввод

Пол
Неверный ввод

Адрес

Страна
Неверный ввод

Город
Неверный ввод

Улица, дом, квартира
Неверный ввод

Почтовый индекс
Неверный ввод

Бизнес информация

Область деятельности
Неверный ввод

Место работы
Неверный ввод

Должность
Неверный ввод

Контактные данные

Мобильный телефон
Неверный ввод

Домашний телефон
Неверный ввод

Рабочий телефон
Неверный ввод

Электронная почта
Неверный ввод

Skype
Неверный ввод

Уровень образования на время заполнения заявки:
Неверный ввод

ОБРАЗОВАНИЕ (1)

Учебное заведение
Неверный ввод

Факультет
Неверный ввод

Специальность
Неверный ввод

Дата окончания
Неверный ввод

Номер диплома
Неверный ввод

Ученая степень

Дата получения
Неверный ввод

Степень
Неверный ввод

Название и номер документа, удостоверяющего получение
Неверный ввод