Google выпускает API Cloud Vision с демонстрацией для робота на основе Pi

Google выпустил предварительный просмотр API Cloud Vision для таких задач, как идентификация объектов и лиц, а также демонстрационная версия Linux, работающая на роботе на основе Raspberry Pi.

Некоторые из инструментов анализа изображений, используемых службами Google, такими как Google Photos, теперь доступны для разработчиков.
По словам компании, Google предлагает бесплатный ограниченный предварительный просмотр своего API Google Cloud Vision, который доступен в виде «простого в использовании» API REST.
Google также выпустил демонстрационный код, используя API, который превращает робота Dexter Industries GoPiGo на базе Raspberry Pi или любого другого робота с поддержкой камер на основе Pi в бота для распознавания и анализа изображений.


Аннотации, возвращаемые Cloud Vision API на изображениях

(нажмите на картинку, чтобы увеличить)

API Google Cloud Vision, основанный на поддерживаемой Google библиотеке машинного интеллекта TensorFlow с открытым исходным кодом, объединяет модели машинного обучения, которые могут быстро классифицировать изображения по тысячам категорий.
API также может обнаруживать объекты и лица в изображениях, хотя Google отмечает, что он не позволяет распознавать лица, и обещает, что идентификаторы лиц не хранятся на серверах Google.
По словам Google, другие приложения включают создание метаданных из каталога изображений, выявление оскорбительного контента или анализ «настроения изображения» в маркетинговых целях.

Говорят, что функции Cloud Vision API включают в себя:

  • Обнаружение метки / объекта - определение доминирующего объекта в изображении и создание метаданных на основе каталога изображений для поиска или рекомендаций на основе изображений.
  • Оптическое распознавание символов - извлекайте и воспроизводите текст с изображения с автоматической идентификацией языка, поддерживающей несколько языков.
  • Обнаружение безопасного поиска - обнаружение недопустимого содержимого в изображении (на основе Google SafeSearch).
  • Обнаружение лица - обнаружение лиц и черт лица, таких как расположение глаз, носа и рта, а также определение вероятности наличия более восьми атрибутов, таких как радость и печаль.
  • Обнаружение ориентира - Идентифицируйте популярные природные и искусственные сооружения, а также связанные с ними широту и долготу.
  • Обнаружение логотипа - определение логотипов продукта.

API Cloud Vision со временем будет развиваться по мере появления новых концепций.
Например, Google планирует поддерживать интеграцию с Google Cloud Storage.
Одним из первых бета-тестеров был Aerosense , профессиональный беспилотник с фиксированным крылом, разработанный Sony и ZMP.


GoPiGo (слева) и тестирование возможностей распознавания эмоций API Cloud Vision

(нажмите на картинку, чтобы увеличить)

По словам Google, демонстрационное приложение робота Raspberry Pi состоит из «нескольких сотен» строк кода Python, который вызывает API Vision.
На видео YouTube ниже показан бот GoPiGo на колесах, на котором запущена демоверсия, но он работает с любым роботом на основе Raspberry Pi.
Демо-версия позволяет роботу идентифицировать объекты и основные эмоции во время движения.
Вы даже можете научить робота следовать за лицом.

GoPiGo работает с Cloud Vision API

Дальнейшая информация

Ограниченный предварительный просмотр Google Cloud Vision API, а также демонстрация робота Raspberry Pi доступны для бесплатного скачивания.
Дополнительную информацию можно найти в объявлении о выпуске в Google Cloud Blog , а также на странице продукта Google Cloud Vision API .