The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Доступен Luminoth, тулкит для решения задач компьютерного зрения

23.04.2018 08:16

Представлен выпуск тулкита Luminoth 0.1, предоставляющего инструменты для использования методов компьютерного зрения. В настоящее время функциональность Luminoth ограничена поддержкой распознавания и классификации объектов на изображениях и видео, но в будущем ожидается добавление новых методов обработки и анализа. Код проекта написан на языке Python и распространяется под лицензией BSD.

Для организации работы нейронных сетей с реализациями алгоритмов выделения объектов в Luminoth используется платформа машинного обучения TensorFlow и библиотека построения сложных нейронных сетей Sonnet (работает поверх TensorFlow). Для ускорения работы нейронной сети возможно привлечение GPU или Google Cloud ML Engine. Предоставляются две модели определения объектов - Faster R-CNN и SSD (Single Shot Multibox Detector).

Модель Faster R-CNN обеспечивает более точные результаты, но SSD работает значительно быстрее и может использоваться для определения объектов в режиме реального времени, например, для анализа видео (при использовании GPU в SSD обеспечивается скорость анализа до 60 кадров в секунду, в то время как Faster R-CNN может обработать лишь 2-5 кадров в секунду). Luminoth предоставляет готовые слепки данных моделей, уже натренированные с использованием наборов данных COCO и Pascal VOC. Для дополнительного обучения поддерживается формат наборов ImageNet. В ближайшее время ожидается интеграция поддержки моделей RetinaNet и Mask R-CNN.

Для пользователей и разработчиков предоставляется простой интерфейс командной строки и Python API, позволяющие подключить готовые модели, при необходимости провести тренировку определения новых объектов и выполнить анализ наличия объектов (например, можно обучить систему по картинкам с динозаврами, после чего система будет сама определять есть ли на изображении динозавр, выдавать координаты выявленных объектов и при необходимости визуализировать результат).


   $ lumi predict image.png
   Found 1 files to predict.
   Neither checkpoint not config specified, assuming `accurate`.
   Predicting image.jpg... done.
   {
     "file": "image.jpg",
     "objects": [
       {"bbox": [294, 231, 468, 536], "label": "person", "prob":  0.9997},
       {"bbox": [494, 289, 578, 439], "label": "person", "prob":   0.9971},
       {"bbox": [727, 303, 800, 465], "label": "person", "prob":   0.997},
       {"bbox": [555, 315, 652, 560], "label": "person", "prob": 0.9965},
       {"bbox": [569, 425, 636, 600], "label": "bicycle", "prob": 0.9934},
       {"bbox": [326, 410, 426, 582], "label": "bicycle", "prob": 0.9933},
       {"bbox": [744, 380, 784, 482], "label": "bicycle", "prob": 0.9334},
       {"bbox": [506, 360, 565, 480], "label": "bicycle", "prob": 0.8724}

     ]
   }


  1. Главная ссылка к новости (https://tryolabs.com/blog/2018...)
  2. OpenNews: Facebook открыл код платформы Detectron для распознавания объектов на фотографиях
  3. OpenNews: Релиз библиотеки компьютерного зрения OpenCV 3.2
  4. OpenNews: Выпуск системы машинного обучения TensorFlow 1.0 и классификатора изображений ResNeXt
  5. OpenNews: В рамках проекта subpixel подготовлена нейронная сеть для восстановления изображений
  6. OpenNews: Khronos опубликовал спецификацию OpenVX 1.0
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/48478-ai
Ключевые слова: ai, luminoth, tensorflow, neural
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (22) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 09:01, 23/04/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Мне всегда казалось, что в виде опен сорса такого быть не может. Чисто физически не может: что проприетарщики, создавая такую сложную вещь, чуть ли не машинным кодом пишут
     
     
  • 2.14, Аниним (?), 09:48, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • –4 +/
    >Мне всегда казалось, что в виде опен сорса такого быть не может. Чисто физически не может

    Всё правилньо, не может. То, о чём написано в новости, по факту сможет максимум сказать, что "вот это вытянутое и с шаром на голове - наверно, человек. Вот это длинное, вытянутое и невысокое - наверно, машина.

    А вы чего ждали от программистов за спасибо?

     
     
  • 3.17, Аноним (-), 09:50, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > вот это вытянутое и с шаром на голове - наверно, человек. Вот это длинное, вытянутое и невысокое - наверно, машина

    У проприетарных с этим дело лучше? Не у тех, которые на пентагон и НАСА работают, а которые ширпотреб?

     
     
  • 4.18, Аниним (?), 09:53, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • –3 +/
    >У проприетарных с этим дело лучше? Не у тех, которые на пентагон и НАСА работают, а которые ширпотреб?

    Вот видите, вы сами ответили на свой вопрос - да, лучше, как минимум у Пентагона и НАСА. Есть ещё несколько конторок помельче, у которых с этим хорошо (в видеоиграх, например).

     
     
  • 5.20, Аноним (20), 09:57, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +/
    > Вот видите, вы сами ответили на свой вопрос - да, лучше, как
    > минимум у Пентагона и НАСА. Есть ещё несколько конторок помельче, у
    > которых с этим хорошо (в видеоиграх, например).

    У пентагона и наса и задачи наверное немного другие, а не разрабатывать тулкит для комп.зрения общего назначения.
    А что вы имеете ввиду про видеоигры? Ничего что превосходило тензорфлоу и opencv я не припомню.

     
     
  • 6.22, Аниним (?), 10:01, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • –2 +/
    >А что вы имеете ввиду про видеоигры?

    Скажем, Misrosoft и их xBox и поддержкой игр, использующих камеры. Просто видеоигры, где, например, можно создать персонажа с твоим 3D-лицом, скормив игре своё фото.

     
  • 5.54, Аноним (-), 22:51, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +/
    >>У проприетарных с этим дело лучше? Не у тех, которые на пентагон и НАСА работают, а которые ширпотреб?

    Но ведь наса делает опенсорц.

     
  • 4.52, Аноним (-), 20:00, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Был в сентябре 2017 на одной конференции. Там товарищ из Днепровского офиса Самсунга докладывал об их разработках. Так вот они не только находят людей на изображении но и определяют кто чем занят по положению частей тела относительно туловища и земли, при чем в реальном времени.
     
  • 2.15, Аноним (20), 09:50, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Наоборот.
    1)Сложные вещи лучше пилить всем миром, чем одной компанией.
    2)Если проект настолько сложный, что посторонний в нем не разребертся, то что-то пошло не так. Открытость заставляет писать как можно понятнее, что плюс для сложного проекта.+легче найти человека с использованием проекта
    3)Есть много опенсурса в тн "Машинных кодах" а-ля прошивки и схемы микропроцессоров,драйвера, ассемблерные проекты.
     

  • 1.13, Аноним (-), 09:46, 23/04/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • –7 +/
    >Для ускорения работы
    >Код проекта написан на языке Python

    Смешно поделили на ноль.

     
     
  • 2.19, Аноним (20), 09:53, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Не поделили. Какая разница кто загрузит данные в видяху и запустит код либы на плюсах и куде?
     

  • 1.16, АНБ (?), 09:50, 23/04/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    Как видите по второй фотке, зрение у нас не особо получилось — оно не опознало людей, потому забирайте этот негодный тулкит.
     
     
  • 2.21, Аноним (20), 10:00, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А вы генератор фоторобота прикрутите, глядишь и опознает и показания напишет.
     
  • 2.48, prokoudine (??), 17:07, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Ваще-то на второй фотке Люминот выделил людей и велики отдельно. Поэтому забирайте свой негодный коммент взад.
     

  • 1.23, Главврач (?), 10:35, 23/04/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Такому компьютерному зрению уже сейчас срочно нужны компьютерные офтальмологи.
    Много хайпа из ничего. По факту у кого больше набор данных для сбора статистической модели -- тот и распознаёт.
     
     
  • 2.34, Ирочка (?), 13:51, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Датасеты COCO и Pascal VOC в открытом доступе - бери и учи.
     

  • 1.24, YetAnotherOnanym (ok), 10:35, 23/04/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    > может использоваться для определения объектов в режиме реального времени

    Ну чо, малогабаритный турбореактивный двигатель из автомобильного турбонагнетателя у нас, можно считать, есть, ПО для распознавания объектов в режиме реального времени тоже есть - кажется, наша amateur cruise missile может начать обрастать железом...

     
  • 1.25, Аноним (-), 11:12, 23/04/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Надо прикрутить эту штуку к моей камере. Только стоит обучить распознавать цыган, свидетелей иеговы, продавцов и т.д. Чтоб если распознал цыгана - дверной звонок не срабатывал.
     
     
  • 2.26, Аноним (-), 11:44, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Хочу прогу, чтобы блокировала клавиатуру, если веб-камера заметила кота! (c) iBash
     
     
  • 3.42, mickvav (?), 16:26, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Она при этом будет сливать видео с камеры ноута в облако в реальном времени....
     

  • 1.37, salisbury espinosa (?), 14:37, 23/04/2018 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    камооон, ребята эти просто обернули в пакет то, что уже давным давно есть в опен сорсе в репозитории у tensorflow:
    https://github.com/tensorflow/models/tree/master/research/object_detection
    это уже года 2 в паблике
     
     
  • 2.53, Crazy Alex (ok), 20:23, 23/04/2018 [^] [^^] [^^^] [ответить]  
  • +/
    Вот и молодцы, что обернули. Глядишь, побольше народу заметит и будет использовать
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2025 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру