Прежде чем бросаться во все тяжкие, порекомендовал хотя бы по вершкам пройтись по основам нейросетей.
Т.к. это тема достаточна обширная, и за пару вечерков сразу и не въедешь.
Начать с того, какие бывают архитектуры сетей. И какие для чего используются.
Например вот шпаргалка.
Статья на Tproger — Шпаргалка по разновидностям нейронных сетей. Часть первая. Элементарные конфигурации
tproger.ru
Григорий Сапунов (Intento) Меня зовут Григорий Сапунов, я СТО компании Intento. Занимаюсь я нейросетями довольно давно и machine learning’ом, в частности, занимался построением нейросетевых...
habr.com
Если касательно картинок и распознавания что там, то это CNN, они тоже бывают разные.
Перевод Neural Network Architectures Алгоритмы глубоких нейросетей сегодня обрели большую популярность, которая во многом обеспечивается продуманностью архитектур. Давайте рассмотрим историю их...
habr.com
Но еще больший интерес представляют RCNN. Такие сети не просто распознают что там, но и могут определить место где находится нужный объект.
Времена, когда одной из самых актуальных задач компьютерного зрения была способность отличать фотографии собак от фотографий кошек, уже остались в прошлом. На данный момент нейронные сети способны выполнять куда более сложные и интересные задания по обработке изображений.
www.nanonewsnet.ru
Одна из наиболее шустрых сетей относящихся к RCNN это YOLO3. По ссылке можно посмотреть сравнительную таблицу аналогичных сетей.
You only look once (YOLO) is a state-of-the-art, real-time object detection system.
pjreddie.com
Например есть такая капча как GeeTest(на скрине старый вариант, сейчас капча чутка другая), где надо жмакнуть по картинкам из задания.
Вот для этого и нужна RCNN, чтобы были координаты прямоугольника в который вписан объект распознанный нейронкой.
С архитектурой чутка разобрались, едем дальше.
Чтобы обучить сетку, нужны размеченные данные, так называемый датасет. Вот примеры.
Для машинного обучения (и не только) требуется много хороших данных. Вместо того чтобы собирать их самому, можно воспользоваться готовыми датасетами.
tproger.ru
Кто хоть раз ковырялся с капмонстром, и подготавливал данные, тот уже работал с датасетом.
Задача, подготовить данные, чтобы объяснить сетке, что вот тут "кошечка", а вот тут "собачка".
Чем больше данных, тем качественнее будет обучение. Больше понятие относительное, для каждого типа задачи может быть по разному.
К примеру если задача обучить сетку отличать котиков от собачек, то чем больше будет разных картинок тем лучше.
Если вернуться к тому же geetest, то там картинка каждого класса поворачивается и чутка масштабируется, но по факту одна и та же. Т.е. картинок надо собирать меньше.
Дальше надо определиться, какой фреймворк будет использоваться для обучения и дальнейшей работы с сеткой. Благо сейчас выбор большой, и есть из чего выбрать.
И напоследок. Надо понимать, что работа с сетками требует серьезных вычислительных ресурсов. Опять же все зависит от сетки.
Например:
Фреймворк - darknet.
Сетка - YOLO3.
Задача - geetest.
Датасет - больше 200 классов объектов.
Обучение - gtx 1070 херачила больше 3 суток.
Можно конечно взять уже готовую обученную сеть, и дообучить нескольким новым классам, тогда времени займет в разы меньше.
На десерт. Сайт на котором куча всего интересного по сеткам. Рекомендуется к постоянному мониторингу.
Нейронные сети, state-of-the-art модели машинного обучения, новости computer vision и deep learning, задачи на python и javascript
neurohive.io
Также не забываем youtube. Где тоже можно найти много интересных видосов по работе с сетками.