
Универсальный движок CV
Фримиум
Ultralytics YOLO — это отраслевой стандарт для обнаружения, сегментации и классификации объектов в реальном времени. В отличие от разрозненных библиотек CV, он предоставляет унифицированный API, который абстрагирует сложные архитектуры моделей (YOLOv8, YOLOv11, NAS) в простой Python-интерфейс. Фреймворк отличается экстремальной оптимизацией для периферийных устройств, поддерживая экспорт в TensorRT, CoreML и ONNX. Он создан для разработчиков и исследователей, которым необходимо перейти от прототипа к промышленным конвейерам вывода без переписывания кода, обеспечивая высокую пропускную способность как на CPU, так и на GPU.
Ultralytics предоставляет согласованный объектно-ориентированный API для всех версий моделей. Это устраняет необходимость изучать новый синтаксис при переключении между задачами обнаружения, сегментации или оценки позы. Стандартизируя рабочие процессы обучения, валидации и предсказания, разработчики могут сократить объем шаблонного кода до 70% по сравнению с пользовательскими реализациями PyTorch, обеспечивая более быстрые циклы итераций в производственных средах.
Фреймворк поддерживает более 10 форматов экспорта, включая TensorRT, CoreML, TFLite и ONNX. Это позволяет разработчикам обучать модели на мощных GPU NVIDIA и беспрепятственно развертывать их на периферийных устройствах с ограниченными ресурсами, таких как Raspberry Pi, мобильные телефоны или встраиваемые системы. Утилита экспорта автоматически выполняет квантование и оптимизацию графа, обеспечивая минимальную задержку при выводе.
Движок Ultralytics, разработанный для скорости, достигает субмиллисекундного времени вывода на современном оборудовании. Используя оптимизированные ядра CUDA и эффективное управление памятью, он превосходит стандартные реализации PyTorch. Это делает его пригодным для обработки видео в реальном времени со скоростью 60+ FPS, что критически важно для таких приложений, как автономная робототехника, мониторинг дорожного движения и промышленный контроль качества, где задержка является основным ограничением.
Включает встроенный, легко настраиваемый конвейер аугментации, который применяет мозаику, mixup и геометрические преобразования «на лету» во время обучения. Это значительно повышает устойчивость и обобщающую способность модели, снижая потребность в огромных наборах данных. Автоматизируя эти сложные этапы предобработки, разработчики могут достичь современных показателей mAP (mean Average Precision) с меньшими и более разнообразными обучающими выборками.
Предоставляет обширную библиотеку предобученных моделей: от 'Nano' (n) для периферийных устройств до 'Extra Large' (x) для высокоточных серверных задач. Такая масштабируемость позволяет командам выбирать оптимальный баланс между скоростью и точностью для конкретных аппаратных ограничений. Каждая модель предобучена на наборе данных COCO, что обеспечивает прочную основу для трансферного обучения на пользовательских данных.
Установите библиотеку через pip: 'pip install ultralytics'.,Импортируйте класс YOLO в свой Python-скрипт: 'from ultralytics import YOLO'.,Загрузите предобученную модель: 'model = YOLO("yolo11n.pt")'.,Запустите вывод на изображении или видео: 'results = model.predict("source.jpg")'.,Получите результаты обнаружения через объект results для извлечения ограничивающих рамок, масок или вероятностей классов.,Экспортируйте обученную модель для развертывания с помощью 'model.export(format="onnx")' для оптимизированного промышленного вывода.
Производственные компании используют Ultralytics для обнаружения дефектов поверхности на сборочных линиях в реальном времени. Развертывая модели YOLO на периферийных камерах, они достигают мгновенной идентификации неисправных компонентов, сокращая отходы и обеспечивая 100% охват контроля без участия человека.
Инженеры-робототехники интегрируют YOLO для обнаружения объектов и пространственного ориентирования в реальном времени. Фреймворк позволяет роботам идентифицировать препятствия, перемещаться в пространстве и взаимодействовать с объектами, обеспечивая низкую задержку визуальной обратной связи, необходимую для безопасной и эффективной автономной работы.
Системы управления дорожным движением используют фреймворк для анализа видеопотоков с целью подсчета транспортных средств, распознавания номерных знаков и обеспечения безопасности пешеходов. Высокая пропускная способность вывода позволяет одному серверу обрабатывать несколько потоков с камер одновременно, предоставляя полезные данные для городского планирования.
Необходимость быстрого развертывания готовых к производству моделей. Ultralytics предоставляет инструменты для перехода от исследований к развертыванию без затрат на создание пользовательских конвейеров вывода с нуля.
Фокус на развертывании моделей на оборудовании с ограниченными вычислительными мощностями. Они полагаются на надежные функции экспорта и квантования Ultralytics для поддержания высокой производительности на встраиваемых устройствах.
Требуется надежный, хорошо документированный фреймворк для быстрого прототипирования и экспериментов. Простота использования и обширная документация Ultralytics позволяют им эффективно проверять гипотезы и итерировать наборы данных.
Открытый исходный код (лицензия AGPL-3.0). Корпоративная поддержка и варианты коммерческого лицензирования доступны через Ultralytics HUB для управляемых облачных развертываний.