
Moteur de vision par ordinateur
Freemium
Ultralytics YOLO est un framework standard de l'industrie pour la détection, la segmentation et la classification d'objets en temps réel. Contrairement aux bibliothèques CV fragmentées, il fournit une API unifiée qui abstrait les architectures de modèles complexes (YOLOv8, YOLOv11, NAS) en une interface Python simple. Il se distingue par une optimisation extrême pour les appareils edge, prenant en charge l'exportation vers TensorRT, CoreML et ONNX. Le framework est conçu pour les développeurs et chercheurs ayant besoin de passer du prototype aux pipelines d'inférence de qualité production sans réécrire de code, offrant des performances à haut débit sur les environnements CPU et GPU.
Ultralytics fournit une API cohérente et orientée objet pour toutes les versions de modèles. Cela élimine le besoin d'apprendre une nouvelle syntaxe lors du passage entre les tâches de détection, de segmentation ou d'estimation de pose. En standardisant les flux de travail d'entraînement, de validation et de prédiction, les développeurs peuvent réduire le code répétitif jusqu'à 70 % par rapport aux implémentations PyTorch personnalisées, garantissant des cycles d'itération plus rapides dans les environnements de production.
Le framework prend en charge plus de 10 formats d'exportation, dont TensorRT, CoreML, TFLite et ONNX. Cela permet aux développeurs d'entraîner des modèles sur des GPU NVIDIA haut de gamme et de les déployer de manière transparente sur des appareils edge aux ressources limitées comme Raspberry Pi, les téléphones mobiles ou les systèmes embarqués. L'utilitaire d'exportation gère automatiquement la quantification et l'optimisation des graphes, garantissant une latence minimale lors de l'inférence.
Conçu pour la vitesse, le moteur Ultralytics atteint des temps d'inférence inférieurs à la milliseconde sur le matériel moderne. En tirant parti de noyaux CUDA optimisés et d'une gestion efficace de la mémoire, il surpasse les implémentations PyTorch standard. Cela le rend adapté au traitement vidéo en temps réel à plus de 60 FPS, essentiel pour des applications comme la robotique autonome, la surveillance du trafic et le contrôle qualité industriel où la latence est une contrainte majeure.
Inclut un pipeline d'augmentation intégré et hautement configurable qui applique des transformations mosaic, mixup et géométriques à la volée pendant l'entraînement. Cela améliore considérablement la robustesse et la généralisation du modèle, réduisant le besoin de jeux de données manuels massifs. En automatisant ces étapes de prétraitement complexes, les développeurs peuvent atteindre des scores mAP (mean Average Precision) de pointe avec des jeux d'entraînement plus petits et plus diversifiés.
Fournit une bibliothèque complète de modèles pré-entraînés allant de 'Nano' (n) pour les appareils edge à 'Extra Large' (x) pour les tâches serveur haute précision. Cette évolutivité permet aux équipes de choisir l'équilibre optimal entre vitesse et précision pour leurs contraintes matérielles spécifiques. Chaque modèle est pré-entraîné sur le jeu de données COCO, fournissant une base solide pour l'apprentissage par transfert sur des données spécifiques à un domaine.
Installez la bibliothèque via pip : 'pip install ultralytics'.,Importez la classe YOLO dans votre script Python : 'from ultralytics import YOLO'.,Chargez un modèle pré-entraîné : 'model = YOLO("yolo11n.pt")'.,Exécutez l'inférence sur une source d'image ou de vidéo : 'results = model.predict("source.jpg")'.,Accédez aux résultats de détection via l'objet results pour extraire les boîtes englobantes, les masques ou les probabilités de classe.,Exportez votre modèle entraîné pour le déploiement en utilisant 'model.export(format="onnx")' pour une inférence de production optimisée.
Les entreprises manufacturières utilisent Ultralytics pour détecter les défauts de surface sur les lignes d'assemblage en temps réel. En déployant des modèles YOLO sur des caméras edge, elles obtiennent une identification instantanée des composants défectueux, réduisant le gaspillage et garantissant une couverture d'inspection à 100 % sans intervention humaine.
Les systèmes de gestion du trafic utilisent le framework pour analyser les flux vidéo afin de compter les véhicules, détecter les plaques d'immatriculation et assurer la sécurité des piétons. L'inférence à haut débit permet à un seul serveur de traiter plusieurs flux de caméras simultanément, fournissant des données exploitables pour l'urbanisme.
Besoin de déployer rapidement des modèles prêts pour la production. Ultralytics fournit les outils pour passer de la recherche au déploiement sans la surcharge liée à la création de pipelines d'inférence personnalisés à partir de zéro.
Se concentrent sur le déploiement de modèles sur du matériel avec une puissance de calcul limitée. Ils s'appuient sur les fonctionnalités robustes d'exportation et de quantification d'Ultralytics pour maintenir des performances élevées sur les appareils embarqués.
Nécessitent un framework fiable et bien documenté pour le prototypage rapide et l'expérimentation. La facilité d'utilisation et la documentation étendue d'Ultralytics leur permettent de tester des hypothèses et d'itérer efficacement sur les jeux de données.
Open source (licence AGPL-3.0). Support entreprise et options de licence commerciale disponibles via Ultralytics HUB pour les déploiements cloud gérés.