
Công cụ thị giác máy tính
Freemium
Ultralytics YOLO là framework tiêu chuẩn công nghiệp cho việc phát hiện, phân đoạn và phân loại đối tượng theo thời gian thực. Khác với các thư viện CV rời rạc, nó cung cấp một API thống nhất giúp trừu tượng hóa các kiến trúc mô hình phức tạp (YOLOv8, YOLOv11, NAS) thành giao diện Python đơn giản. Nó tạo sự khác biệt nhờ khả năng tối ưu hóa cực cao cho các thiết bị biên (edge devices), hỗ trợ xuất sang TensorRT, CoreML và ONNX. Framework này được xây dựng cho các nhà phát triển và nghiên cứu cần chuyển từ nguyên mẫu sang các pipeline suy luận cấp sản xuất mà không cần viết lại mã, mang lại hiệu suất thông lượng cao trên cả môi trường CPU và GPU.
Ultralytics cung cấp một API hướng đối tượng nhất quán trên tất cả các phiên bản mô hình. Điều này loại bỏ nhu cầu học cú pháp mới khi chuyển đổi giữa các tác vụ phát hiện, phân đoạn hoặc ước tính tư thế. Bằng cách chuẩn hóa các quy trình huấn luyện, xác thực và dự đoán, các nhà phát triển có thể giảm tới 70% mã boilerplate so với các triển khai PyTorch tùy chỉnh, đảm bảo chu kỳ lặp nhanh hơn trong môi trường sản xuất.
Framework hỗ trợ hơn 10 định dạng xuất, bao gồm TensorRT, CoreML, TFLite và ONNX. Điều này cho phép các nhà phát triển huấn luyện mô hình trên GPU NVIDIA cao cấp và triển khai liền mạch lên các thiết bị biên hạn chế tài nguyên như Raspberry Pi, điện thoại di động hoặc hệ thống nhúng. Tiện ích xuất tự động xử lý việc lượng tử hóa và tối ưu hóa đồ thị, đảm bảo độ trễ tối thiểu trong quá trình suy luận.
Được thiết kế cho tốc độ, công cụ Ultralytics đạt thời gian suy luận dưới một mili giây trên phần cứng hiện đại. Bằng cách tận dụng các nhân CUDA được tối ưu hóa và quản lý bộ nhớ hiệu quả, nó vượt trội hơn các triển khai PyTorch tiêu chuẩn. Điều này làm cho nó phù hợp để xử lý video thời gian thực ở tốc độ 60+ FPS, rất quan trọng cho các ứng dụng như robot tự hành, giám sát giao thông và kiểm soát chất lượng công nghiệp nơi độ trễ là yếu tố hạn chế chính.
Bao gồm một pipeline tăng cường dữ liệu tích hợp, có khả năng cấu hình cao, áp dụng các phép biến đổi mosaic, mixup và hình học ngay trong quá trình huấn luyện. Điều này cải thiện đáng kể độ bền và khả năng tổng quát hóa của mô hình, giảm nhu cầu về các tập dữ liệu thủ công khổng lồ. Bằng cách tự động hóa các bước tiền xử lý phức tạp này, các nhà phát triển có thể đạt được điểm mAP (mean Average Precision) hiện đại với các tập huấn luyện nhỏ hơn và đa dạng hơn.
Cung cấp một thư viện toàn diện các mô hình đã huấn luyện trước, từ 'Nano' (n) cho thiết bị biên đến 'Extra Large' (x) cho các tác vụ phía máy chủ đòi hỏi độ chính xác cao. Khả năng mở rộng này cho phép các nhóm chọn sự cân bằng tối ưu giữa tốc độ và độ chính xác cho các hạn chế phần cứng cụ thể của họ. Mỗi mô hình đều được huấn luyện trước trên tập dữ liệu COCO, cung cấp nền tảng vững chắc cho việc học chuyển đổi (transfer learning) trên dữ liệu chuyên biệt tùy chỉnh.
Cài đặt thư viện qua pip: 'pip install ultralytics'.,Nhập lớp YOLO trong script Python của bạn: 'from ultralytics import YOLO'.,Tải mô hình đã huấn luyện trước: 'model = YOLO("yolo11n.pt")'.,Chạy suy luận trên nguồn ảnh hoặc video: 'results = model.predict("source.jpg")'.,Truy cập kết quả phát hiện thông qua đối tượng results để trích xuất bounding box, mask hoặc xác suất lớp.,Xuất mô hình đã huấn luyện để triển khai bằng 'model.export(format="onnx")' cho suy luận sản xuất tối ưu.
Các công ty sản xuất sử dụng Ultralytics để phát hiện lỗi bề mặt trên dây chuyền lắp ráp theo thời gian thực. Bằng cách triển khai các mô hình YOLO trên camera biên, họ đạt được khả năng nhận diện tức thì các linh kiện lỗi, giảm lãng phí và đảm bảo độ phủ kiểm tra 100% mà không cần sự can thiệp của con người.
Các kỹ sư robot tích hợp YOLO để phát hiện đối tượng và nhận thức không gian theo thời gian thực. Framework cho phép robot xác định chướng ngại vật, điều hướng môi trường và tương tác với các đối tượng, cung cấp phản hồi hình ảnh có độ trễ thấp cần thiết cho hoạt động tự hành an toàn và hiệu quả.
Các hệ thống quản lý giao thông sử dụng framework để phân tích luồng video nhằm đếm phương tiện, phát hiện biển số xe và đảm bảo an toàn cho người đi bộ. Suy luận thông lượng cao cho phép một máy chủ duy nhất xử lý nhiều luồng camera cùng lúc, cung cấp dữ liệu hữu ích cho quy hoạch đô thị.
Cần triển khai các mô hình sẵn sàng cho sản xuất một cách nhanh chóng. Ultralytics cung cấp các công cụ để chuyển từ nghiên cứu sang triển khai mà không cần tốn công xây dựng các pipeline suy luận tùy chỉnh từ đầu.
Tập trung vào việc triển khai mô hình lên phần cứng có khả năng tính toán hạn chế. Họ dựa vào các tính năng xuất và lượng tử hóa mạnh mẽ của Ultralytics để duy trì hiệu suất cao trên các thiết bị nhúng.
Yêu cầu một framework đáng tin cậy, được tài liệu hóa tốt để tạo nguyên mẫu nhanh và thử nghiệm. Sự dễ sử dụng và tài liệu phong phú của Ultralytics cho phép họ kiểm tra các giả thuyết và lặp lại trên các tập dữ liệu một cách hiệu quả.
Mã nguồn mở (giấy phép AGPL-3.0). Hỗ trợ doanh nghiệp và các tùy chọn cấp phép thương mại có sẵn thông qua Ultralytics HUB cho các triển khai đám mây được quản lý.