Google giới thiệu bộ API nhận diện đối tượng TensorFlow mới cho lập trình viên

Bộ API TensorFlow mới này kỳ vọng giúp các nhà phát triển thực hiện công việc của mình trên các thiết bị ít phức tạp hơn.

Google vừa phát hành bộ API nhận diện đối tượng TensorFlow mới của mình, để giúp các nhà phát triển và các nhà nghiên cứu xác định các đối tượng trong những bức ảnh dễ dàng hơn. Google đang cố gắng cung cấp chúng một cách đơn giản và hiệu năng cao nhất có thể – các mô hình vừa được phát hành có hiệu năng rất tốt khi chạy benchmark và đang được sử dụng thường xuyên trong nghiên cứu.

Các mô hình này có bộ API nhận diện với những mạng lưới thần kinh nhân tạo dạng xoắn nặng nề và các mô hình tinh gọn được thiết kế để hoạt động trên những cỗ máy ít phức tạp hơn – bộ dò đơn MobileNets được tối ưu để có thể chạy trên thiết bị di động theo thời gian thực.

Đầu tuần vừa qua, Google cũng cho ra mắt họ một loạt mô hình thị giác MobileNets cho các máy tính cấu hình thấp. Các mô hình này có thể xử lý các tác vụ như nhận diện đối tượng, nhận diện khuôn mặt và nhận diện các mốc vị trí trong không gian.

Các smartphone ngày nay đều không có những tài nguyên điện toán như những chiếc máy tính để bàn hay các thiết bị máy chủ, làm các nhà phát triển chỉ còn hai lựa chọn: Dựa vào các mô hình máy học chạy trên đám mây nhưng sẽ làm gia tăng độ trễ, và đòi hỏi phải có kết nối internet – do vậy nó khó có thể áp dụng trong nhiều trường hợp sử dụng thông thường. Một cách tiếp cận khác là đơn giản hóa bản thân các mô hình để đánh đổi lấy việc triển khai được ở nhiều nơi hơn.

Google, Facebook và Apple đang rót nhiều nguồn lực của mình vào các mô hình di động này. Mùa thu năm ngoái, Facebook giới thiệu khung chương trình Caffe2Go để xây dựng các mô hình có thể chạy trên smartphone – bước triển khai lớn đầu tiên của framework này chính là bộ lọc hình ảnh dựa trên kỹ thuật Style Transfer của Facebook.

Ngoài ra, tại hội nghị nhà phát triển I/O vào đầu năm nay, Google đã phát hành TensorFlow Lite, một phiên bản của khung chương trình máy học tinh gọn. Gần đây nhất tại hội nghị WWDC, Apple cũng giới thiệu CoreML, nỗ lực của họ trong việc giảm mức độ phức tạp của các mô hình máy học đang chạy trên những thiết bị iOS.

Tất nhiên, các dịch vụ đám mây công cộng của Google giúp họ có vị thế khác biệt hơn hẳn so với cả Facebook và Apple, và từ lâu họ đã giới thiệu các dịch vụ tầm nhìn máy tính trên quy mô lớn thông qua bộ API Cloud Vision.

Nếu bạn quan tâm, bạn có thể tìm thấy bộ API nhận diện đối tượng TensorFlow ở đường link sau: https://github.com/tensorflow/models/tree/master/object_detection . Google muốn làm nó trở nên dễ sử dụng hơn bao giờ hết, vì vậy toàn bộ bộ API này đã được đóng gói trước trong một chiếc notebook Jupyter.

Theo Techcrunch

Bộ API TensorFlow mới này kỳ vọng giúp các nhà phát triển thực hiện công việc của mình trên các thiết bị ít phức tạp hơn.

Nguyễn Linh