OpenAI: Ra mắt Responses API & Agents SDK cho phát triển AI Agent
OpenAI Ra Mắt Responses API và Agents SDK: Mở Đường Cho Phát Triển Agent AI Tự Động
Giới thiệu về Nền tảng Phát triển Agent AI Mới của OpenAI
OpenAI vừa công bố một bộ công cụ và API mới, mở ra khả năng xây dựng các agent AI mạnh mẽ và hiệu quả hơn cho các nhà phát triển và doanh nghiệp. Đây là bước tiến lớn, dựa trên công nghệ đã được sử dụng để phát triển các agent AI hàng đầu của OpenAI như Deep Research (nghiên cứu sâu rộng trên internet, tạo báo cáo chi tiết) và Operator (tự động điều khiển trình duyệt web để thực hiện các tác vụ theo yêu cầu).
Cơ hội cho Nhà Phát triển
Giờ đây, với quyền truy cập vào các thành phần cốt lõi tạo nên các agent AI mạnh mẽ của OpenAI, các nhà phát triển có thể xây dựng các sản phẩm và dịch vụ AI chuyên biệt, đáp ứng nhu cầu cụ thể của từng lĩnh vực và đối tượng người dùng. Sự phát triển này được xây dựng dựa trên những tiến bộ gần đây của OpenAI trong khả năng suy luận, xử lý đa phương tiện và các cơ chế an toàn, đặc biệt là dòng mô hình suy luận “o” (o1 và o3).
Olivier Godement, trưởng bộ phận sản phẩm nền tảng của OpenAI, nhấn mạnh tầm quan trọng của các mô hình suy luận đối với sự phát triển của agent AI. Ông cho biết một trong những hạn chế lớn nhất trước đây là khả năng xử lý các tác vụ dài hạn như lập kế hoạch. Tuy nhiên, cho đến nay, các nhà phát triển vẫn chưa có các công cụ cần thiết để dễ dàng tích hợp chúng vào các ứng dụng sẵn sàng sản xuất cho doanh nghiệp và khách hàng. OpenAI tin rằng những công cụ mới này sẽ giải quyết vấn đề đó.
Tự Động Hóa Công Việc với Agent AI
Để giải quyết những thách thức này, OpenAI giới thiệu một số công cụ mới: Responses API, các công cụ tích hợp sẵn để tìm kiếm trên web và file, một công cụ sử dụng máy tính và Agents SDK mã nguồn mở. Trong khi Responses API cho phép các nhà phát triển xây dựng các agent trên nền tảng công nghệ của OpenAI, Agents SDK có thể giúp họ kết nối các agent với các công cụ và quy trình web khác, thực hiện các “workflow” tự động hóa các công việc theo yêu cầu của người dùng hoặc doanh nghiệp.
Các công cụ này nhằm mục đích đơn giản hóa quá trình phát triển agent AI bằng cách giảm nhu cầu kỹ thuật prompt phức tạp và logic điều phối tùy chỉnh. Điều này cũng làm cho việc tiếp tục xây dựng trên nền tảng OpenAI trở nên hấp dẫn hơn, ngay cả khi đối mặt với sự cạnh tranh ngày càng tăng từ các đối thủ như Manus, Alibaba’s Qwen, DeepSeek, Anthropic và Google.
Mặc dù các đối thủ cạnh tranh khác cũng cung cấp các công cụ và sản phẩm cho nhà phát triển, sự phát triển liên tục của nền tảng OpenAI khiến nó trở thành một “điểm đến lý tưởng” cho những ai muốn tận dụng những tiến bộ AI mới nhất một cách dễ dàng, nhanh chóng và hiệu quả về chi phí.
Sự Trở Lại của Mã Nguồn Mở: Agents SDK
OpenAI đang trở lại với mã nguồn mở một cách mạnh mẽ bằng việc phát hành Agents SDK, một bộ công cụ được thiết kế để giúp các nhà phát triển quản lý, điều phối và tối ưu hóa các workflow của agent, thậm chí xây dựng các agent được hỗ trợ bởi các mô hình không phải của OpenAI như Anthropic, Google hoặc các mô hình mã nguồn mở từ DeepSeek, Qwen, Mistral và Llama của Meta.
“Agents SDK là mã nguồn mở, cho phép các doanh nghiệp kết hợp và đối sánh các mô hình khác nhau,” Godement nói. “Chúng tôi không muốn ép buộc bất kỳ ai chỉ sử dụng các mô hình của OpenAI.”
SDK cung cấp các tính năng chính sau:
- Agent có thể cấu hình: Các mô hình AI với các hướng dẫn và quyền truy cập công cụ được xác định trước.
- Chuyển giao thông minh: Các cơ chế để chuyển giao các tác vụ giữa các agent dựa trên ngữ cảnh.
- Các biện pháp bảo vệ tích hợp: Các biện pháp an toàn để xác thực đầu vào và kiểm duyệt nội dung.
- Theo dõi và khả năng quan sát: Các công cụ để gỡ lỗi và tối ưu hóa hiệu suất của agent.
Nikunj Handa, PM trong nhóm API của OpenAI, cho biết: “Với Agents SDK, các nhà phát triển có thể theo dõi chính xác những gì một agent đang làm – những tác vụ nó tạo ra, những dữ liệu nó thu thập và cách nó tạo ra các phản hồi.”
Responses API: Trung Tâm của Bản Cập Nhật
Trung tâm của bản cập nhật này là Responses API, kết hợp các tính năng của Chat Completions API của OpenAI với chức năng sử dụng công cụ của Assistants API (API này sẽ ngừng hoạt động vào giữa năm 2026). Sự tích hợp này cho phép các nhà phát triển tận dụng nhiều công cụ tích hợp sẵn trong một lệnh gọi API duy nhất, giúp dễ dàng xây dựng các ứng dụng yêu cầu các tương tác phức tạp, đa bước.
Responses API ban đầu hỗ trợ ba công cụ tích hợp sẵn:
- Tìm kiếm trên web: Cung cấp câu trả lời theo thời gian thực, có trích dẫn bằng cách lấy thông tin từ web.
- Tìm kiếm file: Truy xuất thông tin liên quan từ các kho tài liệu lớn bằng cách sử dụng lọc metadata và xử lý truy vấn được tối ưu hóa.
- Công cụ sử dụng máy tính: Cho phép các agent AI thực hiện các hành động trên máy tính, chẳng hạn như duyệt web, nhập dữ liệu và điều hướng các giao diện phần mềm.
Handa cho biết: “Với Responses API, các nhà phát triển có được cái nhìn rõ hơn về những gì mô hình đang làm – những công cụ nó đang gọi, tại sao nó gọi chúng và những quyết định nó đưa ra trước và sau các cuộc gọi đó.”
Với những khả năng này, OpenAI hình dung Responses API đóng vai trò là nền tảng cho các ứng dụng agentic, loại bỏ nhu cầu tích hợp nhiều bên ngoài. API hiện đã có sẵn cho tất cả các nhà phát triển, với mức sử dụng được tính theo giá token và công cụ tiêu chuẩn của OpenAI.
Ngoài ra, OpenAI lưu ý rằng mặc dù Chat Completions API sẽ tiếp tục nhận được các bản cập nhật, Responses API được coi là tập hợp lớn hơn của nó. Các nhà phát triển cần các công cụ tích hợp sẵn hoặc các tương tác mô hình đa bước nên sử dụng Responses API cho các tích hợp mới.
OpenAI cũng đang cung cấp các công cụ tìm kiếm trên web, tìm kiếm file và sử dụng máy tính trực tiếp thông qua Responses API. Các công cụ này cho phép các agent AI truy cập thông tin thực tế, truy xuất ngữ cảnh từ tài liệu và tương tác với môi trường kỹ thuật số hiệu quả hơn.
Tìm Kiếm Web: Thông Tin Thời Gian Thực với Trích Dẫn
Công cụ tìm kiếm web mới cho phép các nhà phát triển tích hợp khả năng tìm kiếm theo thời gian thực vào ứng dụng của họ, làm cho nó hữu ích cho các trợ lý nghiên cứu, hướng dẫn mua sắm và các công cụ tổng hợp nội dung. Nó cung cấp các nguồn cho các phản hồi của nó, đảm bảo người dùng có thể xác minh tính chính xác của thông tin.
Handa cho biết: “Điều đầu tiên chúng tôi ra mắt là các công cụ tích hợp sẵn, như tìm kiếm trên web, cho phép các mô hình truy cập thông tin theo thời gian thực. “Đó là công cụ tương tự cung cấp năng lượng cho Tìm kiếm của ChatGPT, và bây giờ chúng tôi đang mang nó đến API.”
OpenAI cũng xác nhận rằng kết quả tìm kiếm web trong API sẽ bao gồm các trích dẫn rõ ràng, cho phép người dùng nhấp qua các nguồn gốc. Các nhà phát triển có thể triển khai tìm kiếm web như một phần của hệ thống truy xuất rộng hơn bao gồm các nguồn dữ liệu độc quyền.
Tìm Kiếm File: Truy Xuất Tài Liệu Thông Minh trên Đám Mây Riêng
Với công cụ tìm kiếm file, các agent AI có thể nhanh chóng truy xuất thông tin liên quan từ các bộ sưu tập tài liệu lớn. Công cụ này hỗ trợ nhiều định dạng file và bao gồm các tính năng như tối ưu hóa truy vấn, lọc metadata và xếp hạng tùy chỉnh để có kết quả chính xác hơn.
Handa giải thích: “Công cụ thứ ba chúng tôi ra mắt là tìm kiếm file, giúp các nhà phát triển dễ dàng lấy tất cả dữ liệu của họ, lưu trữ nó trong hệ thống của chúng tôi và trích xuất thông tin phù hợp với độ chính xác cao.”
Công cụ tìm kiếm file có giá 2,50 đô la cho mỗi nghìn truy vấn, với phí lưu trữ là 0,10 đô la cho mỗi GB mỗi ngày (GB đầu tiên miễn phí).
Sử Dụng Máy Tính: Công Nghệ Đứng Sau Operator của OpenAI
Công cụ sử dụng máy tính mở rộng khả năng của agent vượt ra ngoài các tác vụ dựa trên văn bản đơn giản bằng cách cho phép AI tương tác với các giao diện máy tính.
Được hỗ trợ bởi mô hình agent sử dụng máy tính (CUA) của OpenAI, công cụ này chuyển đổi các hành động do AI tạo ra thành các lệnh có thể thực thi, cho phép tự động hóa các tác vụ như nhập dữ liệu và điều hướng web.
Handa lưu ý: “Chúng tôi cũng đang ra mắt một công cụ sử dụng máy tính, cho phép các mô hình tương tác với các giao diện người dùng đồ họa khi không có API hiện có cho một tác vụ.”
Công cụ sử dụng máy tính hiện có sẵn dưới dạng bản xem trước nghiên cứu cho một số nhà phát triển được chọn trong các tầng sử dụng 3-5. Giá được đặt ở mức 3 đô la cho mỗi triệu token đầu vào và 12 đô la cho mỗi triệu token đầu ra.
Ý Nghĩa Đối Với Các Nhà Lãnh Đạo Doanh Nghiệp
Đối với các nhà lãnh đạo nhóm CNTT, CTO và các nhà quản lý cấp trung đang tìm cách tối ưu hóa các workflow, các công cụ mới của OpenAI cung cấp một con đường rõ ràng để tự động hóa và mở rộng quy mô các quy trình dựa trên AI mà không yêu cầu phát triển tùy chỉnh rộng rãi.
Các khả năng tìm kiếm trên web và tìm kiếm file tích hợp sẵn cho phép các doanh nghiệp nhanh chóng tích hợp khả năng truy xuất thông tin do AI cung cấp vào các hệ thống hiện có của họ, trong khi công cụ sử dụng máy tính cho phép tương tác tự động với các ứng dụng kế thừa thiếu quyền truy cập API.
Agents SDK mã nguồn mở hơn nữa trao quyền cho các tổ chức điều phối các workflow do AI điều khiển trên các nhóm, giúp dễ dàng triển khai các agent cải thiện hiệu quả trong các lĩnh vực như hỗ trợ khách hàng, xử lý tài liệu và nghiên cứu thị trường.
Với bảo mật và khả năng quan sát doanh nghiệp được tích hợp vào các công cụ này, những người ra quyết định có thể áp dụng các giải pháp AI với tính minh bạch và kiểm soát lớn hơn, đảm bảo tuân thủ và giám sát hiệu suất ở quy mô lớn.
Điều Gì Tiếp Theo?
OpenAI coi những bản phát hành mới này là bước đầu tiên trong việc xây dựng một nền tảng toàn diện cho các agent AI. Công ty có kế hoạch triển khai các công cụ và tích hợp bổ sung trong những tháng tới để giúp các nhà phát triển triển khai, đánh giá và mở rộng quy mô các ứng dụng agentic hiệu quả hơn.
Godement cho biết: “Chúng tôi nghĩ rằng những tháng tới sẽ rất quan trọng để triển khai ngày càng nhiều agent ở quy mô lớn. “Chúng tôi đã làm điều này với các agent của bên thứ nhất như Deep Research, nhưng OpenAI sẽ không xây dựng mọi agent – đó là lý do tại sao chúng tôi có một nền tảng nhà phát triển.”
OpenAI cũng tuyên bố rằng họ sẽ tiếp tục cải thiện các tính năng an toàn cho các ứng dụng agentic, bao gồm các biện pháp bảo vệ chống lại các cuộc tấn công prompt injection và truy cập dữ liệu trái phép.
Các nhà phát triển quan tâm đến việc xây dựng với các công cụ mới có thể khám phá tài liệu và API playground của OpenAI để bắt đầu ngay hôm nay.
Bạn có thấy hữu ích không? Hãy cho chúng tôi +1 nhé
Đăng ký nhận bản tin từ Website TXL
Tìm kiếm tức thì các thông tin tại website: tranxuanloc.com
Mẹo tìm kiếm: "Từ khóa cần tìm kiếm" site:tranxuanloc.com để tìm được kết quả chính xác trên công cụ tìm kiếm của googleGỢI Ý: Khóa học sales OTAOTA là gìđăng ký kênh OTAEmail theo tên miềnCRMWP Content Crawlerchuyển VPSACF
