OpenAI đã tiến thêm một bước nữa trong quá trình tích hợp trí tuệ nhân tạo với việc sử dụng máy tính hàng ngày Bằng cách cải tiến hoàn toàn Codex, công cụ hỗ trợ lập trình trên máy tính để bàn của mình. Công cụ này, trước đây chủ yếu được biết đến với vai trò hỗ trợ lập trình, giờ đây đang trở thành một trợ lý có khả năng xử lý các ứng dụng, ghi nhớ tùy chọn và quản lý dự án gần như liền mạch.
Với bản cập nhật này, công ty do Sam Altman lãnh đạo đã tiến gần hơn đến kế hoạch tạo ra một... Một "siêu ứng dụng" dành cho máy tính để bàn, tích hợp ChatGPT, Codex và trình duyệt Atlas của bạn.Động thái này nhằm mục đích đơn giản hóa trải nghiệm người dùng, tập trung nguồn lực vào một không gian làm việc duy nhất và cạnh tranh với các đối thủ như Anthropic, đặc biệt là trong môi trường phát triển phần mềm và tự động hóa tiên tiến.
Codex học cách sử dụng máy tính giống như bất kỳ người dùng nào khác.
Một trong những thay đổi đáng chú ý nhất là Codex giờ đây có thể điều khiển máy tính trong nềnCông cụ ảo này có khả năng nhìn thấy những gì hiển thị trên màn hình, di chuyển con trỏ chuột, nhấp chuột, nhập văn bản và phản ứng với những gì xảy ra trong các ứng dụng đã cài đặt, mà không làm gián đoạn thao tác của người dùng với chuột hoặc bàn phím.
Khả năng này cho phép nhiều đặc vụ Codex phối hợp làm việc với nhau. song song trong cùng một độiĐiều này bao gồm việc thực hiện các bài kiểm tra, thay đổi cấu hình hoặc thực hiện các tác vụ lặp đi lặp lại trong khi người đó vẫn tiếp tục các hoạt động thường ngày của họ. Điều này mở ra cơ hội tự động hóa các quy trình làm việc trước đây đòi hỏi sự giám sát liên tục, chẳng hạn như kiểm tra ứng dụng sau mỗi lần thay đổi mã hoặc lặp lại các thao tác giao diện.
OpenAI đề xuất chức năng này như một cách để trợ lý ảo hoạt động với các công cụ không có API hoặc tích hợp trực tiếp, điều khá phổ biến trong nhiều chương trình máy tính để bàn. Codex, bằng cách "nhìn" màn hình và điều khiển con trỏ, có thể tương tác với các ứng dụng này giống như người dùng thông thường, mặc dù hiện tại vẫn cần sự kiểm soát và đặc biệt chú trọng đến vấn đề bảo mật.
Theo công ty, việc sử dụng máy tính ban đầu sẽ khả dụng ở... macOS thông qua ứng dụng Codex dành cho máy tính để bànPhiên bản này được liên kết với tài khoản ChatGPT. Phiên bản Windows sẽ ra mắt sau, khi hiệu năng đã được kiểm tra và các tính năng được điều chỉnh cho phù hợp với môi trường Microsoft.
Đối với châu Âu và Vương quốc Anh, OpenAI đã xác nhận rằng... điều khiển bằng máy tính, tùy chỉnh nâng cao, gợi ý theo ngữ cảnh và bộ nhớ Chúng sẽ được kích hoạt sau. Lý do là cần phải điều chỉnh các tính năng này cho phù hợp với các quy định về bảo vệ dữ liệu, một yêu cầu đặc biệt khắt khe tại Liên minh Châu Âu và thị trường Anh.

Trình duyệt tích hợp và làm việc trực tiếp trên các trang web.
Bản cập nhật này cũng củng cố mối quan hệ của Codex với internet nhờ vào một tính năng mới. trình duyệt được tích hợp trong chính ứng dụngThay vì chỉ nhận các hướng dẫn bằng văn bản chung chung, tác nhân có thể nhận lệnh trực tiếp trên các phần tử cụ thể của một trang.
Ví dụ, trong phát triển giao diện người dùng (frontend), người dùng có thể Chọn một thành phần web và mô tả sự thay đổi. Người dùng muốn thực hiện một thao tác nào đó (như thay đổi màu sắc, kích thước văn bản hoặc bố cục của một khối), và Codex hiểu được hướng dẫn đó trong ngữ cảnh trực quan cụ thể. Điều này giúp tránh việc phải viết những lời nhắc dài dòng giải thích phần nào của trang web cần được thay đổi.
Trình duyệt nhúng này cũng cho phép Codex. Phân tích nội dung, thu thập thông tin và sử dụng nó làm bối cảnh. Đối với các tác vụ khác, chẳng hạn như lập tài liệu mã nguồn, xem xét thông số kỹ thuật sản phẩm hoặc so sánh tài liệu kỹ thuật, tất cả đều được thực hiện trong cùng một môi trường, mà không cần phải chuyển đổi giữa nhiều cửa sổ hệ điều hành khác nhau.
Tạo và chỉnh sửa hình ảnh bằng gpt-image-1.5
Một trụ cột khác của phiên bản Codex mới là sự tích hợp mô hình. gpt-image-1.5 dùng để tạo và chỉnh sửa hình ảnh Ngay trong ứng dụng dành cho máy tính để bàn, người dùng có thể tạo biểu đồ, sơ đồ, mô hình hoặc bản phác thảo trực quan từ văn bản, hoặc bằng cách kết hợp các hướng dẫn với ảnh chụp màn hình và đoạn mã.
Khả năng này hướng trực tiếp đến các nhóm làm việc trong thiết kế sản phẩm, giao diện người dùng hoặc nguyên mẫu trò chơi điện tửVí dụ, một nhà phát triển có thể chụp ảnh màn hình giao diện chưa hoàn thiện, yêu cầu Codex đề xuất thiết kế lại menu hoặc bảng màu mới, và nhận được các hình ảnh được tạo ra phù hợp với ngữ cảnh đó, mà không cần thay đổi công cụ.
Với mọi thứ được tập trung hóa trong Codex, các đặc vụ có thể Kết hợp các nhiệm vụ lập trình và thiết kế lại với nhau.Viết logic cho một chức năng, cập nhật giao diện người dùng tương ứng và tạo bản thiết kế trực quan để trình bày cho nhóm, mà không cần rời khỏi quy trình làm việc hoặc phải mở các ứng dụng chỉnh sửa đồ họa bên ngoài.
Bộ nhớ, ngữ cảnh và tự động hóa nhiệm vụ dài hạn
Ngoài khả năng điều khiển bằng máy tính và tạo hình ảnh, mục tiêu lớn của OpenAI với phiên bản này là trang bị cho Codex một khả năng... bộ nhớ bền vững và quản lý ngữ cảnh rộng hơn nhiềuCông cụ này có thể sử dụng lại các cuộc hội thoại trước đó, lưu giữ thông tin quan trọng và truy xuất chúng khi cần thiết để tiếp tục dự án.
Tính năng bộ nhớ, hiện đang được phát hành dưới dạng bản xem trước, cho phép Codex. ghi nhớ các sở thích cá nhân, các chỉnh sửa thường xuyên hoặc dữ liệu khó thu thập.Điều này bao gồm mọi thứ, từ bộ công nghệ điển hình của một nhóm đến cách sắp xếp thư mục, các định dạng báo cáo được sử dụng phổ biến nhất và thẻ thường được sử dụng trên GitHub cho các loại sự cố nhất định.
Với bối cảnh được tích lũy đó, tác nhân có thể chủ động đề xuất nhiệm vụTính năng này có thể được sử dụng để đề xuất tiếp tục một dự án chưa hoàn thành, đề xuất việc tái cấu trúc đang chờ xử lý hoặc thông báo cho người dùng về các yêu cầu kéo (pull request) đã tồn tại lâu. Một số công ty đã sử dụng nó để theo dõi các cuộc trò chuyện trong Slack, Gmail hoặc Notion và phản hồi khi các sự kiện nhất định xảy ra.
Codex cũng có thể Lên kế hoạch công việc cho tương lai và tự mình tái kích hoạt bản thân một cách độc lập. Để hoàn thành các nhiệm vụ dài hạn. Ví dụ, nó có thể quản lý hàng đợi đánh giá mã trong nhiều ngày hoặc nhiều tuần, xử lý các bình luận và cập nhật tài liệu mà không cần nhà phát triển phải liên tục theo dõi.
Hơn 90 tiện ích bổ sung và hỗ trợ nhà phát triển được cải thiện.
Để hoàn tất quá trình thay đổi, OpenAI đã bổ sung gần như... 90 plugin Codex mớiCác tính năng này bao gồm tích hợp với Microsoft Suite, GitLab Issues, Neon của Databricks, Render và Superpowers, cũng như hỗ trợ các máy chủ MCP (Model Context Protocol). Mục tiêu là cung cấp cho tác nhân nhiều nguồn ngữ cảnh hơn và khả năng vận hành mạnh mẽ hơn.
Nhờ các plugin này, Codex có thể Thu thập thông tin từ các dịch vụ khác nhau và hành động dựa trên thông tin đó. Từ một không gian làm việc duy nhất, bạn có thể xem xét các vấn đề trong GitLab, truy vấn dữ liệu trong môi trường Databricks, cập nhật tài liệu Office hoặc tương tác với các dịch vụ triển khai, mà không cần người dùng phải chuyển đổi giữa các nền tảng khác nhau.
Về mặt kỹ thuật thuần túy, bản cập nhật này củng cố... quy trình làm việc điển hình của nhà phát triểnGiờ đây, Codex giúp bạn xem xét các yêu cầu kéo (pull request), quản lý nhiều tab terminal cùng lúc, kết nối với môi trường phát triển từ xa qua SSH và mở các tệp với bản xem trước chi tiết, cho dù đó là tệp PDF, bảng tính, bản trình bày hay tài liệu ở các định dạng khác.
Tất cả những điều này được tập trung trong một trải nghiệm thống nhất, mà theo chính OpenAI, cho phép đạt được tiến bộ nhanh hơn. ở tất cả các giai đoạn của vòng đời phần mềm.Từ việc viết mã ban đầu đến kiểm thử, triển khai, lập tài liệu và bảo trì, với các tác nhân AI liên tục cộng tác trong cùng một môi trường máy tính để bàn.
Tính khả dụng, sự tập trung vào các nhà phát triển và tình hình tại châu Âu
Phiên bản mới của Codex hiện đang được triển khai. Ứng dụng máy tính để bàn dành cho macOS Đối với những người đăng nhập bằng tài khoản ChatGPT. Không phải tất cả các tính năng đều yêu cầu cùng một loại gói đăng ký, và một số tính năng nâng cao có thể phụ thuộc vào gói đã mua, tương tự như các công cụ OpenAI khác.
Thibault Sottiaux, giám đốc của Codex, giải thích rằng bản cập nhật này Nó đặc biệt hướng đến các nhà phát triển.Mặc dù mục tiêu là mở rộng nó cho đối tượng người dùng rộng rãi hơn sau này. Ý tưởng là các nhóm kỹ thuật sẽ là những người đầu tiên tận dụng các tác nhân mới và quy trình làm việc tự động, và theo thời gian, chuyển mô hình đó sang các công việc văn phòng, quản lý tài liệu hoặc năng suất cá nhân.
OpenAI nhấn mạnh rằng việc sử dụng sức mạnh tính toán và bộ nhớ được thực hiện với một phương pháp tiếp cận an ninh và tuân thủ quy địnhĐiều này đặc biệt quan trọng ở Liên minh Châu Âu và Vương quốc Anh. Vì lý do đó, các tính năng tùy chỉnh nâng cao, gợi ý theo ngữ cảnh, bộ nhớ bền vững và điều khiển trực tiếp hệ điều hành sẽ cần thêm thời gian để có mặt tại các thị trường này.
Dù sao đi nữa, công ty vẫn khẳng định rằng sự phát triển này của Codex mở ra cánh cửa cho một... Ứng dụng siêu cấp dành cho máy tính để bàn tập trung vào tự động hóa thông minhTrong đó, các tác nhân AI không chỉ giúp viết mã mà còn phối hợp các nhiệm vụ, thích ứng với phong cách làm việc của người dùng và duy trì các dự án phức tạp trong thời gian dài. Đối với các nhà phát triển phần mềm ở châu Âu, thông điệp rất rõ ràng: các khả năng mới đang đến, nhưng cần có những điều chỉnh để phù hợp với khuôn khổ pháp lý hiện hành.