发布时间:2026-03-28
浏览次数:0
一、自己写代码提交更改,跑一次1-30分钟
此刻,用户能够借助侧边栏去访问Codex,经由输入提示且点击“代码(Code)”按钮来下达编程任务,还能够点击“Ask(提问)”向Codex询问有关代码库的问题。每一个任务都是在预加载了用户代码库的独立隔离环境里独立进行处理的。
Codex能够读取文件,也能够编辑文件,还能够运行命令,这些命令涵盖测试工具、类型检查器等,任务完成所需时间通常在1分钟至30分钟之间,具体是多久要视复杂程度而定,用户能够实时监控Codex的进度。
当Codex完成任务之后,它会于自身的环境里提交变更。借助引用终端日志以及测试输出,Codex去提供自身操作的可验证证据,从而使得用户能够追踪任务在完成进程中的每一个步骤。
用户能够查看结果,能够请求进一步修订,能够提交拉取请求,或者能够直接把更改集成到本地环境里。在产品之中,用户依照自身意愿去配置Codex环境,从而让其与实际处在的开发环境尽可能地相匹配。
Codex能够借助放置于用户代码库当中的.md文件来展开引导,这些文本文件跟.md相类似,用户能够于其中告知Codex怎样去.代码库,运行哪一些命令用于测试,以及怎样以最优方式去遵循项目的标准实践,和人类开发人员一样,在配置好开发环境、可靠的测试设置以及清晰分明的文档之后,Codex的性能处于最佳状态。
在进行编码评估之时,在开展内部基准测试之际,即便不存在.md文件,即便没有自定义代码生成器,codex - 1依旧展现出强劲的性能。
23个在内部基础架构上无法运行的SWE - Bench样本被排除了,Out。codex - 1 的测试设置里,最大上下文长度设成了192k,其推理难度处于中等水平,而这同样是当前产品里能够使用的设置。
二、报错自动告知用户,过程可检测
安全性上,透明度方面,用户能够借助引用,凭借终端日志,依据测试结果,去检查Codex的工作。
在处于不确定状况,又或者是面临测试失败的情形之下,Codex会十分明确地把这些相关问题予以告知,进而使用户能够针对如何持续进行下去做出正确的决策。
主要目标在于训练codex - 1,使其输出能够更贴近人类的编程偏好codejock 17,更符合人类的编程标准。
如下面的图所展示的那样,相较于 o3 模型而言,codex - 1 一直都能够生成更为清晰的补丁了 ,那些补丁可供马上进行人工审核 ,并且能够集成到标准工作流程当中。
要平衡安全性与实用性,Codex历经训练,能识别且精准拒绝意在开发恶意软件的请求,同时能清晰区分并支持合法任务,又增强了政策框架,也纳入了严格的安全评估。
Codex完全在云端安全隔离的容器中运行。
在任务执行的这段期间,互联网的访问处于被禁用的状态,Agent的交互仅仅局限于经由代码库明确予以提供的代码,以及用户借助安装脚本配置的预安装项,Agent没有办法去访问外部的网站、API或者其他的服务。
三、Pro用户可免费体验,API收费1.5美元/100万 输入
就在上个月的时候,我们推出了一款名为Codex CLI的东西,它是一种在终端里面运行的,具备轻量级特性的开源编码Agent。它把o3以及o4 - mini等模型所拥有的功能引入到了用户的本地工作流程当中。
今天,还发布了一个简编本子的 codex - 1版本,那种特定编制的本子是专门朝着 Codex CLI使用方向而设计出来的名为o4 - mini的版本。
这个全新的模型,对CLI里的工作流程予以支持,使其能够变得更快,且针对低延迟代码问答以及编辑做了优化处理codejock 17,与此同时,还将指令遵循以及样式方面同样的优势保持了下来现在这个模型处于,Codex CLI里的作为默认模型的状态,并且在API当中是以codex - mini - 的形式来提供的。
Plus用户以及Pro用户,这些使用登录Codex CLI的用户,到了今天晚些的时候就能开启兑换行为,所兑换的是价值5美元的免费API积分,还有价值50美元的免费API积分,这些积分所具有的有效期是30天。
那些运用codex - mini -进行构建工作的开发人员,此模型能够在API上予以使用,其价格是,每100万(输入)为1.5美元,每100万(输出)达6美元,并且能享受到75%的即时缓存折扣。
的技术团队已开始将Codex纳入其日常工具包。
将那些在范围方面明确且存在重复情况的任务予以卸载时,工程师人群之中最为常用的便是它,那些任务涵盖了像重构这样的操作,还有重命名以及编写测试工作等,它在构建全新功能这件事上是合适的,在连接组件时也同样适用,针对修复错误的工作而言它能用,在起草文档的时候它也具备适用性。
在发布之前,还与一小群外部测试人员合作。
举例来说,思科正致力于探寻Codex对其工程团队能起到何种助力,以便更迅速地把想法转化为实际行动,并且向团队给予反馈,借助Codex来加快功能开发进程,对问题进行调试,开展编写以及执行测试工作,还有对大型代码库实施重构等。
基于早期所积累的经验,提议把范围清晰明了的任务,一同分配给多个Agent,并且针对不同种类的任务以及提示展开尝试,从而能够有效地对模型的功能予以探索。
结语:Codex仍处早期阶段,未来或成主流
表明,Codex的开发依旧处在早期时期。当作研究预览版本,它当前欠缺一些功能,像是用于前端工作的图像输入,还有在Agent工作之际对其作出方向修正的功能。另外委托给远程Agent比交互式编辑花费的时间更久,这些都需要时间予以改进。
这只是个开端,能够预见到,Codex于其中介引入的异步多主体工作流程会变成工程师撰写高质量代码的主导形式,实时配对与任务委托这两种交互模式会慢慢交融。
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码