还记得今年3月,轰动了整个科技圈的AI程序员Devin吗?现在,国内版Devin来了。
智东西6月21日报道,今日,阿里云推出首个基于通义大模型的“AI程序员”,可分钟级完成端到端应用开发,大幅提升研发效率,预计实现产能提升100倍。
该AI程序员构建了创新的多智能体(Agent)架构,由不同的智能体分别负责需求理解、任务拆解、代码编写、测试、问题修复、部署发布等软件开发任务并协同工作,一站式完成开发流程,具备架构师、开发工程师、测试工程师等多种岗位的技能。
发布会现场,阿里云演示了用对话形式,让AI程序员自主完成一款奥运赛事日程应用,从提需求到页面上线分钟。如果按照传统的开发方式,人类程序员至少需要半天才能完成。
阿里云资深技术专家、通义灵码产品技术负责人神秀进行了深入交谈,试图解答这些问题。
一是实现了端到端的效果,在开发全流程上实现了更高的完整度;二是交互上的优化,在开发过程中可以与人类程序员产生多次交互,生成的代码也可以二次编辑;三是在底层模型上,首次使用国产的通义模型体系,而非GPT-4等海外模型。
产品形态上,通义灵码是IDE插件,而AI程序员可以理解为一个智能体,既可以用作IDE插件,也可以作为网页或软件单独使用。
交互方式上,通义灵码主要作为辅助工具完成单点需求,整体工作流程仍以人类为主,对人类工程师的工作过程没有太大改变;AI程序员则作为主体,人类程序员只需要输入需求、校验代码等。
底层技术上,二者有一脉相承的延续性,在AI程序员中会用到通义灵码的技术,通义灵码也会用到智能体相关技术,不过AI程序员是以智能体为主。
通义大模型,通过创新的多智能体架构,由不同的智能体分别负责需求理解、任务拆解、代码编写、测试、问题修复、部署发布等软件开发任务并协同工作,一站式完成开发流程。
SWE-bench中,大部分公司都是用GPT-4、Llama 3、Claude 3等海外模型作为底座,而阿里云希望能让国产模型追上它们的表现并实现超越,这是团队需要攻坚的第一大挑战。
三个层面的技术创新:最上层,产品和工程团队通过创新的产品定义以及多智能体框架的研发,打造了全新的产品形态;在中间层,针对代码编写的真实场景,去组织数据、训练模型,进行垂直的定向优化;最底层,则是基础模型的迭代与更新。
通义灵码,目前每日辅助开发者生成代码超3000万次。而随着通义大模型技术的进步,AI程序员的出现让软件开发从通义灵码引领的“辅助驾驶”,逐步进入“自动驾驶”阶段。
26%的代码是由AI生成。随着模型能力的提升,这个数值未来还有很大的提升空间。他谈道,阿里云的愿景是让AI来代替开发工作中70%的重复性工作,让程序员有时间和精力集中在更复杂、更能创造价值的工作当中,例如算法的创新、技术的改进。
LLM as Copilot,不改变软件工程专业分工,AI工具通过与人协同提升开发效率,解决单点事务性工作,像通义灵码一样,在IDE中完成一些简单的任务。
LLM as Agent,AI智能体作为单一领域职能专家,自主使用工具完成预定任务,人类主要负责给定上下文,完成知识对齐这将独立于现有的工作流程。
LLM as Multi-Agent,多个智能体可以相互协作完成复杂任务的开发,人类只需负责创意、纠偏和确认。在这个过程中,测试人员、开发人员之间的协同关系可能会发生变化。阿里云此次推出的AI程序员就属于这一形态。
阿里云通义大模型业务负责人徐栋谈道:“软件应用的开发范式正在发生改变,未来用户只需定义问题、提出需求,分钟级完成一个应用开发将成为常态。通过AI编程助手和AI程序员的加持,每一位人类程序员都将成为超级个体。”





