根据官方介绍,Augment Agent 是首个转为大型代码库工作的专业软件工程师设计的 AI 编码助手,上下文支持 200K,也就是 20 万的 token 啊。
这对于专业的编程人员来讲,太实用了,已经达到可以做项目级别了。
除此之外,Augment Agent 还支持持久性的内存,就是它可以学习你的编码风格,记得你之前的重构,适配你的代码规范。记忆会随着时间的推移而积累。你不必在每次会话中重新教它。
除了基本的编码支持,Augment Agent 还支持多模态输入,如截图和 Figma 文件,用于修复错误和实现 UI。
另外,目前 Augment Agent 通过结合 Anthropic 的 Claude Sonnet 3.7 和 OpenAI 的 O1 推理模型,在 SWE-bench verified 基准测试中取得了最高分,达到第 1 名(在真实任务上达到 65.4%)。

Augment 是一款开发者 AI 平台,它能帮助你理解代码、调试问题并快速交付,因为它理解你的代码库。使用聊天、下一编辑和代码补全功能,让你更高效地完成任务。

核心宣传点:
这里我推荐一个非常好用的手指筷子,在平时玩手机、电脑工作、刷剧的时候想吃零食又不想脏手,非常实用和实惠,我买了两双,爱不释手。现在卖的很便宜
目前提供了 vscode 扩展、JetBrains IDEs 插件、VIM 这三种使用方式,下面通过安装 vscode 扩展来使用。

安装成功之后,需要进行登陆,登陆成功之后就可以使用了;目前测试下来 remote 模式的 vscode 登陆不上,本地的可以。
刚好有一份 vllm 项目的代码,而且也不太懂,测试一下看能不能把我讲明白。

vllm 最核心的就是 PagedAttention 的原理,但是从之前看过一些介绍来看,只是明白了,但还不知道是如何实现的。
PagedAttention 的核心就是把 Attention 的加载从一个连续的显存空间拆分成了按显存页进行加载,使 GPU 的显存利用率增高。
PagedAttention
vllm/attention/backends 目录下的 abstract.py 文件中有这个抽象类的定义。还提到了它有多个实现类,这个有点问题,真实的实现类比这个多,比如缺少 CPUMLABackend 等等,还有好几个。
PagedAttention 都是对的。
KV Cache 管理,有点奇怪。
Attention 的计算实现 forwarddecode 。提到有两种模式 Decode 和 Prefix ,对应的就是 forwarddecode 和 forwardprefix 这两个函数。

这个问题问下来算是对这块的代码基本有一个了解了;比直接看确实强很多
`text
帮我添加 Salesforce/SFR-Embedding-Code-2BR 这个新的模型在 vllm 中运行;目前 vllm 的代码还不能运行它。你需要去 huggingface 上查看模型 https://huggingface.co/Salesforce/SFR-Embedding-Code-2BR/blob/main/config.json 文件,获取它的 architectures 信息,之后才能添加模型注册;其它还需要参考 https://huggingface.co/Salesforce/SFR-Embedding-Code-2BR/blob/main/modelinggemma2.py 中的实现使其在 vllm 中能运行。
首先还是使用 chat 模式,进行了多次 输入的调整,但是依然回复的牛头不对马嘴;于是选用 Agent 模式进行测试一下。
还是使用上面的提示此。
文件,在 chat 模式下都是给我乱说的。


尝试运行之后发现还不能跑,有 bug,也可能和它训练时候的 vllm 版本代码有关,导入的很多包路径都有问题。
text
帮我设计和实现一个微信小程序的项目,同时帮我实现后端 golang web 服务和数据库 mysql 表,项目主要功能是家庭图书管理系统,记录家庭购买的书籍以及存放位置信息等;主要有三页面,第一个页面是首页,主要展示家庭图书信息,可以支持搜索图书,需要通过调用后端 API 把功能实现。第二个页面是一个图书录入页面,通过扫描图书的 ISBN,然后通过后端的 ISBN 查询接口去查询图书的基本信息,包括作者、出版时间、价格等等;第三个页面是我的页面,主要是可以邀请家庭成员进入这个图书馆,查看图书所在位置和有那些图书。
把提示此输入之后,大概 20 分钟给我实现了前端、后端、数据库表设计,并且最后都可以成功的执行。



首先给我的感觉就是比 Cursor 可以执行的东西跟多了,而且执行很快,不知道是因为他们的模型快还是什么原因,总之很快,而且准确率很高。
在不久的将来,感觉像 WEB` 程序只需要三个角色就可以做出一个系统来:
之后就可以通过工具自动化的生成、打包、部署然后就可以进行测试了。
[1] abstract.py: http://abstract.py
来源:知乎