AI Dev 26 x SF | Brandon Waselnuk: Building the Context Engine AI Agents Need

代码生成的上下文缺失困境

当前的AI编程工具虽然能够生成代码，但绝大多数工具无法为特定组织生成正确的代码，其核心缺陷在于缺乏必要的上下文信息。这些工具不知道团队为何在Redis和DynamoDB之间做出选择，也不了解两个月前Slack讨论中关于身份验证迁移的具体决策，更不清楚首席工程师在代码审查中实际强制执行哪些架构模式。这种上下文缺失导致AI生成的代码往往不符合组织的实际工程规范和历史决策，使得工具在实际生产环境中难以直接应用。

"Every AI coding tool can generate code. Very few can generate the right code for your organization, because they're missing context."

Brandon Waselnuk来自Unblocked，他分享了一份构建上下文引擎的实践指南。这个引擎被视为AI Agent所需的推理层，其核心功能是将分散在不同来源的组织知识持续综合，转化为统一且可查询的理解。这不仅仅是简单的信息检索，而是对组织隐性知识和显性知识的深度整合，旨在解决传统AI工具在特定企业环境中的水土不服问题。

超越RAG的工程挑战

Brandon指出，构建这样的上下文引擎需要解决一系列实际存在的工程难题，这些难题使得简单的检索增强生成（RAG）方案往往失效。首要挑战是跨系统的推理能力，即系统需要处理那些彼此不一致的信息源。例如，文档中可能记录了过时的架构决策，而代码库中却反映了最新的变更，引擎必须能够识别并调和这些冲突。

"These are the engineering challenges that make naive RAG fall short, drawn from real lessons building this at scale."

其次，全局搜索是推理的前提。在能够进行有效的逻辑推理之前，系统必须能够跨越多个数据源进行广泛的搜索。这意味着不能仅依赖局部索引，而需要建立一种能够覆盖代码库、文档、聊天记录和任务管理工具的全局索引机制。此外，身份范围的权限管理也是关键挑战之一，必须确保每个用户和AI代理只能看到他们被授权访问的信息，防止敏感数据泄露。

身份与权限的精细化控制

在构建上下文引擎时，维护基于身份的权限控制是确保数据安全的核心环节。Brandon强调，系统必须能够精确地界定每个用户和AI代理的可见范围。这意味着引擎不仅要理解内容本身，还要理解谁有权访问该内容。这种权限控制不是简单的静态规则，而是动态的、基于上下文的，需要根据用户的角色、项目参与度以及当前的工作上下文实时调整。

"Maintaining identity-scoped permissions so every user and agent only sees what they should."

这种精细化的权限管理还涉及到个性化结果的呈现。系统需要根据提问者的身份和他们正在处理的任务，定制返回的信息。例如，初级工程师和首席工程师在查询同一架构问题时，可能会得到不同深度的回答，或者被引导至不同的文档和资源。这种基于角色的个性化不仅提高了信息的相关性，还确保了组织内部的知识传播符合其层级结构和协作模式。

跨系统推理与冲突调和

解决跨系统推理的问题要求引擎具备处理异构数据源的能力。不同的系统往往使用不同的术语、格式和逻辑，甚至对同一概念的定义也存在差异。引擎需要能够识别这些不一致性并进行调和，例如，当Slack讨论中的决策与Jira任务中的描述冲突时，系统需要判断哪个信息源更权威或更及时。

这种推理过程不仅仅是关键词匹配，而是语义层面的理解与整合。引擎需要构建一个知识图谱或类似的语义结构，将分散在不同系统中的实体、关系和事件连接起来。通过这种方式，系统能够回答诸如"为什么我们选择了Redis而不是DynamoDB？"这类需要综合多个来源信息的问题，从而提供基于完整上下文的准确答案。

全局搜索与统一索引

全局搜索是上下文引擎的基础设施要求。由于组织知识分散在代码库、文档、聊天工具、邮件和项目管理平台中，引擎必须建立一种能够覆盖所有这些来源的统一索引机制。这不仅仅是技术上的索引构建，更涉及到语义索引的建立，即理解每个数据片段在组织上下文中的含义和关联。

"Searching globally before you can reason."

这种全局搜索能力使得AI代理能够在进行推理之前，获取尽可能全面的背景信息。例如，当代理需要解决一个复杂的bug时，它不仅可以搜索相关的代码片段，还可以搜索相关的错误报告、最近的代码提交记录以及相关的讨论线程。这种多维度的信息获取显著提高了推理的准确性和全面性，避免了因信息片面而导致的错误决策。

个性化与情境化响应

上下文引擎的最终目标是提供高度个性化和情境化的响应。Brandon指出，系统需要根据提问者的身份、当前任务以及历史交互记录，定制返回的信息。这意味着同一个问题，由不同的人或在不同的时间点提出，可能会得到不同的回答。

这种个性化不仅体现在信息的深度和广度上，还体现在信息的呈现方式和推荐资源上。例如，对于正在迁移身份验证系统的团队，引擎可以主动推送相关的Slack讨论、架构决策记录以及最新的代码变更。通过这种方式，上下文引擎不仅是一个问答工具，更是一个智能的知识助手，能够主动帮助用户解决当前面临的问题，提升工作效率和代码质量。