Why AI Agents Need Context | Deep Dives with a16z

AI代理的核心痛点：上下文缺失

Martin Casado与Fivetran联合创始人兼CEO George Fraser展开对话，深入探讨AI时代数据基础设施的未来走向。对话的核心议题围绕Fivetran与dbt的合并、数据平台角色的转变，以及Fraser对AI威胁企业软件的独特见解。Fraser认为，许多公司高估了AI对传统企业软件的颠覆性威胁，并指出尽管基于代理（Agent）的工作流日益普及，企业依然离不开集中式的数据基础。他们讨论了开放数据访问的必要性，以及为何AI代理在直接访问记录系统时会遭遇强烈反弹。

Fraser进一步分享了他对“数据引力”、编码代理以及企业AI采用率的看法，并阐述了AI如何改变软件公司的产品构建与运营模式。在对话初期，重点聚焦于AI代理为何需要上下文。Fraser指出，当前的AI代理往往缺乏对业务逻辑和历史数据的深刻理解，这导致它们在执行复杂任务时容易出错。AI代理不仅仅是执行命令的工具，它们需要理解业务背景才能做出正确决策。这种对上下文的需求，正是数据基础设施需要进化的根本原因。

"Many companies are overestimating the threat that AI poses to enterprise software."

Fraser强调，虽然AI代理在生成代码或简单查询方面表现出色，但在处理涉及多步骤、多系统交互的企业级任务时，缺乏上下文会导致代理无法理解数据之间的关联性和业务约束。因此，单纯依赖LLM（大语言模型）而不提供高质量、结构化的数据上下文，是无法实现真正的自动化。这一观点为后续讨论数据平台的重要性奠定了基础，即数据平台必须从单纯的数据存储转向提供富含语义的上下文服务。

SaaS封闭模式的反弹与开放数据策略

随着AI代理试图直接访问各种SaaS应用以获取数据，行业出现了一股强烈的反弹浪潮。Fraser指出，SaaS厂商正在收紧数据访问权限，试图通过封闭生态来锁定客户。这种“SaaS Lockdown”趋势引发了企业和开发者的不满，因为AI代理需要广泛的数据访问权限才能发挥最大效用。封闭的数据访问不仅阻碍了AI代理的发展，也降低了企业数据利用的灵活性。

Fraser认为，这种封闭策略是短视的。他提出了一套“开放数据 playbook”，主张企业应推动数据访问的标准化和开放化。开放数据访问不仅有助于AI代理更好地工作，也能增强企业在供应商之间的议价能力。他提到，如果SaaS厂商继续封闭数据，企业可能会转向那些提供更开放API和数据导出功能的竞争对手。这种市场压力将迫使SaaS厂商重新考虑其数据策略。

"There is a backlash against AI agents accessing systems of record."

Fraser进一步解释，AI代理直接访问生产系统（Systems of Record）存在巨大的安全和合规风险。因此，企业倾向于在AI代理和数据源之间建立一个中间层，即数据平台。这个中间层负责数据的提取、转换和加载（ETL/ELT），并为AI代理提供清洗后、结构化的数据。这种架构既满足了AI对数据的需求，又保障了数据源的安全和稳定。Fraser认为，Fivetran与dbt的合并正是为了强化这一中间层的能力，通过提供端到端的数据管道和转换工具，帮助企业构建更健壮的数据上下文。

开放数据路线图与实施挑战

在讨论开放数据策略时，Fraser详细阐述了实施开放数据访问的具体步骤和挑战。首先，企业需要识别关键数据资产并评估其敏感性。并非所有数据都适合直接暴露给AI代理，因此需要建立严格的数据分类和访问控制机制。数据治理是开放数据战略成功的关键，缺乏治理的开放数据可能导致数据泄露或合规问题。

其次，企业应采用标准化的数据格式和API协议，以便AI代理能够无缝集成。Fraser提到，SQL和RESTful API是目前最广泛支持的标准，但新兴的协议如GraphQL也在逐渐普及。标准化的数据接口降低了AI代理的开发和维护成本，使得企业能够更快速地部署AI应用。此外，Fraser还强调了元数据管理的重要性，即通过记录数据的来源、含义和转换逻辑，为AI代理提供丰富的上下文信息。

"Open data access is crucial for AI agents to function effectively."

Fraser指出，尽管开放数据的好处显而易见，但实施过程中面临的技术和组织阻力不容忽视。技术层面，遗留系统往往缺乏现代化的API接口，需要大量的改造工作。组织层面，不同部门之间可能存在数据孤岛，协调统一的数据标准需要高层的支持和跨部门的合作。Fraser建议企业从小规模试点开始，逐步扩展开放数据的范围，并在过程中不断迭代和优化数据治理策略。通过这种方式，企业可以在控制风险的同时，逐步实现开放数据的价值。

企业级AI代理的实际应用案例

Fraser分享了几个企业级AI代理在实际业务中的应用案例，展示了AI如何在复杂的企业环境中发挥作用。在一个案例中，一家零售公司利用AI代理自动化库存管理和供应链优化。AI代理通过分析历史销售数据、市场趋势和供应商库存信息，自动生成补货建议并执行采购订单。这一应用不仅提高了库存周转率，还显著降低了缺货风险。

另一个案例涉及一家金融机构，他们利用AI代理自动化合规报告生成。AI代理从多个内部系统中提取数据，按照监管要求生成报告，并自动发送给监管机构。这不仅减少了人工错误，还大幅缩短了报告生成的时间。Fraser强调，这些成功的关键在于AI代理能够访问高质量、结构化的数据上下文，而不是直接从原始数据源中抓取信息。

"Enterprise agents are changing the way businesses operate."

Fraser还提到，AI代理在客户服务领域的应用也在迅速增长。一家电信公司利用AI代理自动化处理客户投诉和查询。AI代理通过分析客户历史数据和当前问题，提供个性化的解决方案，并在必要时转接人工客服。这一应用不仅提高了客户满意度，还降低了客服成本。Fraser指出，这些案例表明，AI代理的价值不仅在于自动化任务，更在于它们能够利用数据上下文做出更智能的决策。

最小化代理与MCP协议的对比

在讨论AI代理架构时，Fraser对比了“最小化代理”（Minimal Agents）与模型上下文协议（MCP）两种不同的技术路径。他认为，最小化代理侧重于简化代理的逻辑，使其专注于特定任务，而MCP则旨在提供一个标准化的接口，使代理能够与各种数据源和工具进行交互。

Fraser指出，最小化代理的优势在于部署简单、资源消耗低，适合处理单一、明确的任务。然而，它们在处理复杂、多步骤任务时可能显得力不从心。相比之下，MCP提供了更灵活和可扩展的架构，允许代理动态地访问不同的数据源和工具。但MCP的实施复杂度较高，需要企业投入更多的资源进行开发和维护。

"Minimal agents vs MCP: a trade-off between simplicity and flexibility."

Fraser认为，企业应根据自身需求选择合适的代理架构。对于资源有限、任务明确的企业，最小化代理可能是更好的选择。而对于需要处理复杂业务逻辑、拥有多样化数据源的大型企业，MCP提供了更强大的支持。此外，Fraser还提到，随着AI技术的进步，这两种架构可能会逐渐融合，形成一种兼具简单性和灵活性的新型代理架构。他建议企业保持技术敏锐度，密切关注行业趋势，以便及时调整技术策略。

SaaS危机与AI原生威胁的再评估

Fraser对所谓的“SaaS Apocalypse”（SaaS末日）持保留态度，他认为许多公司高估了AI原生应用对传统SaaS软件的威胁。他指出，虽然AI原生应用在用户体验和效率方面具有优势，但传统SaaS软件在数据积累、行业知识和客户信任方面拥有深厚的护城河。

Fraser强调，企业软件的价值不仅仅在于功能，更在于其背后积累的数据和网络效应。AI原生应用很难在短时间内复制这些优势。此外，企业客户对数据安全和合规性的要求极高，传统SaaS厂商在这些方面已经建立了完善的体系，而新兴的AI原生应用往往需要时间来建立信任。

"The threat of AI-native apps to enterprise software is often overstated."

Fraser认为，传统SaaS厂商应该积极拥抱AI，将其作为增强现有产品的手段，而不是视为威胁。通过集成AI功能，传统SaaS厂商可以提升产品竞争力，巩固市场地位。他举例说明，许多领先的SaaS厂商已经开始利用AI来优化用户体验、提高运营效率，并开发新的增值服务。这种“AI增强”策略比“AI替代”策略更具可行性和可持续性。Fraser建议企业在评估AI威胁时，应综合考虑技术、市场和客户因素，避免盲目跟风。

AI如何强化数据基础架构

尽管AI带来了新的挑战，但Fraser认为AI也在推动数据基础架构的升级和优化。他指出，AI代理对高质量数据的需求，迫使企业重新审视和改进其数据管道和治理体系。为了支持AI代理，企业需要提供更实时、更准确、更结构化的数据，这促进了数据基础设施的技术创新。

Fraser提到，数据湖仓（Data Lakehouse）架构的兴起正是为了满足AI对数据的需求。这种架构结合了数据湖的灵活性和数据仓库的性能，能够同时支持结构化查询和AI训练。数据湖仓的普及使得企业能够更高效地管理和利用数据资产，为AI应用提供更强大的支持。

"AI is boosting the evolution of data foundations."

此外，Fraser还强调了自动化数据治理的重要性。传统的数据治理往往依赖人工操作，效率低下且容易出错。AI技术可以自动化数据分类、质量检查和合规审计，提高数据治理的效率和准确性。Fraser认为，AI与数据基础设施的深度融合，将推动企业数据能力的整体提升，为企业数字化转型提供更坚实的基础。

dbt合并与CEO的战略展望

最后，Fraser谈到了Fivetran与dbt的合并，以及他对公司未来的战略展望。他认为，这次合并是Fivetran从单纯的数据提取工具向端到端数据平台转型的关键一步。通过整合dbt的数据转换能力，Fivetran能够为客户提供更完整的数据管道解决方案，从数据提取、转换到加载，实现全流程的自动化和智能化。

Fraser指出，合并后的公司将拥有更强大的市场竞争力，能够吸引更多寻求一站式数据解决方案的企业客户。他强调，Fivetran将继续坚持开放数据的原则，致力于降低数据访问的门槛，促进数据生态系统的繁荣。此外，Fraser还提到，公司将加大在AI领域的投入，探索AI在数据管道优化、智能数据治理等方面的应用。

"The dbt merger marks a new chapter for Fivetran."

Fraser对Fivetran的未来充满信心，他认为在AI时代，数据基础设施的重要性将进一步提升。他呼吁行业同仁共同推动数据开放和标准化，构建更健康、更可持续的数据生态系统。Fraser表示，Fivetran的使命是帮助企业和开发者更好地利用数据，而AI将是实现这一使命的重要助力。他期待与社区一起，见证数据基础设施在AI时代的变革与创新。