你可能并不需要 RAG
本文探讨了传统RAG在复杂场景下因依赖文本片段相似度检索而难以还原完整答案的局限性,并提出了一种基于Agent的层级化检索方案,通过构建目录树和结构化数据来模拟人类阅读过程,适用于金融、法律等对准确性和逻辑完整性要求较高的领域。
共 14 篇文章
本文探讨了传统RAG在复杂场景下因依赖文本片段相似度检索而难以还原完整答案的局限性,并提出了一种基于Agent的层级化检索方案,通过构建目录树和结构化数据来模拟人类阅读过程,适用于金融、法律等对准确性和逻辑完整性要求较高的领域。
随着AI生成代码能力的普及,软件工程的核心正从编写代码转向设计可靠的系统。本文探讨了Harness Engineering(驾驭工程)的兴起,分析了从Prompt Engineering到Context Engineering的演进,并重点阐述了通过架构约束、反馈循环和熵管理来构建稳定、可维护的AI驱动开发环境的技术实践。
文章分析了传统浅层AI智能体在复杂任务中的局限性,并系统性地阐述了深度智能体架构的四个核心支柱:显式规划、层级委托、持久化记忆和极致上下文工程,以实现对多步骤、长时间任务的稳定处理。
文章回顾了从基于 LangGraph 的复杂多阶段 Agent 系统到极简架构的演变过程,探讨了模型能力提升如何减少对工程优化的依赖,并分析了 Tool 并发执行、Sub-Agent 隔离和异步消息压缩等关键设计。
文章探讨了在构建AI Agent时,上下文管理的深层问题,指出传统压缩方法如RAG和摘要的局限性。作者从工程角度分析,提出通过设计信息流,利用子Agent预处理网页、日志和命令输出,以优化上下文质量,强调Context Engineering的重要性。
本文探讨了 Agent Skills 作为 SOP(标准作业程序)的技术实现,详细解析了其基于渐进式披露(Progressive Disclosure)的三阶段加载机制(发现、激活、执行),并与 MCP(Model Context Protocol)在上下文加载方式和信任模型上进行了对比。通过一个中文写作规范 Skill 的示例,展示了如何设计目录结构、编写元数据和引用文档,以优化 Agent 的上下文使用效率。
本文探讨了 LangChain 团队选择不开发可视化工作流构建器的深层原因,分析了工作流与智能体在 AI 应用架构中的边界与融合趋势。文章从技术实现角度出发,讨论了高复杂度场景下代码化工作流的必要性、低复杂度场景中无代码智能体的优势,以及中复杂度可视化工作流在原型验证中的过渡角色。
本文深入探讨了如何构建 MCP Server 的 Resources 组件,通过 Python SDK 实现静态和动态资源,利用装饰器简化开发,并详细介绍了资源的核心协议和实战配置过程。
本文深入探讨了 Model Context Protocol (MCP) 的核心概念,包括其作为标准化协议如何解决 Function Call 的碎片化问题,并详细解析了 MCP Server、Client 和 Host 的角色与交互机制,为构建和接入 MCP 系统提供技术基础。
本文复盘了一个文旅AI助手项目的技术实现,重点探讨了结构化数据在RAG场景下的切分难题、长文本字段的处理策略,并对比了基于ID检索的优化方案与MCP Server工具调用的替代路径。