Last Data

Posted: **Mon Apr 21, 2025 4:00 am**

鉴于“路由”和“检索”的分类性质微调它们相对顺畅：我们构建了开发测试集并使用提示词工程和内部模型进行优化。然而“生成”则是一个完全不同的故事。它遵循80/20法则；很快可以达到80%的准确度但剩下的20%却耗费了我们大部分人的所有工作时间。

当你的产品期望99%以上的答案都非常出色时即使使用最先进的模型每一个1%的进步也仍然需要大量的工作和创造力。对我们而言好使的招数是：固定的步流程用小模型干路由/检索用大模型干生成基于内存数据库的EBREmbedding-Based Retrieval (EBR 直接将响应示例注入到我们的提示词中穷人版微调。

EBR是个技术名词感兴趣的自己再查吧。在路由和检索过程中针对每个步骤做特定评估 2. 开发速度我们希望多个团队并行快速推进因此决定将任务拆分为由不同人员开发的独立智能体即AI智能体：岗位评估、理解公司、帖子要点提取等智能体分别由不同团队负责。

这种方法带来了显著的不良影响compromise。通过并行处理任坦桑尼亚电话号码列表务我们在速度上取得了优势但这却以碎片化为代价。当与智能体的交互可能由不同的模型、提示词或工具管理时保持统一的用户体验变得极其具有挑战性。

为了解决这个问题我们采用了一个简单的组织结构： 1一个小型“横向”工程小组负责处理公共组件并专注于整体体验。这包括：各种支撑此产品的基础服务评估/测试工具所有垂直领域使用的全局提示词模板例如智能体的全局身份标识、对话历史、越狱攻击的防护等 iOS/Android/Web客户端的共享UX组件注：一般就是指按钮、下拉列表这些一个服务器端驱动的UI框架用于发布新的UI更改而无需更改或发布客户端代码。