当前位置: 首页 > news >正文

.NET+AI | Agent | 中间件执行次序剖析(12)


MAF 中间件执行顺序:深入理解洋葱模型

一句话简介

MAF 中间件遵循"洋葱模型"执行,请求从外向内,响应从内向外,正确理解执行顺序是构建企业级 Agent 的关键。


🎯 核心价值

  • 洋葱模型:请求依次经过外层→内层,响应按相反顺序返回

  • 三层触发频率:Agent Run 1次、ChatClient N次、Function M次

  • 精确时序:通过时间戳追踪完整执行链路


📝 执行顺序详解

触发次数对比

中间件层

触发时机

单次 Agent 调用触发次数

Agent RunRunAsync()1 次
ChatClient

每次 LLM 调用

2-N 次

(工具调用会增加)

Function

每次工具调用

0-M 次

(取决于工具数量)


💻 时序验证示例

带时间戳的中间件

var startTime = DateTime.UtcNow; double GetTimestamp() => (DateTime.UtcNow - startTime).TotalMilliseconds; // Agent Run 中间件 .Use(async (messages, thread, options, inner, ct) => { Console.WriteLine($"[T+{GetTimestamp():F0}ms] 🛡️ Agent Run Pre"); var response = await inner.RunAsync(messages, thread, options, ct); Console.WriteLine($"[T+{GetTimestamp():F0}ms] 🛡️ Agent Run Post"); return response; }, null)

典型输出

[T+0ms] 🛡️ Agent Run Pre [T+50ms] 📊 ChatClient Pre (第1次) [T+1200ms] 📊 ChatClient Post (第1次) [T+1210ms] 🔧 Function Pre: GetWeather [T+1320ms] 🔧 Function Post: GetWeather [T+1330ms] 📊 ChatClient Pre (第2次) [T+2500ms] 📊 ChatClient Post (第2次) [T+2510ms] 🛡️ Agent Run Post

📊 触发次数统计

场景:调用 2 个工具

Agent Run 中间件: 1 次 ChatClient 中间件: 2 次(初始调用 + 工具结果后调用) Function 中间件: 2 次(每个工具各 1 次)

计数器验证代码

var agentRunCount = 0; var chatClientCount = 0; var functionCount = 0; // 统计后输出 Console.WriteLine($"Agent Run: {agentRunCount} 次"); Console.WriteLine($"ChatClient: {chatClientCount} 次"); Console.WriteLine($"Function: {functionCount} 次");

🏢 企业级最佳实践

中间件注册顺序

注册顺序

执行顺序

推荐中间件

1️⃣ 最先注册

最外层

日志、监控

2️⃣ 中间注册

中间层

安全、限流

3️⃣ 最后注册

最内层

缓存、重试

注册顺序示例

var agent = chatClient.CreateAIAgent(...) .AsBuilder() .Use(LoggingMiddleware) // 最先注册 → 最外层 .Use(SecurityMiddleware) // 中间注册 → 中间层 .Use(CachingMiddleware) // 最后注册 → 最内层 .Build();

执行顺序:

请求 → Logging → Security → Caching → AI模型 响应 ← Logging ← Security ← Caching ←

🎯 总结

  • 洋葱模型:请求从外向内穿透,响应从内向外返回

  • 触发频率:Agent Run 1次,ChatClient/Function 多次

  • 注册顺序:先注册 = 更外层 = 先执行 Pre、后执行 Post

  • 实践建议:日志最外层,缓存最内层


如需获取文章配套完整代码,可扫码咨询领取。👇

http://www.cnnetsun.cn/news/168781.html

相关文章:

  • 46、掌握企业项目管理:从模板构建到资源配置
  • 57、掌握项目管理利器:全面解析项目规划与执行技巧
  • 31、深入解析IIS管理脚本与数据库操作
  • 常见快捷键
  • Linly-Talker支持多种肖像输入格式:证件照、自拍、动漫均可
  • 智慧城市之城市环境智能监管 非法倾倒行为自动识别 环保执法证据采 垃圾倾倒倾倒物品类型识别数据据 垃圾堆识别数据集 公路垃圾识别10315期
  • Chromium143原生支持HLS
  • 玩轮胎仿真不上手?老司机带你飙车。今天咱们用ABAQUS搞点硬核操作,从过盈充气到滚动传涵,手把手教你怎么让虚拟轮胎活起来
  • 当风电遇上“太极推手“:混合储能如何化解功率波动
  • MIPI DSI DPHY FPGA工程源码:Artix7-100t彩条驱动1024*600像...
  • 最近在折腾四旋翼导航时踩了不少坑,发现真正让无人机听话飞行的核心都在代码细节里。今天就拿手头正在调试的飞控项目举例,聊聊怎么用代码让四旋翼实现基础导航
  • 永磁同步电机全速域无传感器控制探索
  • Linly-Talker生成视频的镜头拉近推远动态效果实现
  • SpringBoot+Vue +线上教育培训办公系统管理平台源码【适合毕设/课设/学习】Java+MySQL
  • 36、Windows Server 2008 网络中的打印与网络策略服务介绍
  • 44、深入解析Windows Server 2008的安全保障与管理监控
  • 【python | pytorch | scipy】scipy scikit-learn库相互依赖?
  • 【python| pytorch】卸载py库,手动法
  • 30、活动目录安全审计策略的实施与管理
  • Linly-Talker能否接入Unity引擎实现游戏内NPC对话?
  • Linly-Talker在智能家居控制中的视觉反馈机制
  • Linly-Talker能否实现AR眼镜端实时渲染?近眼显示优化
  • 力扣hot100:旋转排序数组中找目标值
  • Linly-Talker能否导出音频单独使用?资源复用建议
  • Linly-Talker如何保证用户上传肖像的安全性?
  • Linly-Talker如何处理专业术语发音准确性问题?
  • Linly-Talker如何平衡生成速度与画质清晰度?
  • 基于springboot+vue3的企业人事管理系统设计与实现
  • Linly-Talker支持实时摄像头推流吗?直播推流配置指南
  • Java之网络编程,新书小白入门教学,收藏这篇就够了