技术研究

围绕AI测试、Agent工程、AI质量治理与大模型应用实践方向，持续进行技术研究、工程探索与实践沉淀。

AI测试

3 篇文章

大模型评测框架的设计与实践

从评测维度、指标体系到自动化执行，构建可复现的大模型评测能力。

评测框架指标体系自动化

阅读文章

Agent行为验证方法探索

面向Agent系统的行为正确性验证、回归测试与异常检测方法。

行为验证回归测试异常检测

阅读文章

AI测试用例自动生成技术

基于大模型的测试用例自动生成技术研究与应用实践。

用例生成自动化测试大模型应用

阅读文章

Agent工程

3 篇文章

企业级Agent架构设计模式

面向企业场景的Agent系统架构设计模式与最佳实践总结。

架构设计设计模式工程实践

阅读文章

多Agent协作机制的工程实践

多Agent系统中的通信、协调、任务分配与容错机制研究。

多Agent协作机制任务编排

阅读文章

Agent可观测性体系建设

Agent系统运行状态监控、行为追踪与性能分析的技术方案。

可观测性行为追踪性能分析

阅读文章

AI质量治理

3 篇文章

AI系统质量度量模型

面向AI系统的多维度质量度量模型与评估标准设计。

质量度量评估标准模型设计

阅读文章

持续AI质量监控方案

AI系统上线后的持续质量监控、预警与自动化响应机制。

质量监控预警机制自动化响应

阅读文章

AI应用安全与合规实践

AI应用中的安全风险识别、防护策略与合规治理方案。

应用安全合规治理风险防护

阅读文章

大模型应用实践

3 篇文章

RAG系统设计与优化策略

企业级RAG系统的架构设计、检索优化与效果提升实践。

RAG检索优化架构设计

阅读文章

大模型推理性能优化

大模型推理加速、资源优化与成本控制的工程实践。

推理加速资源优化成本控制

阅读文章

Prompt工程化管理方法

面向企业应用的Prompt版本管理、效果评估与持续优化方法。

Prompt管理版本控制效果评估

阅读文章