LLMPerf:生成CSV格式原始数据,需二次处理5.4 典型应用场景vLLM Benchmark推理引擎选型(如对比vLLM、LMDeploy、TensorRT-LLM的吞吐量)长上下文支持能力验证(如测试16k+Token输入的显存溢出风险)EvalScope生产环境服务容量规划(如通过--parallel 模拟多路并发)多模态模型效果-性能平衡分析(如Embedding模型响应延迟与召回率关联性)LLMPerf云API服务商性能对比(如Anthropic Claude vs OpenAI GPT