在 MLOps 体系中,模型推理服务的性能是衡量整个系统价值的关键瓶颈。低延迟和高吞吐是硬性指标。常规的方案,即通过 AWS API Gateway 触发 Lambda,使用 RESTful API 和 JSON 进行数据交换,虽然简单快捷
2023-10-27