EdgeShard: Efficient LLM Inference via Collaborative Edge Computing

摘要

引言

背景知识

框架结构----考虑在一个具有异构设备和带宽连接的通用协作边缘网络

框架结构：预处理阶段

框架结构----考虑在一个具有异构设备和带宽连接的通用协作边缘网络

框架结构：生成调度策略阶段

针对延迟的动态规划算法

针对延迟的动态规划算法

针对吞吐量的动态规划算法

框架结构----考虑在一个具有异构设备和带宽连接的通用协作边缘网络

模型部署和推理阶段

实验部分

实验部分----指定带宽

实验部分----带宽变化

实验部分----带宽变化

实验部分----边端节点配置不同

谢谢！