火山引擎:基于 Ray 的大模型离线推理(2023)

VIP专免
2023-11-04
999+
8.38MB
23 页
海报
侵权投诉
NoSuchBucket
NoSuchBucket
NoSuchBucket
摘要:
展开>>
收起<<
2023/3/271基于Ray的大模型离线推理王万兴|火山引擎资深研发工程师22.使用Ray构建大模型推理框架3.Ray云原生部署实践1.大模型离线推理的关键挑战2大模型离线推理的关键挑战3www.volcengine.com大模型离线推理4大模型离线推理(Batch推理),是指在具有数十亿至数千亿参数的大规模模型上进行分布式计算推理的过程www.volcengine.com大模型离线推理的关键挑战--GPUMemoryWallØ模型参数量越来越大Ø算力和需求gap越来越大Ø需要做模型切分5www.volcengine.com模型切分6ü支持更大模型ü降低成本ü空分复用www.volcengi...
声明:报告堂所有资料均为用户上传分享,仅供参考学习使用,版权归原作者所有。若侵犯到您的权益,请告知我们处理!任何个人或组织,在未征得本平台同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。