
IT 之 2 月 4 日讯息周口不锈钢保温,腾讯混元 AI Infra 团队当天文书出开源坐褥能 LLM 理核默算子库 HPC-Ops。
该算子库声称基于坐褥环境痛点,罗致 CUDA 和 CuTe 从构建,通过概括化工程架构、微架构度适配及提醒致化等,裁汰底层算子建树门槛,将核默算子能迫临硬件峰值,兑现了能冲破。
▲ HPC-Ops 算子库架构图周口不锈钢保温
在实在场景下,基于 HPC-Ops,混元模子理 QPM 提高 30,DeepSeek 模子 QPM 提高 17。同期,在单算子能面,设备保温施工HPC-Ops 兑现 Attention 比较 FlashInfer / FlashAttention 提高 2.22 倍;GroupGEMM 比较 DeepGEMM 提高 1.88 倍;FusedMoE 比较 TensorRT-LLM 提高 1.49 倍。
在翌日的发展认识中,HPC-Ops 将捏续耕大模子理能的冲破向:
面,将研发稀疏 Attention 算子,针对科罚长凹凸文大模子的内存与算力瓶颈;
另面,会拓展丰富的量化计谋,粉饰 4bit/8bit 混精度等大宗化案,超越均衡理速率与模子精度;
此外,算子库还将布局计较 - 通讯协同化的内核,通过融多 GPU 间的计较逻辑与通讯过程,大幅裁汰踱步式理场景下的通讯支出,为大边界大模子的部署提供底层撑捏。
联系人:何经理IT 之附 HPC-Ops 开源地址如下:周口不锈钢保温
相关词条:离心玻璃棉 塑料挤出机 钢绞线厂家 铝皮保温 pvc管道管件胶