DeepSeek技术再突破!港科大团队用MLA+稀疏激活让百亿级AI跑进手机,性能直追大模型
2025-03-27
港科大广州、伦敦大学学院等团队联合发布边缘语言模型PLM,采用DeepSeek提出的MLA注意力机制与稀疏激活技术,针对手机等边缘设备优化。PLM在数学、代码能力等任务表现优异,参数量仅1.8B却接近Qwen2.5-1.5B水平,开源模型及技术方案,验证了DeepSeek技术在端侧部署的可行性。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表
官方立场,不构成投资建议。如需阅读详细说明,请点击此处
