400-6688-955

“技术升级+一站构建”助大模型降本增效返 回

发布日期:2023-12-04
“技术升级+一站构建”助大模型降本增效
 
如何在算力紧缺的背景下提升大模型训练和推理的效率,并降低成本?这已成为一众大模型企业不得不面对的难题之一。
 
工业机器人教育网
 
如何破解这道难题?据悉,基于自研机器学习框架Angel,腾讯打造了大模型接入和应用开发的一站式平台,让针对业务场景的数据处理、模型微调、评测部署和应用构建等多个环节,从以往“散装”的多团队协作方式,转化成流水线平台上自动化生产方式,让大模型的“开箱即用”成为可能。“开箱即用”的关键在于预训练基础模型的泛化能力,高性能框架提供的微调或扩展工程能力,以及应用平台的灵活构建能力等支撑。据媒体披露,目前腾讯会议、腾讯新闻、腾讯视频等超过300个腾讯产品及场景均已接入腾讯混元大模型进行内测,数量相比10月份翻了一倍,覆盖文本总结、摘要、创作、翻译、代码等多个场景。比如,腾讯混元大模型就可支持智能化的广告素材创作,满足“千人千面”的需求。
 
《北京市人工智能行业大模型创新应用白皮书(2023年)》数据显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余个省市/地区。
 
“未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合。”中国人民大学数字经济研究中心主任李三希此前表示,这不仅需要具备坚实的技术基础,如大规模、高质量、多样化的语料库,创新的大模型算法,自研的机器学习框架和强大的算力基础设施等,也需要大模型产品具有坚实的基于场景的应用。未来,从实践中来,到实践中去的“实用级”大模型将成为趋势。
 
内容来源于科技日报,经工业机器人教育网编辑整理,如有侵权,请联系删除。
提示消息