腾讯云联合信通院发布《行业大模型标准体系及能力架构研究报告》
2023腾讯全球数字生态大会「行业大模型及智能应用专场」于9月7日举行,会上,腾讯云与信通院共同发布了《行业大模型标准体系及能力架构研究报告》,参考了腾讯云在行业大模型产业应用领域的实践和经验,为客户构建行业大模型提供了标准化流程、综合评估方法,以便更好地帮助行业伙伴构建专属大模型。
(相关资料图)
生态大会上,腾讯还首次对外公布了腾讯混元大模型进展,并宣布从技术底座、平台能力、智能应用三大维度升级MaaS能力。基于自研腾讯混元大模型,同时支持业内20余款主流开源模型,助力客户构建专属大模型及智能应用,加速模型产业落地,推进“效能革命”。
随着人工智能模型规模逐渐增大,性能显著提升,各行各业迎来了新的发展机遇。相比于通但不精的通用大模型,更专注、更专业的行业大模型在特定产业场景具有广泛的应用和商业创新价值。但行业大模型落地到真实场景里,客户仍面临着投入成本高、计算资源少、数据质量差、专业人才稀缺等问题。基于行业用户的痛点,腾讯云与通信院开展了行业大模型标准体系及能力架构的研究,帮助企业解决行业大模型应用问题,提升企业使用大模型进行数字化转型的效率。
建立标准化流程,指导企业建设大模型能力
行业大模型的构建,对行业数据、计算资源和部署运维等提出较高的要求,这对于很多企业来说有一定的门槛,而且当前缺乏面向行业大模型的构建方法和流程的指导方案,企业不清楚如何着手构建行业大模型。基于此问题,腾讯云与信通院针对垂直领域的行业大模型,建立标准化流程,指导企业建设大模型能力。
构建行业大模型首先需要对业务需求和资源进行评估,具体包括包括业务需求评估、算力层评估、 算法层评估、数据层评估和工程层评估等。
「业务需求评估」需要结合实际场景和需求,对业务数据、业务指标、业务服务方式进行明确,通过算力层、算法层、数据层和工程层的评估,确定所选用的基础模型和精调算法,根据数据安全隐私、数据质量等问题,确定平台适配性和训练流。
行业数据与大模型的共建包括明确场景目标、模型选择、训练环境搭建、数据处理等环节。行业数据与大模型的共建,首先需要明确行业大模型实际应用场景及模型评价目标,在模型库中选择合适的基础大模型,通过硬件环境的搭建和软件平台的构建,将数据加工为模型训练所需数据,最后进行特定场景行业大模型的训练共建,包括数据上传训练平台、准备训练代码和环境、发起模型训练任务、存储训练后的模型、测评训练后的模型等关键环节。
行业大模型的精调与优化部署,其中包括模型精调、模型评估、模型重训优化、模型联调部署、模型应用运营等阶段。行业大模型精调与优化部署,具体根据业务需求和资源的评估情况以及对行业数据与大模型的共建,利用前期准备的特定行业特定场景数据进行大模型的训练精调,并且对其生成的模型进行评估与多轮迭代训练优化。随后对模型进行推理服务部署、服务配置、应用服务联调,并对已上线的模型服务提供监控、管理、运营维护等能力。
完善标准体系,全面建立能力评估指标
随着大模型的快速兴起,业界也意识到,创新技术的发展离不开标准化的推动,大模型标准体系的建设和完善,对于推动大模型应用落地,加速大模型与行业应用融合,促进产业向标准化、合规化、规模化方向发展,具有重要意义。
信通院作为国家信息通信领域的重要研究机构,一直关注AI技术的发展和应用,特别是大模型技术的创新和推广。聚焦基础大模型在实际需求中的“建、用、管”等关键环节,信通院从多个方向牵头构建和完善大模型的标准体系,腾讯全程并深度参与整个标准工作,聚焦工程化应用,围绕模型开发、模型能力、模型运营、模型应用、模型可信五方面形成标准指标体系,全面评估大模型的综合水平。
金融、文旅、政务、传媒、电信、教育、汽车等行业大模型标准和评测指标,对于推动行业大模型的高质量发展和提升用户体验,提升数智化水平起着关键作用。一方面,行业大模型标准可用于指导第三方测评机构对特定行业大模型能力的评估、验收等工作,另外一方面,评测指标则可考察模型在各应用场景的覆盖情况,以及在数据处理、数据合规、数据隐私和安全性等方面的表现。
“我们希望行业大模型标准体系及能力架构研究,能够帮助行业伙伴解决如何将大模型能力“应用”到自身的行业和场景里的问题,可以更有效的解决成本、数据、安全,合规等大模型实际落地难题。通过建立标准体系,为行业大模型的建设和应用提供指引和支持。”腾讯法务副总裁江波提到。
在20多个行业落地大模型的同时,腾讯云一直都在积极参与、推动行业大模型标准建设。早在2020年,腾讯就被选举为全国信标委人工智能分委会委员兼副秘书长,国家在推进包括人工智能新基建的过程中,腾讯作为核心成员,承担了很多标准制定工作及技术引领作用。
前不久,腾讯云就与中国信通院共同启动了行业大模型标准联合推进计划,并联合信通院牵头开展国内首个金融行业大模型标准,为金融行业智能化的高质量规范化发展提供重要支撑。
中国信息通信研究院云计算与大数据研究所所长何宝宏表示,随着人工智能技术的快速发展,行业大模型已成为推动产业升级的重要驱动力。为了规范和引领行业大模型的健康、可持续发展,有必要构建行业大模型的标准体系,以科学评价大模型技术能力和应用效果。愿本次研究成果,助力大模型产业发展和生态建设。