
作者:创新发展研究部 李童
大模型社区是围绕大型人工智能模型进行研究、开发、应用、共享的开放平台或社群。开源社区的发展壮大,快速聚集大众智慧,加速了大模型技术的迭代升级和广泛应用,同时,也促进了全球人工智能人才培育与技术交流,对提升各国在人工智能领域的竞争力具有重要意义。
一、开源开放生态是大模型发展的必经之路
开源开放生态是满足人工智能技术标准化、合作化趋势的必备条件。随着深度学习技术的兴起,特别是自然语言处理领域的循环神经网络(RNN)、Transformer架构、TensorFlow、PyTorch的提出和流行,开发者们能够更便捷地参与到大模型的研究和开发中,形成了围绕大模型的技术社群。
开源开放生态有助于降低人工智能应用门槛,推动AI技术的广泛应用。大模型开源社区将模型(覆盖视觉、语音、自然语言处理、多模态等主要领域)、数据和算法有机结合,通过模型即服务(Model as a Service,MaaS)降低使用者门槛,模型能够被快速使用并微调,最终适应具体业务场景。
开源开放生态是构建人工智能创新生态、提升产业竞争力的必然选择和重要路径。开源生态鼓励知识和技术共享,能够快速汇聚全球开发者的力量,共同推进技术创新,通过参与国际开源项目或建立本土开源社区进行本土化创新。
二、国内大模型社区发展现状及面临的瓶颈问题
我国大模型社区仍面临着起步晚、基础弱、算力资源分布不均、知识产权意识淡薄等瓶颈问题。
一,我国大模型社区发展仍处在起步阶段,基础薄弱。国内大模型社区的用户数量和反馈不足,较小的用户基数使得开源模型难以形成数据飞轮,影响模型迭代和质量提升。
第二,国内大模型社区在算力资源、基础设施和资金来源等方面存在挑战。尽管中国拥有巨大的数据量优势,但合法合规地汇集和利用高质量训练数据成为社区发展的制约因素。此外,算力资源有限及GPU/TPU等硬件资源的稀缺使得社区难以承担超大规模模型参数的训练成本。
第三,国内尚未形成健康、可持续发展的开源生态环境。一方面,政策层面缺乏导致对开源项目初期孵化和资金扶持力度不足。另一方面,国内大模型社区整体上对知识产权的认知有待提高。
三、上海助力我国破解大模型社区发展瓶颈的思路和建议
上海需要从品牌打造、普惠算力、生态营造等方面推动开源社区创新体系建设。
一是整合“线上+线下”平台,打造上海开源创新社区品牌。升级模速空间产业赋能功能,帮助制造业、医疗健康、金融科技等产业智能化升级。通过提供资金、场地、人才引进等多方面支持,吸引和集聚魔搭社区等在徐汇西岸落地,与模速空间形成“线上+线下”AI大模型开源开放生态。
二是推动普惠算力,多措并举支持AI大模型开发及应用。深化“AI算力券”政策服务力度。鼓励云计算服务商提供更丰富、更具性价比的云服务方案。
三是加强标准引导,营造开源开放的生态环境。鼓励人工智能企业对自研大模型进行开源,吸引更多科技企业和开发者个体参与大模型开源社区贡献。推动人工智能开源领域的标准化进程,明确开源项目的管理规则、知识产权归属、数据安全与隐私保护等方面的规范。充分发挥开源基金会对开源生态的治理作用,实现开源大模型技术与市场发展的相互成就,加快完善本土开源大模型生态。