上海市经济信息中心
上海市经济信息中心
首页 > 智库研究 > 创新经济
加快大模型布局落地应用,赋能新质生产力培育——从Sora发布看大模型发展趋势、影响及应对
时间:2024-03-28

作者:创新发展研究部 刘婧敏

2024开年,OpenAI推出其首个文生视频大模型Sora,在视频时长和连贯性、画质清晰度、多镜头切换、三维一致性等方面的出色表现让人惊叹,被认为是视频领域的ChatGPT时刻。以Sora为代表的大模型迭代创新,通过提供泛化能力的模型底座、不同领域的共性技术,将加速垂直行业应用落地,促进数实融合持续深化,掀起新一轮的生产力革命。

一、关于Sora的两点认识

从技术原理看,Sora基于DiT等已有技术集成,并非全新的底层技术突破。从应用价值看,Sora在大样本训练下展现出“涌现”能力,开创了文生视频的全新路径。

二、从Sora看大模型发展趋势及影响

一是从单模态向多模态演进,通用人工智能进程加快。此前大模型在各个领域的应用主要集中在文生文、文生图上,此次Sora的发布,反映出大模型在综合文本、图片、音频、视频等多个模态的信息进行联合建模和分析,以及理解并适应复杂的现实环境等方面取得重大进步,展现出多模态模型在模拟物理世界时的巨大潜能。

二是从基础模型向垂直模型延伸,应用落地迎来拐点。Sora强大的文生视频能力,打开了在影视、广告、游戏等多个领域应用落地想象空间,标志着大模型发展正从“基础平台”向“垂直应用”和“特定场景”延伸拓展,大模型商业化落地加速。

三是从开源为主向开源与闭源并存发展,行业生态加速重构。长期以来,人工智能领域有着浓厚的开源氛围,然而从GPT3开始,Open AI选择了闭源的方式,此次发布的Sora也未公开源代码、模型参数和训练数据集等具体技术细节,大模型发展呈现开源与闭源并存趋势。

基于Sora在“理解和模拟现实世界”方面的重大突破,其将带来两个方面的重大影响:

一是探索模拟物理世界的可行路径,推动社会各行各业全面重塑。Sora定位“世界模拟器”,其对物理世界理解和建模能力的提升,必将对社会各行各业带来冲击,传统影视制作和商业模式面临重塑,自动驾驶、具身智能等高度依赖计算机视觉的行业也有机会取得颠覆性突破。

二是重新定义人类与AI的交互关系,提出人工智能治理全新挑战。Sora的出现彻底变革了人机交互模式,进一步模糊了“真实”与“虚假”的界限,引发社会对深度伪造、虚假信息泛滥以及伦理道德等的担忧,其训练数据是否合法合规、是否涉及版权侵权以及“涌现”效应是否带来不可控风险等问题也引发业内争议。

三、加快AI大模型布局落地,激发培育新质生产力

一是深耕基础模型,强化底层技术支撑。加快落实大模型创新支持计划,推动国家战略科技力量、AI龙头企业开展产学研协同攻关,跨前布局多模态技术以及下一代模型架构和智能算法,形成体系化技术能力。

二是布局垂直应用,提升场景落地能力。针对垂类模型普遍存在的训练数据瓶颈,探索建设大模型数据资源服务平台,通过开放共享、付费使用等多种模式提供数据支持;针对大模型领域开源不足的问题,加大对人工智能开源开放平台的支持,构建AI大模型工具链生态,加速大模型在垂直行业落地。

三是夯实算力底座,强化要素服务保障。抓好“算力补贴券”等政策落地,提升算力公共服务平台能级,联动长三角算力网络,提供万卡规模集群、高效统一调度、分布式算力部署等服务支持。

四是完善治理机制,构建良好发展环境。借鉴美、欧等国家人工智能“敏捷治理”思路,建立基于风险评估的分级分类监管制度,围绕数据治理、知识产权、伦理道德、信息内容等重点方面,积极探索数据来源合法性基础、透明度保障以及“价值敏感设计”“负责任创新”等制度规则。

中心概况 工作要闻 智库研究 主要成果 公示公告
主办:上海市经济信息中心
地址:中国.上海市华山路1076号
承办:上海中经互联网络有限公司
邮编:200050 电话:021-62589090