人工智能通用大模型(ChatGPT)的进展、风险与应对发布单位:华东政法大学政治学研究院华东政法大学人工智能与大数据指数研究院华东政法大学政治学研究院01通用大模型的近期进展目录03通用大模型的治理风险评估04通用大模型的风险应对策略02各国通用大模型的能力比较华东政法大学政治学研究院通用大模型的近期进展01华东政法大学政治学研究院1通用大模型的近期进展1通用大模型的近期进展大模型的内涵与特征大模型的发展历程运行机制三大特征预训练模型的发展历程多模态预训练模型“大模型”和“小模型”协进平台化与简易化并进通用化与专用化并行大模型的发展趋势44544/55华东政法大学政治学研究院大模型的内涵与特征1.1•大模型是指容量较大,用于深度学习任务的模型,通常具有海量的参数和复杂的架构。•大模型具有更好的通用性、精度和效率,可以通过预训练或其他方式在大型数据集上进行学习,再通过微调高效地处理计算机视觉、自然语言处理等复杂任务。预训练模型的运行机制1通用大模型的近期进展Transformer(主要)、GAN、CNN以及RNN等架构通过海量数据进行预训练(通才)微调以应用不同场景(专家)解决各种复杂任务55545/55华东政法大学政治学研究院大模型的内涵与特征1.11通用大模型的近期进展涌现性扩展性复合性强化技术的融合解决传统AI的问题增强AI的能力有效集成自然语言处理等多个人工智能核心研究领域的多项技术,实现1+1>2的融合式涌现。大模型能够有效支撑智能终端、平台、系统等产品应用落地,解决壁垒多、部署难等问题。在海量通用数据上预训练以具备多种基础能力,摆脱传统人工智能能力碎片化、作坊式开发的局限。66546/55华东政法大学政治学研究院大模型的发展历程1.21通用大模型的近期进展单语言预训练模型多语言预训练模型多模态预训练模型能够处理自然语言,源于早期的词嵌入(wordembedding)的工作。具备多样化的基础语言能力,开始分别处理多种自然语言任务,如机器翻译、问答系统、情感分析等。以多语言训练模型为核心,进行文字、图片、视频的同步转化,实现处理多任务的目标。77547/55华东政法大学政治学研究院多模态预训练模型视觉文本语音······理解式任务生成式任务1.2大模型的发展历程1通用大模型的近期进展•多模态预训练模型:人工智能如何理解世界?处理多任务应用领域进展医疗深度多任务学习能够应用于医学影像分析中金融同一海量数据的多任务处理工业Multi-Task经典模型结构;全空间多任务模型ESMM教...