www.chinastock.com.cn证券研究报告请务必阅读正文最后的中国银河证券股份公司免责声明[table_research]行业点评报告●计算机行业2022年12月11日[table_main]自营公司点评报告模板聊天机器人顶流ChatGPT,开启自然语言处理领域新篇章计算机行业推荐维持评级核心观点:事件:12月1日,美国人工智能公司OpenAI在网页上推出自然语言处理领域(NLP)的模型ChatGPT,它能够通过对话方式进行交互,并根据用户输入的自然语言文本内容,自动生成新的文本内容。一周内,ChatGPT的用户已突破100万。什么是ChatGPT:ChatGPT是在GPT3.5大模型语言模型(LLM,即LargeLanguageModel)的基础上,加入“基于人类反馈的强化学习(RLHF,ReinforcementLearningfromHumanFeedback)”来不断微调(Fine-tune)预训练语言模型,使得LLM模型学会理解不同类型的命令指令,并通过多重标准合理判断基于给定的prompt输入指令,输出的是否为优质信息(这些标准包括:富含信息、内容丰富、对用户有帮助、无害、不包含歧视信息等)。ChatGPT引爆AIGC,AIGC将迎多场景爆发期。AIGC即AI-GeneratedContent,是继UGC、PGC之后利用AI技术自动生成内容的新型生产方式。相比UGC和PGC,AIGC的最大不同是基于海量数据、风格随机多变、跨模态融合、认知交互力等新技术导向特征。随着ChatGPT的技术日渐成熟,AIGC将在电商虚拟主播、教育、金融、医疗、影视娱乐等多场景爆发,并进一步催生元宇宙的快速发展。ChatGPT的技术发展路径:从GPT-1到InstructGPT,数据量与参数量不断增加,模型精度和能力提升。2018年,在自然语言处理领域(NLP)刚兴起时,OpenAI就推出了初代GPT,它的运行逻辑是:先通过无标签数据学习生成语言模型,并能够运用于一些与有监督任务无关的NLP任务中。此后再根据特定的下游任务进行有监督的微调,提高其泛化能力。GPT-2扩展了网络参数和数据集,进行多任务学习,可以在数据量足够丰富且模型容量足够大时,通过训练语言模型就能够完成有监督学习的任务。对比GPT-2,2020年推出的GPT-3最显著的特征是庞大的数据量和参数投入,整体训练过程耗资1200万美元,投入数据量达上万亿,模型参数量达到1750亿。GPT-3延续了前两代GPT的技术架构,但改变了“大规模数据集预训练+下游数据标注微调”的方式,采用情境学习(in-contextlearning)来提高模型对话输出的性能。GPT-3的规模和语言能力几乎是最强大的。它能在不做微调的情况下,在一些传统的NLP任务中表现得更好,包...