ChatGPT林惠⽂@真格基⾦daimajia.com体验ChatGPT与GPT-3的对⽐与GPT-3的对⽐与GPT-3的对⽐强烈建议体验https://mirror.xyz/0x6E12A28086548B11dfcc20c75440E0B3c10721f5/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBcChatGPT提升的核⼼点•敢于质疑不正确的前提•主动承认错误和⽆法回答的问题•⼤幅提升了对⽤户意图的理解•⼤幅提升了结果的准确性提升⼈类意图的⼀致性连续多轮对话能⼒提升的原因加⼊了基于⼈类的反馈系统丛问题库⾥抽取问题什么是⾹蕉?⾹蕉是⼀种⽔果,从⾹蕉树….标记者(Labeler)书写期待的回复被标记的数据⽤来调优GPT-3.5什么是⾹蕉?⾹蕉是⼀种⽔果,从⾹蕉树….⾹蕉是芭蕉科、芭蕉属植物...⾹蕉为芭蕉科植物⽢蕉的果实。原产亚洲东南部…⾹蕉,从属性来说,与草莓、葡萄、猕猴桃是亲…标记者(Labeler)排序所有标记着答案⽤排序答案训练奖励模型采样问题,并列出所有模型和标记者的回答写个⽔獭的故事输⼊奖励模型得到分数和优化参数通过模型⽣成初步回答持续优化参数迭代很久很久以前...ReinforcementLearningfromHumanFeedback往前捋捋GPT-1GPT-2GPT-3InstructGPTchatGPT20182019202020221500w美⾦1750亿参数15亿参数1.17亿参数再往前捋捋GPT-1GPT-2GPT-3InstructGPTchatGPTTransformerBERTRoBERTaXLMALBERTELECTRAT5BARTM2m-100BigBird2017DecoderEncoder《AttentionisAllYouNeed》继续再往前捋捋GPT-1GPTTransformerBERTRoBT5B2017开始CNN卷积神经⽹络RNN循环神经⽹络1990开始-2006突破-2015繁荣继续再往前捋捋机器学习GPT-TransformerBERT52017开始CNN卷积神经⽹络RNN循环神经⽹络1990开始-2006突破1980开始基于规则1950开始发展趋势机器学习Transformer优化⼈脑学习过程关注重点⽽⾮全部神经⽹络基于规则⼿写规则,简单粗暴只能处理⾮常少量数据找到⼀些函数或参数分类固定量数据像⼈脑⼀样学习开始尝试⼤量数据提前标记⼀些数据根据⼤量数据分类学习⼀个复杂的参数集合分类⻩⾖和绿⾖发展趋势Transformer优化⼈脑学习过程关注重点⽽⾮全部神经⽹络像⼈脑⼀样学习提前标记⼀些数据根据⼤量数据分类学习⼀个复杂的参数集合GPT3投喂海量的学习数据ChatGPT⼈对结果的反馈成为学习过程的⼀部分1200万美⾦⽆需分类数据算法数据量+既要聪明,⼜要努⼒算法数据量+ChatGPT:每⾛⼀步都观察⼈类反馈朝着⼈类期望的⽅向进发脑洞思考GPT3量的学习数据⻓的学习过程ChatGPT⼈对结果的反馈成为学习过程的⼀部分00万美⾦?更遥...