【张锡寒推荐必看】万字科普ChatGPT为何会颠覆人类社会，包含训练逻辑@YJango

视频是关于GPT的底层原理和未来影响。将抛开技术细节，少用专业名词，在整体功能上讲解 ChatGPT 的「工作原理」「制造过程」「涌现的能力」「未来的影响」以及「如何应对」：

1、ChatGPT是如何回答问题的

2、它是怎么被制造的，为什么它不是搜索引擎

3、它有哪些惊人能力，为什么它不只是聊天机器人

4、它将给社会带来什么样的冲击

5、我们该如何维持未来的竞争力

在这个信息爆炸的时代，我们对于人工智能的需求与日俱增。聊天机器人Chat GPT作为一种生成语言模型，正在引起越来越多的关注。然而，有些人认为Chat GPT过于机械化，缺乏创新性，就像观众批评好莱坞电影的模式化一样。我们希望能够培养一个能够超越模板、符合人类对话模式和价值取向的创新Chat GPT。那么，如何在保持人类对话模式和价值取向的前提下提高Chat GPT的创新性能呢？

我们可以从鹦鹉的训练中联想到一些方法。当我们教会鹦鹉一些基本对话后，它们就可以自由发挥。有时候，鹦鹉会说出一些非常有趣的话语，给人带来欢乐。这是因为我们给予了它们奖励，强化了它们在有趣方向上的行为。我们可以借鉴这种方法，在Chat GPT的第三阶段进行训练。

在这一阶段，我们不再要求Chat GPT按照我们提供的对话范例做单字接龙，而是直接向它提问，让它自由回答。如果回答妙趣横生，我们给予奖励；如果回答平淡无奇，我们降低奖励。然后，利用这些人类评分去调整Chat GPT的模型。在这种训练中，我们既不会用现有的模板来限制它的表现，又可以引导它创造出符合人类认可的回答。我将这一阶段称为"创意引导"。

通过经历"开卷有益"、"模板规范"和"创意引导"三个阶段的训练，我们得到了一个具备创新能力的生成语言模型，即Chat GPT。这三个阶段分别是无监督学习、监督学习和强化学习。可以说，Chat GPT综合运用了机器学习的几种训练模式。

在"开卷有益"阶段，Chat GPT通过对海量互联网文本的单字接龙，扩充了模型的词汇量、语言知识和世界信息与知识。它从一个哑巴鹦鹉变成了一个脑容量超级大、懂王鹦鹉。

"模板规范"阶段，让Chat GPT通过对优质对话范例的单词接龙，规范了回答的对话模式和内容。这使得Chat GPT成为了一个懂规矩的博学鹦鹉。

"创意引导"阶段，Chat GPT根据人类对其生成答案的好坏评分来调整模型，从而引导它生成符合人类认可的创意回答。这使得Chat GPT既懂规矩，又能够试探和创造。

此外，当单字兼容模型的规模达到一定程度后，它就会具备理解指令和理解粒子思维链的能力，更加智能和灵活。

通过这样的训练，我们期望培养出聪明又有创意的Chat GPT，为人们提供更加个性化、有趣且富有创意的对话体验。在未来，Chat GPT将继续发展，成为人工智能领域的重要一员，为我们的生活带来更多惊喜与便利。

THE END

分享是一种美德，转载请保留原链接。

【张锡寒推荐必看】万字科普ChatGPT为何会颠覆人类社会，包含训练逻辑@YJango

发表回复取消回复

发现沙发条评论

归档

分类

【张锡寒推荐必看】万字科普ChatGPT为何会颠覆人类社会，包含训练逻辑@YJango

发表回复 取消回复

发现沙发条评论

归档

分类

发表回复取消回复