OpenAI最近发布了聊天机器人模型ChatGPT,该模型迅速在整个网络上传播。它以对话的方式互动。以更人性化的对话方式与用户交互,回答问题,承认错误,质疑不正确的前提,拒绝不恰当的请求。高质量的回答和令人上瘾的互动体验,圈内圈外都惊呼不已。
为什么会有这么高的评价。的理论支撑是什么。背后的技术原理是什么。需要解决的问题和解决方案是什么。资如何看待这件事。文的目标就是要向大家详细解释这些问题。
1 什么是ChatGPT。
ChatGPT本质上是一种应用于对话场景的语言模型,通过对人类反馈的强化学习,在GPT3.5的基础上进行微调,能够回答后续问题,承认错误,质疑不正确的前提,拒绝不适当的请求。首先,让我们的主角ChatGPT介绍一下自己。
1.1 让ChatGPT自我介绍一下。
什么是ChatGPT。既然ChatGPT是一种语言模型,那么什么是语言模型呢?通过强化学习训练,什么是强化学习。
1.2在全球范围内兴起和爆发。
OpenAI于11月30日发布,在北美和欧洲引发了热烈讨论。然后它开始在国内着火。世界各地的用户都争先恐后地发布他们与ChatGPT通信的高度创造性的结果。ChatGPT在众多网友的疯狂测试中表现出了各种惊人的能力,如流利的回答、写代码、写脚本、纠错等,甚至让记者、编辑、程序员等从业者感到威胁,更不用说它将取代谷歌搜索引擎。在AlphaGo击败李世石和人工智能绘画走红之后,ChatGPT成为另一个新的网络红人。下面是谷歌全球指数,我们可以看到它的受欢迎程度。
对比中国的主要平台,微信是最先流行起来的。从微信指数可以看出,97.48%来自公众号,从科技圈起步,迅速扩展到投资圈。我第一次了解到ChatGPT的相关信息是在我关注的科技公众号上,然后我在各大官方账号上看到了各种令人震惊的关键词。地震,杀人疯狂,毁灭人类,等等。然后各行各业的人都参加了有趣的活动,问数学问题,问历史,写小说,写日报,写代码找虫子……
1.3 OpenAI,它背后的资助者。
OpenAI是一个人工智能研究实验室,旨在促进和开发友好的人工智能,造福于全人类。OpenAI原本是一家非营利组织,但为了更好地实现产学研融合,于2019年3月成立了OpenAI LP的子公司,以营利为目的。
2019年7月,微软和投资方将携手合作。2020年6月,GPT-3语言模型的发布,刷新了人们对人工智能的认识。GPT系列语言模型让我们期待通用人工智能(Alamos Gold)的出现。
OpenAI的目标从一开始就雄心勃勃,解决一般的人工智能问题,主要涉及强化学习和生成模型。
强化学习最早被认为是实现人类一般智能的重要手段。DeepMind在2016年开发的AlphaGo Zero利用强化学习训练,使人类围棋的历史经验变为“零”,标志着向通用人工智能迈出了重要一步。一步。2019年,OpenAI在“Dota2”比赛中击败了人类世界冠军。OpenAI对强化学习有很多深入的研究。Dactyl也是一个机器人手,OpenAI可以用来训练强化学习,以高精度操作对象。OpenAI健身房是一个开发和比较强化学习算法的工具包,所以ChatGPT使用强化学习也是理所当然的事情。
在生成模型方面,我们熟悉GPT-3,它是一个强大的语言模型,可以生成类似人类的流利语言。Dell E2是最近很火的一款人工智能绘画,它可以根据文本描述生成图片。Codex通过与微软合作的github代码进行培训。它可以生成代码和调试,并已商业化。
OpenAI前创始人埃隆·马斯克也对ChatGPT发表了评论。
看看ChatGPT如何介绍他们的公司。
2 ChatGPT一些有趣的经验。
作为一个聊天机器人,我们发现它在连贯的问答中比传统机器人更流畅、更自然。微信上已经有很多小程序可以体验,或者直接说连接微信的ChatGPT,让我们一起来体验一下已经连接到企业微信的小程序。
1) 公司一直注重价值观。第一个问题不再符合公司的价值观。公司规定,应尽快归还。在特殊情况下,无论值多少,都需要申报,所以ChatGPT应该不能加入我们公司。第二个经典问题的答案很符合公司诚信的价值观,哈哈。
2)总有人在公司协会的活动中放鸽子。让我问问ChatGPT这些人是什么心态。看到帮助思考的原因和放鸽子的人说的一样,我有点怀疑他们的心态。
3) 工作场所工具人们看他们是否可以通过ChatGPT来做,你可以看到文案还是不错的。这个大纲的答案有一点小问题但不影响大局。讲故事,写剧本也不错。第一,帮中国足球写了参加世界杯的文案,但不知道能不能用。
4)你身边的同事都非常重视孩子的教育,所以我们先从宝宝入手,看看ChatGPT能不能带宝宝去学习。常识题答对了,数学题的推理能力,我很担心宝宝会过不了初中升学考试,但是家长会检查一下。同时,我也查了他是怎么做脑筋急转弯的,傻子也没做对。
5) 它被称为可以编写代码和修复bug的编程工件。用中等难度检查Leetcode是没有问题的。虽然是自嘲也不懂编程,但是根据测试和网友们的验证能力,真的很强。
6)查互联网知识储备,挑战失败。正如ChatGPT自己所说,他还有很多局限性,比如给出看似没问题的离谱的答案,比如用个人感受回答自己公司的结果,把竞争对手DeepMind的AlphaGo功劳据为己有。
做一个总结,网上其实有很多有趣的案例,这里篇幅有限,只简单列举几个。通过网友的经验和反馈,ChatGPT确实掌握了一些知识体系和答题技巧。我们已经看到,与传统的聊天机器人相比,ChatGPT在连贯的问答上更加流畅自然,能够捕捉任何单词。除了好玩的聊天神器,还有很多实用价值,比如回答专业概念、编程问题、日常邮件、写请假条、广告文案等,都可以通过ChatGPT完成。在阅读了这些有趣的案例之后,接下来我们将解释ChatGPT的技术原理。