90%的人类败北!你能代表人类考赢ChatGPT-4吗?
时间:2023-03-17 00:00:00来自:财经网字号:T  T

3月15日,美国当地时间周二,人工智能研究公司OpenAI发布了新一代大型语言模型GPT-4,这是支持ChatGPT和新必应等应用程序的最新AI大型语言模型。

在功能上,GPT-4主要实现了几个方面的提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图能力,但目前只限内部测试;更长的上下文,文字输入限制提升至2.5万字;回答准确性显著提高,更安全,有害信息更少。

据了解,已经订阅了ChatGPTPlus的用户将直接获得GPT-4的访问权限;开发者访问GPT-4API需要加入OpenAI的候补名单。

功能实现多方面提升

OpenAI在当天的声明中称,GPT-4的诞生,是OpenAI在放大深度学习方面努力的最新里程碑。尽管GPT-4在许多真实世界场景中的能力依然不如人类,但在许多专业和学术标准领域,已经达到了人类的水准。

OpenAI称,GPT-4与上一代GPT-3.5相比,在日常的对话中所体现出的差别并不大,但是在各项标准化考试中,GPT-4的表现明显优于上一代,它的得分高于88%的应试者。例如,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,相比之下,GPT-3.5的得分在倒数10%左右;在美国高校入学考试(SAT)阅读考试中排名前7%左右,数学考试中排名前11%左右。

据官方介绍,GPT-4是一个多模态大型语言模型,即支持图像和文本输入,以文本形式输出;扩写能力增强,能处理超过25000个单词的文本;更具创造力,并且能够处理更细微的指令。

具体来看,GPT-4的创造性和协作性表现为它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

其次,GPT-4能处理长达25000字的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等。例如,大部分时候,用户只需要丢给它一个链接,后者就可以总结出其中的内容,而GPT-3.5只能分析一小段。

据科创板日报消息,有网友测试GPT-4能力时发现,其不仅可以有条理地分析柱状图并回答图形背后的统计学意义,而且即便用户只是在餐巾纸上画了个简单界面,GPT-4就能直接搞出一个可运行的网站。

此外,GPT-4还可以接受文字和图像输入,输出文字。

OpenAI演示了向GPT-4输入一张鸡蛋、面粉的图片,提出“用图片中的东西可以做出什么?”的问题,GPT-4的回复是:“用这些食材,可以做出许多不同的食物”,并列举出煎蛋卷、煎饼、华夫饼等一系列结果。这意味着GPT-4融合了图片识别的能力,并且通过对所识别图片的理解,结合了自身的逻辑能力,给出合理的解答。

仍会提供错误答案

OpenAI高管们表示,GPT-4跨文本和图像的“多模式”使其在“高级推理能力”方面远超过ChatGPT,但由于担心功能被滥用,公司推迟发布GPT-4的图像描述功能,GPT-4支持的ChatGPTPlus服务订阅用户也只能用文本功能。

OpenAI政策研究员桑迪尼·阿加瓦尔(SandhiniAgarwal)称,公司之所以还没发布这一功能,是为了更好地了解潜在风险;OpenAI发言人尼科·费利克斯(NikoFelix)则表示,OpenAI正计划“实施保障措施,防止图像中的个人信息被识别”。

人工智能语言模型经常会提供错误答案,而且这些模型在使用网络上的信息和图像接受训练时,也学会了模仿人类偏见。OpenAI方面承认,GPT-4仍会有“产生幻觉”、出现无稽之谈、延续社会偏见,以及提供糟糕建议等惯常错误。

OpenAI研究人员在一份技术报告中写道,“随着GPT-4和类似的人工智能系统被广泛采纳”,它们“会强化固有见解”。

OpenAI前研究员、开源人工智能公司HuggingFace政策总监艾琳·索莱曼(IreneSolaiman)认为,这种技术进展的速度需要全社会对潜在问题及时做出反应。

“作为社会一员,我们已经可以在一些不应该由模型造成的危害方面达成广泛共识,但许多伤害是微妙的,主要影响的是少数群体。”她补充说,那些有害的偏见“不能成为人工智能性能的次要考虑因素。”

“科学家正尝试运用一些技术手段避免这些具有潜在风险的事件发生。”G20青年企业家联盟中国理事会青年委员杜雨在接受媒体采访时表示,通过改善数据集,增加更多的限制性条件以及对模型进行微调,可以使得人工智能减少对于有害内容的学习,从而降低人工智能本身的危险性。甚至我们可以“教会”人工智能如何更尊重他人,减少判断当中的偏见,更好地和人类相处。借鉴强化学习思想(RLHF)方法就是减少人工智能生成危害性内容的典型措施,ChatGPT就是采用这种方式训练的。

数据学习对中国企业是巨大挑战

GPT-4新模型将提供给ChatGPT的付费用户,也将作为API的一部分提供,允许程序员将AI集成到他们的应用程序中。OpenAI将对750字左右的指令信息收费3美分,对750字左右的响应信息收费6美分。

OpenAI介绍称,摩根士丹利正在使用GPT-4来组织数据,电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。OpenAI合作伙伴微软方面表示,必应的AI聊天机器人使用GPT-4模型。

网易科技报道称,按照OpenAI工程师们的说法,GPT-4的训练在去年8月就已经完成,剩下的时间都在进行微调提升,以及最重要的

本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持