资讯频道

资讯视频基金股票

首页世界经济中国经济宏观政策财经时事

首页 > 资讯频道 > 世界经济

逐浪AIGC|谷歌大模型终于迈开大步 Gemini对决GPT-4

时间：2023-12-07 00:00:00来自：21世纪经济报道字号：T T

美国时间12月6日，谷歌正式发布了Gemini大模型。谷歌CEO桑达尔·皮查伊(SundarPichai)称，这是谷歌迄今为止功能最强大、最通用的模型。

距离ChatGPT发布，已经过去一年零一周。伴随着ChatGPT的发布，OpenAI成为了人工智能领域最耀眼的公司，尤其是在大模型领域，它也是其他所有科技公司的追赶目标，其中包括谷歌。

过去八年，谷歌一直把AI-first作为公司战略，2016年打败人类围棋冠军的AlphaGo便是出自谷歌之手。毫不夸张地说，是谷歌掀起的一股AI浪潮，改变了整个AI行业的发展，但现在，它亟需在大模型领域证明自己。

据悉，在Gemini1.0版本中包含三个不同尺寸，分别是GeminiUltra、GeminiPro、GeminiNano。其中，GeminiNano主要应用于设备端，Pixel8Pro将是第一款搭载GeminiNano的智能手机;GeminiPro则适用于在各种任务中扩展，谷歌便计划用GeminiPro来升级旗下的聊天机器人Bard，以及包括搜索、广告、Chrome等在内的更多谷歌产品中。

对于功能最强悍的GeminiUltra，谷歌称目前正在进行信任和安全检查，以及通过微调和基于人类反馈的强化学习(RLHF)进一步完善模型，预计明年初向开发人员和企业客户推出。

桑达尔·皮查伊表示，Gemini的发布，是人工智能发展的一个重要里程碑，也是谷歌新时代的开始。

超越GPT-4?据谷歌DeepMind首席执行官黛米斯·哈萨比斯(DemisHassabis)介绍，Gemini是由谷歌团队从头开始构建的多模态模型，这意味着它可以概括并无缝理解、处理不同类型的信息，包括文本、代码、音频、图像和视频。

在性能测试上，GeminiUltra在32个大语言模型基准测试中的30个中超过了当前最优成绩，另外在MMLU(大规模多任务语言理解)中，GeminiUltra的得分为90%，成为首个超越人类专家的大模型。

据悉，MMLU通过结合数学、物理、历史、法律、医学和伦理学等57个科目，来测试大模型对世界知识和解决问题的能力。此前，GPT-4在该测试中的成绩为86.4%，而人类专家的成绩为89.8%。

而在MMMU基准测试中，GeminiUltra取得了59.4%的最高得分，GPT-4V的成绩为56.8%，该项测试由跨越不同领域的多模态任务组成。

黛米斯·哈萨比斯称，在测试图像基准过程中，GeminiUltra在没有来自图像字符识别(OCR)系统的帮助下，就超越了此前最先进的模型。这些基准测试凸显了Gemini的多模态能力，也展现出其具有更复杂推理能力的早期迹象。

目前，创建多模态模型的标准方法主要是通过训练不同模态的单独组件，然后将它们拼接在一起。但这样操作的结果是，这些模型有时在执行某些任务(如描述图像)方面表现良好，但往往难以处理更复杂的推理。

“我们将Gemini设计为原生多模态，它从一开始就针对不同模态进行了预训练，然后我们使用额外的多模态数据对其进行微调，以进一步提高其效果。”黛米斯·哈萨比斯介绍道，“这帮助Gemini从头开始就能无缝理解和推理各种输入，远远优于现有的多模态模型，而且其能力在几乎所有领域都达到了最先进的水平。”

比如在推理方面，Gemini1.0可以理解复杂的书面和视觉信息，它通过阅读、筛选和理解信息，能够从数十万份文档中提取见解。

另外，Gemini1.0经过训练，可以同时识别和理解文本、图像、音频等，因此它能更好地理解微妙的信息，并能回答涉及复杂主题的问题，比如进行数学和物理等复杂学科的推理。

而在编码方面，Gemini1.0能够理解、解释和生成世界上最流行的编程语言(如Python、Java、C++和Go)的高质量代码。两年前，谷歌曾推出AI代码生成平台AlphaCode，现在在Gemini的助力下，该平台迭代到AlphaCode2，性能也得到大幅提升，可以解决之前几乎两倍数量的问题。

仍在持续优化安全性桑达尔·皮查伊表示，现在已经有数百万人正在使用谷歌产品中的生成式AI，做一年前还做不到的事情，从回答更复杂的问题到使用新工具进行协作和创造。与此同时，开发人员正在使用谷歌的模型和基础架构构建新的生成式AI应用程序，全球的初创公司和企业也正在利用谷歌的AI工具不断成长。

在其看来，这种趋势已经有些令人难以置信，但是，这还仅仅是开始。

“我们正在大胆而负责任地开展这项工作。这意味着我们的研究要有雄心壮志，追求能够为人类和社会带来巨大利益的能力，同时也要建立保障措施，并与政府和专家合作，以应对随着AI变得更加强大而产生的风险。”桑达尔·皮查伊称。

因此在Gemini的开发过程中，谷歌也加强了安全审查工作。黛米斯·哈萨比斯介绍，在谷歌的AI原则和产品安全政策基础上，谷歌团队正为Gemini的多模态能力添加新的保护措施。

不仅如此，黛米斯·哈萨比斯还强调，在开发的每个阶段，谷歌都会考虑潜在风险，并努力测试和减轻它们。

据悉，Gemini具有到目前为止所有谷歌AI模型中最全面的安全评估，包括对偏见和有害信息的评估。同时，为了识别内部评估方法中的盲点，谷歌还在与各种外部专家和团队合作，对Gemini模型在各种问题上进行压力测试。

另外值得关注的是，Gemini的训练是基于谷

分享到

有财经·健谈

有财经·健谈...[详细]

股票市场-基础分析
世界上任何股票市场都充满了风险和机会，吸引着不同国家、不同信仰、不同肤色...[详细]
股票市场-技术分析
在股票市场中，通过对反映市场状况的资料(例如成交价、成交量或成交金额)进行分析...[详细]
股票市场-证券投资基金
投资与投机的融合是证券交易之神韵所在，在“胜者为王”的背后蕴藏着鲜为人知的玄机...[详细]

本站郑重声明：所载数据、文章仅供参考，使用前请核实，风险自负。

本站由北京济安金信科技有限公司提供技术支持

有财经·健谈

股票市场-基础分析

股票市场-技术分析

股票市场-证券投资基金