计算机专题报告:月之暗面:长文本能力点亮国产大模型发展之路
时间:2024-03-25 00:00:00来自:长江证券字号:T  T

月之暗面:国产AI角兽

月之暗面迅猛发展已成为国内大模型领域的领军企业之一。公司创始人杨植麟师从中美各路AI大拿,学术成果颇丰,在大模型长文本识别问题曾做出重要研究成果,并深度参与了多个国产大模型的研发工作,是中国大模型产业的业界领袖之一。杨植麟在创立月之暗面之前,已积累了一定创业经验,后又联合其清华校友,共同打造国产“OpenAI”——月之暗面,目前被资本市场看好,已成为AI独角兽。

KimiChat:长文本技术世界领先

技术迭代助力性能跃升,KimiChat长文本处理能力优秀。作为月之暗面旗下核心产品,KimiChat以对话交互方式为C端用户提供服务,主要应用场景包括文本提炼、信息检索、数据处理、模拟交流等。KimiChat以长文本处理技术著称,同时具备优秀的联网搜索与指令遵循能力。1)在长文本能力方面,当前KimiChat长文本处理能力达200万字,性能较半年前提升9倍,对应约133万Tokens,已超越Gemini1.5Pro(100万Tokens)、Claude3(20万Tokens)以及GPT-4Turbo(12.8万Tokens),为全球领先水平。2)在模型性能方面,Kimichat表现与GPT4接近,在学术论文总结、人物观点搜索、PDF文件解析等任务环节,显示出较好的文本处理能力与交互效果。3)在定价方面,上下文处理能力最强的moonshot-v1-128k每百万tokens的计价为60元,低于相同文本处理水平下的其他模型(GLM4与GPT4Turbo)。

如何看待KIMI的长文本能力跃升?

KIMI长文本能力特质体现了我国基础模型能力的跃升。大模型的开发团队会在确保模型性能的前提下设定一个最大上下文窗口大小,窗口大小决定了模型在一次前向传播中能够处理的最大文本长度。本次KIMI实现了长文本能力的突破代表了公司在模型架构、内存管理、注意力机制优化等层面有深厚的技术积累。KIMI模型的losslesslong-context机制使得模型在推理阶段能够结合丰富的Prompt内容,避免“断章取义”,使得推理更加准确。此外,长文本处理能力使KIMI能够直接处理大型文件Prompt,适用于复杂和需要大量文本分析的B端重应用场景,如办公、医疗、教育等垂类场景。相比C端轻应用场景,重应用场景用户留存率较高,付费意愿更为强烈。因此长文本能力或成为KIMI等大模型货币化之路的核心要点之一。KIMI的losslesslong-context机制或可以取代模型调参,催生个性化模型的诞生。KIMI模型提升了推理阶段用户数据的权重,模型可以根据用户的行为进行反馈,因此建立了数据飞轮效应。从长期角度来看,losslesslong-context机制在未来有望取代模型的调参步骤,用户可以根据与模型长期互动建立个性化的模型。

风险提示

1、AI模型技术推进不及预期。

2、AI模型下游需求不及预期。

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持