海天瑞声登陆科创板 聚焦训练数据集推动AI产业落地
时间:2021-07-26 00:00:00来自:证券时报字号:T  T

投资要点:

1.AI训练数据领头羊,业绩增长快速,盈利能力强劲。公司长期专注于训练数据的研发生产,已成为国内AI基础数据行业领先者,尤其在语音类市场市占率排名第一。2017年至2020年,营业收入年均复合增长率超过25%,且销售毛利率保持在65%及以上。

2.技术实力强劲,紧握优质客户资源。公司拥有760多个自有知识产权的训练数据集产品,具备多场景、多语言覆盖能力,积累了丰富的多语种语言学家团队,并与下游的阿里巴巴、腾讯、百度、微软等客户形成了稳定合作关系。

3.人工智能市场持续增长,推动训练数据行业成长。“十四五”规划将人工智能提升至国家战略层面,随着政策落地、技术突破和产业融合,我国人工智能步入黄金发展期。同时,IDC预测未来几年我国AI产业规模年复合增长率可达到30%,将拉动上游训练数据需求不断增长。

近年来,人工智能的发展得到了巨大的进步,深刻改变着各行各业,渗透到人们的日常生活中。数据作为人工智能发展的重要元素,从本质上决定了人工智能的进化水平,优质、丰富的训练数据对人工智能技术的发展至关重要。

经过多年深耕,海天瑞声(688787.SH)已成为中国AI基础数据服务行业的头部企业。公司所提供的训练数据覆盖智能语音、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。如今,海天瑞声科创板IPO已经通过证监会注册,即将挂牌上市。

AI持续高增长,海天瑞声领跑训练数据赛道

随着数据、云计算、物联网等技术的发展,人工智能领域相关技术的产业化进程开启,产业规模快速增长。根据国际数据公司(IDC)的数据,2020年中国人工智能产业规模将达到62.70亿美元,预计2024年将达172.16亿美元,年复合增长率达到30.40%。

训练数据资源是机器学习的基本素材,应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长。艾瑞咨询的研究报告显示,2019年中国基础数据服务行业的市场规模达到30.9亿元,预计2025年将突破100亿元,复合年增长率达到21.8%。

海天瑞声成立于2005年,始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。2017年至2020年,海天瑞声的营业收入从1.19亿元增长至2.33亿元,年均复合增长率达25.15%。其中,训练数据定制服务和训练数据产品是主要收入来源,从2020年数据来看,二者占总营业收入的比例分别为50.26%、45.48%。不仅如此,这两类业务均表现出较强的盈利能力,带动公司总体盈利水平的提高。2020年公司综合毛利率水平为67.70%,净利率达到了35.17%。

凭借丰富的技术积累和行业经验,公司提供的训练数据产品及相关服务已覆盖三大技术领域、多个语种/方言和多项应用场景,赢得了阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、商汤科技、中国科学院、清华大学等众多大型优质客户的认可,核心技术、产品资源、优质客户等竞争优势逐步凸显。

公司在行业内占据领先地位,根据艾瑞咨询发布的《2020年中国AI基础数据服务行业研究报告》,2019年海天瑞声在国内基础数据服务行业以约8%的市场份额位列第二;同时,公司牢牢掌握着中国语音类基础数据服务这个细分市场,营收份额占比排名第一。

产品布局完善,研发创新打造核心竞争力

由于人工智能技术在场景中应用不断深化,单一技术实现的技术闭环难以满足复杂场景下的智能化需求,客户对于智能算法的能力要求也在持续升高。海天瑞声始终秉承基础研究与实际应用紧密结合的原则,持续开展基础研发等研究创新工作。

技术研发有赖于公司长期经验积累、人才储备。公司高管及核心人员大多毕业于清华、北大、中科大、复旦等一流院校,大部分曾在微软、阿里巴巴、英特尔、IBM、中科院等业内领先成熟企业与研究机构,并担任人工智能领域技术研发与管理的领导职务。高素质的技术团队形成公司强大的研发与服务优势。

近年来公司不断加大研发投入,2018年、2019年及2020年公司研发费用分别为2734.53万元、4169.61万元及4349.75万元,呈逐年上升趋势。这三年时间里,公司累计研发投入达到11253.89万元,累计研发投入占收入比重为16.96%。

公司的科技成果转化效益明显。截至目前,公司已取得26项专利授权(其中24项为发明专利,1项为实用新型专利、1项为外观设计专利)、拥有134项计算机软件著作权,另有2项专利已提交申请且已经受理,处于行业领先地位。

通过集中优势力量、定向攻关,海天瑞声建设完成了760多个自有知识产权的AI训练数据集,并向下游客户提供了累计超3600次/个训练数据定制服务或训练数据产品,产品和服务线可支持全球超过160个语种和方言,构建了全球领先的独具特色的人工智能训练数据资源集群。

值得一提的是,公司基于自身近十六年数据服务经验,并融合了数十项核心技术及专利,打造了一体化数据处理平台。平台内上千个自研标注工具联合打通,不仅可以用来处理复杂的交叉业务场景数据,更重要的是保证了数据从采集到脱敏、清洗、标注、质检等全流程不出平台即可完成,构

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持