本期《产业新股》关注的IPO企业为:北京海天瑞声科技股份有限公司,申请上市地为上交所科创板,保荐机构为华泰联合证券。海天瑞声本次拟公开发行股数不超过1070万股,不低于发行后总股本的25%。贺琳直接持有27.01%的股份,间接持有15.43%的股份,合计控制海天瑞声42.44%的股份,为海天瑞声控股股东、实际控制人。
卡位产业链上游领域多样化应用场景带来广阔市场空间
海天瑞声成立于2005年,主营业务为AI训练数据的研发设计、生产及销售,业务类型包括训练数据定制服务、训练数据产品及训练数据相关的应用服务三大板块,形成了覆盖多领域、多场景、多语种的产品和服务体系。目前海天瑞声客户累计数量超400家,覆盖了主要的大型科技公司、人工智能企业及科研机构。根据艾瑞咨询发布的《2020年中国AI基础数据服务行业研究报告》,2019年,海天瑞声市场份额位居行业前五,在中国AI语音类基础数据服务领域企业中营收份额占比排名第一。
从产业链结构来看,海天瑞声所在细分行业为“人工智能基础数据服务业”,处于人工智能产业链上游位置。而从技术角度来看,人工智能产业链可划分为基础层、技术层、应用层。海天瑞声处于基础层、主要为人工智能产业链中处于应用层及技术层的机构/企业提供数据资源及相关服务。
数据是人工智能行业发展的三大核心要素之一。根据DimensionalResearch的全球调研报告,高质量、结构化、大规模的训练数据可以大大提高人工智能技术的研发效率,优化机器学习效果。随着人工智能的快速发展,未来AI行业对数据尤其是高质量的训练数据需求日益增多。根据艾瑞咨询的调研报告,2019年中国AI基础数据服务行业的市场规模达到30.9亿元,预计2025年市场规模将突破100亿元,复合年增长率达到21.8%。
从全球来看,受益于深度学习算法、计算机视觉、自然语言处理以及大数据等关键技术的突破和资本市场的积极参与,全球人工智能产业迎来爆发式增长。IDC数据显示,2019年,全球人工智能产业规模达到375亿美元,预计2023年全球人工智能市场规模将达到979亿美元,年复合增长率为27.11%。整体而言,行业整体仍处于低集中竞争阶段,行业活力充足,发展空间较大。
训练数据定制服务及产品贡献超98%的营收综合毛利率高企
经营方面,报告期内海天瑞声的营收与归母净利润整体呈现稳步增长的态势,营业收入年均复合增长率为41.25%,归母净利润年均复合增长率为54.73%。从营收构成来看,海天瑞声的营收主要由训练数据定制服务、训练数据产品及训练数据相关的应用服务构成,2019年三者的营收占比分别为59.91%、38.63%、1.46%。从境内外收入结构来看,2017年至2019年,海天瑞声境外收入占比分别为29.06%、31%和49.6%
此外,海天瑞声预计2020年上半年实现营业收入约0.92亿元至1.1亿元,同比变动约-8.93%至9.28%;预计实现归母净利润0.35亿元至0.42亿元,同比变动约-8.25%至10.10%;预计实现扣非归母净利润0.31亿元至0.37亿元,同比变动约-14.25%至2.9%。换句话说,今年上半年海天瑞声业绩可能出现负增长。
招股书披露,期内海天瑞声综合毛利率分别为72.26%、64.77%、70.25%,其中训练数据产品所发生的支出在当期全部计入研发费用,无相应的营业成本,毛利率为100%,训练数据相关的应用服务由于收入规模较小,对公司综合毛利率水平不构成实质性影响,因此公司综合毛利率主要取决于训练数据定制服务的毛利率水平以及公司主营业务收入在服务和产品上的结构性变动。
从竞争对手来看,目前AI基础数据服务行业中的国内品牌数据服务商主要有慧听科技、标贝科技等,国外企业主要有Appen等。其中慧听科技、标贝科技未公开披露其财务数据信息,Appen为澳大利亚上市公司。
与Appen相比,海天瑞声在营收规模、净利润规模、员工数量等指标上小于Appen,在体量上具备一定劣势。但海天瑞声的综合毛利率高于Appen,主要系其业务方向主要集中在毛利率较高的领域。同时,我国境内人工成本相比海外较低,也一定程度上拉高了海天瑞声的毛利率。
募资达7.66亿元主要用于产品扩充和技术升级
研发方面,截至2019年12月31日,海天瑞声拥有研发人员39名,占员工总数的27.46%;技术人员60名,占比42.25%。截至目前,海天瑞声拥有12项发明专利及1项实用新型专利授权,115项计算机软件著作权,另有13项专利已提交申请。
研发投入方面,据招股书披露,2017年、2018年及2019年海天瑞声研发费用分别为2527.99万元、2734.53万元及4169.61万元,呈逐年上升趋势,研发费用占营业收入的比重呈现先降后升的态势。
募集资金方面,海天瑞声本次公开发行拟融资7.66亿元,主要用于自主研发数据产品扩建项目(2.49亿元)、一体化数据处理技术支撑平台升级项目(2.51亿元)、研发中心升级建设项目(1.66亿元)、以及补充流动资金(1亿元)。其中,自主研发数据产品扩建项目计划新开发151个自有知识产权的训练数据产品,分别覆盖智能语音领域(80个)、计算机视觉领域(22个)和发音词典领域(49个)。
风险提示:由于人工智能行业整体发展较为迅速