l$ R7 y/ u! N( X8 D$ b c对数据更加关注的结果是,数据管理业务已经成为基础设施增长最快的领域之一,据估计价值超过700亿美元,占2021年所有企业基础设施支出的五分之一以上。这个市场形成的美妙之处在于,它结合了软件工程、分析和人工智能领域,同时借助云计算的潮流势头。+ x% x+ r d; o q. g: ^* j K
+ h" {; f9 E3 _% F2 [在过去的几年里,数据产业的增长也催生了一些最令人兴奋和最有影响力的企业软件公司。最近上市的巨头,如Snowflake和Confluent已经改变了数以千计的企业运作方式和数以百万计的产品构建。然而,大多数人都不太熟悉那些有影响力的,下一代定义类别的公司。 U" w- H/ O# [! k& W. P, U D. O, w7 f# {* W
在创纪录的2021年,数据公司获得了数百亿的风险投资,2022年的风险投资也已经很强劲。我们编制了首批数据50强名单。这些是数据领域的领头羊公司。这50家公司的总市值超过1000亿美元,总共筹集了约145亿美元的资金,其中20家在2021年达到独角兽地位。 7 R3 \( L9 n6 b0 s* j9 w, P2 C( N% V3 m1 D0 m- C" B
言归正传,我们很高兴地介绍2022年的数据50强。' z+ @* d! f, u9 ?
9 j3 s9 `) w( M% o
8 O9 u& y2 R# N& Q1 C( n- H" I( W. p- T$ P _) c
, U) O) J9 X( A# J2 N# T+ I
( B' Y; Z$ Z- n% L8 q% A4 W 5 h, `; U. e5 D 5 ]. y5 ?/ l9 u. w- ?. N这些公司是在2008年之后成立的,在过去两年中已经筹集了新的资金,并且他们的员工人数每年至少增长30%。他们的产品是为各行业的数据或数据应用团队服务的水平技术。 9 K: h3 P5 g3 m6 s( y, [4 q- K% V# B( W3 a# y+ `+ A* B
排名综合考虑了最近的估值、公司规模、过去两年的员工增长、过去几年的运营情况以及当前的收入规模。员工数据基于LinkedIn公开提供的数据。融资数据基于Pitchbook和Crunchbase的公开数据,截至2022年3月22日。- j0 i+ W. ]3 h" g0 G8 t
3 K# O, b% {( X7 A7 K" M" V( h
请注意,这份名单不包括交易型数据库公司,如CockroachDB、PlanetScale和Yugabyte,因为这些技术的数据本身就是交易性的,而不是分析性的。 ' O+ z1 P3 z5 ` @ Q7 y + \+ a' A: @ x* \ i6 [' l我们将Data50分解为7个子类别。 % R% J+ R& b& O 0 T3 ?. \2 n- B5 o( t查询和处理技术是访问、聚合和计算数据的核心引擎。它涉及两大类:批处理(如Databricks和Starburst)和实时处理(如ClickHouse和Imply)。在过去的几年里,由于对实时应用的需求不断增加,后者得到了越来越多的关注。 Y; [( E2 G5 y* @
& P8 ]% Q. M5 D! R
AI/ML(人工智能和机器学习)包括应用算法建模和机器学**规模数据的软件。从上榜公司的数量来看,这一领域正在成熟和繁荣。一些公司专注于特定类型的数据(如Rasa和Hugging Face的自然语言),而其他公司则专注于不同的领域,如人工智能的产品化(如Scale、Tecton和Weights and Biases)或充当运行人工智能工作负载的 "计算层"(如Anyscale)。7 j ]! ?% n1 R# @5 L# I( D