Starburst在数据网格上加倍下注,赢得新一轮融资

2022-10-13 19:18来源:大国新闻网

Starburst数据本周宣布,其融资已翻倍多,本周宣布进行2.5亿美元的D轮融资,并为其分布式query引擎开通了一个新的前端门户。该公司声称,这大约是其此前估值的三倍,此前公布的数据相互矛盾(此处和此处)。这些公告是与该公司的年度在线活动Datanova一起发布的。

进入2022年,该公司将继续在数据网格方面加大投入。该公司的主页将自己标榜为“数据网格的分析引擎”。关于这一点,我们稍后会有更多的讨论。

本周在Datanova上,它宣布了一个扩展,为其基于trino的分布式查询引擎添加了一个类似目录的门户前端。在管理端,该门户使数据生产者和数据工程师能够定义元数据,跟踪使用情况,并应用基于角色的访问和授权。在终端用户端,他们可以使用门户来发现、浏览和添加数据集的审查。虽然是“精简版”意义上的数据目录,但它并不意味着要取代企业数据目录。作为一个打包了自己查询引擎的轻量级目录,Starburst仍然继续支持与Alation和Collibra的集成。

在路线图上,Starburst正在加大对新兴开源数据表格式的支持力度,包括Delta Lake和Iceberg, Delta Lake的支持将进一步推进。

有了新的资金,Starburst今年的一个关键主题是全球扩张,特别是在进入市场方面;虽然目前它在北美和欧洲有地盘,但今年标志着它将在亚太地区开店。为了强调这一点,它的云服务银河(Galaxy两个月前才在AWS、Azure和谷歌cloud上加入GA)将加入阿里巴巴。Starburst也在强调与红帽的合作,双方都是在私有云上,并得到红帽OpenShift Dedicated的支持,后者是红帽在AWS和谷歌cloud上管理的服务。Starburst在OpenShift上获得认证,可在红帽市场上使用,是红帽OpenShift数据科学云服务中仅有的4个isv之一。此外,与全球系统集成商的接触也在不断增加。

Starburst Enterprise作为HPE Ezmeral Runtime的分布式查询引擎也可在HPE Marketplace上使用,两家公司很快将开始在北美和欧洲联合上市。但是,郑重声明,Starburst的竞争对手Ahana也是如此,其管理团队的一部分与来自MapR的Ezmeral产品团队的一部分有着共同的根源。

Starburst目前仍处于增长呈几何级数的早期阶段;过去三年,其业务每年增长三倍。其中最引人注目的是最近推出的托管云服务Starburst Galaxy;去年年底才发布的云SaaS业务,在营收数据中还没有明显表现出来。虽然Starburst并不打算放弃本地或自我管理的客户,转而支持Starburst的企业业务,但有一个小秘密是,该公司预计未来的增长主要来自云SaaS服务。

这也是管理团队的重要新成员——首席营收官哈维尔·莫利纳(Javier Molina)将发挥关键作用的地方。此前,Atlas SaaS服务是MongoDB全球销售的高级副总裁。近6年前推出的Atlas,如今已占MongoDB营收的一半以上。Molina吸取的一个关键教训是,Atlas并不是一夜之间爆炸式增长的。直到收购了增加自助上机功能的mLab后,Atlas才走上了现在的轨道。由于Starburst Galaxy在两个月前刚刚推出,可以预见的是,它将会非常强调自助服务,让客户可以按需消费,而无需繁琐的年度合同。

显然,Starburst正在通过将分布式查询定位为构建数据产品的关键一环,从而摆脱关于谁拥有开源查询引擎的琐碎人心份额之争。分布式查询是其Trino技术的核心。而构建数据产品是Starburst拥抱数据网格的核心。他们正在大力推广它,以至于数据网格已经成为公司的口号。他们也是访问Zhamak Dehghani(当前数据网格概念的作者)即将出版的书的概要草案章节的来源。

通过标榜自己为“数据网格的分析引擎”,Starburst正在走钢丝,因为数据网格并不是一项技术;它是一套最佳实践和架构设计模式,用于将数据集的生命周期控制本地化,这些数据集将被视为产品。所以,不,Starburst并没有把Starburst Enterprise或Galaxy称为数据网格解决方案本身。但两者的区别是相当微妙的。

当然,工具和技术对于支持数据网格的各种任务是必不可少的。而且,还有许多任务的规模将超过人类,从管理和自动化数据摄取、数据管道、数据质量,以及验证数据是可信的、有效的和最新的。显然,人类驱动着这个过程,但技术会衡量他们的努力。

开门见山:星爆企业号或银河号只是数据网格拼图的一块。但数据网格只是“星爆”拼图的一块。让我们解释一下。

正如我们已经说过的(这里和这里),我们预计今年,数据网格将首次受到严肃的审查和反弹。这其实是一件好事。对于任何正在接受严格审查的技术实践来说,这都是意料之中的事。虽然有些组织会宣称一夜之间就取得了胜利,但数据网格永远是一个过程,并不是所有的组织都将接受这些实践。

分布式查询将是任何数据驱动的组织执行的关键部分,无论他们是否采用数据网格实践。虽然Starburst在指出分布式查询的作用及其与治理的挂钩方面肯定是有目标的,但对Starburst来说,将其信息普遍化,而不是被数据网格捆绑在一起是有意义的。这就是与数据结构的协同作用可以开始的地方。

多讯网声明:未经许可,不得转载。
汽车
地球与环境