新闻动态
News
2021-02-04 1718
随着万亿级数据时代到来,如何在海量数据中灵活地检索、统计和分析,充分挖掘数据价值,是摆在大数据行业从业者面前的一道难题,也是一个新的机会。
据IDC报告,2018年全球数据总量为32ZB,到2025年将增至175ZB。信息量的爆发式增长,市场对数据库服务的需求也在不断提升。相应地,国内数据库市场持续向好,其在2019年的市场规模达到133.4亿元,预测未来3年还将保持15%左右的高速增长态势。
在可预见的市场前景下,有一批怀揣着技术和理想的行业从业者循势登上了舞台,孙雪平带领的创业团队就是其中的典型代表。
彼时,市面上能同时兼顾海量数据实时检索与分析的产品还很少。“业内不乏有多年大数据行业经验的团队,但能真正沉下来专注底层研发的企业不多。”而孙雪平的团队恰好具备底层技术特质,便顺势于2018年注册成立了南京录信软件技术有限公司(以下简称“录信数软”)。
大数据时代下的国产数据库
录信数软致力于研发大数据检索分析型数据库软件,公司自主研发的录信检索分析型数据库“LSQL”及“LXDB”,主要应用于万亿级别数据的OLAP(联机分析处理)场景,当前已在公安、交通交警、军队、汽车等领域树立典型落地案例。
由于产品性能优势显著,录信数软在行业内开始崭露头角,并引起了投资机构的关注。2020年疫情期间,录信数软获得凯风创投的种子轮投资。在同年9月的第六届“i创杯”互联网创新创业大赛决赛中,录信数软从百强项目中脱颖而出,夺得了大赛三等奖。
孙雪平透露,2020年度,疫情很大程度上耽搁了公司项目的实施与交付,录信数软实际上只用了半年左右的时间,便完成了原定全年的1000万元的营收计划任务。
驻场半年,啃下第一单
自2018年以来,孙雪平团队始终为做高性能的“检索分析型通用数据库”而忙碌着。“专注OLAP(联机分析处理)、针对海量数据检索分析”是团队关于场景的最初构想。在此基础上,录信数软推出了第一代数据库产品“LSQL” ,并试图在运营商领域落地。
然而,像大部分创业者一样,孙雪平及团队的首次探索并不顺利。
从数据规模角度,拥有海量大数据的运营商场景比较符合产品定位,但在录信软件早期的产品架构上,没有很好地兼顾到高并发层面的场景应用,实际落地并没有达到预期。
“解决这个问题还得回到技术本身,好在这是我们的长处。” 孙雪平介绍,公司核心团队来自于阿里、腾讯、烽火、华为等企业,骨干技术人员均具有多年产品研发经验。其中,CTO母延年曾参与及主导了支付宝黄金策的海狗、阿里开源项目MDRILL(多维分析)、腾讯的Hermes(每天千亿总量万亿)等项目,有数十个万亿级、几百个千亿级别的项目设计与实施经验。
与此同时,孙雪平观察到,高并发与实时更新应用场景有着广阔的市场需求,于是团队继续打磨——基于底层技术优化系统性能。
2018年底,团队迎来了第一个客户:一家来自公共安全行业核心解决方案提供商。
这家企业服务于公安、政务、海关、监察等机构,随着业务量和数据量的激增,公司使用的开源数据库开始频繁出现问题,查询跑不动、跑死机是常事。
“痛点很明确。” 孙雪平表示,拥有超海量数据的情报系统应用普遍存在这样的问题,这意味着该细分领域仍有着广阔待开拓空间。
任何企业应用新的技术都会比较谨慎,合作的这家企业同样如此。为此,孙雪平和同伴在客户对面租了共享空间,开始了为期半年的驻场测试。
根据用户需求,录信数软提供了一套定制化的解决方案。
经过长时间磨合、以及产品的不断改进,团队收获了客户的信任。更重要的是,在服务客户的过程中,团队也沉淀了较强的交付能力。而后,产品的平均交付落地周期也从半年缩短至1-3个月。
目前,公司已与多家软件集成商或独立软件开发商达成合作,共同服务于政府、公安和军队等官方机构。2020年,公司完成了1000万的营收。
“索引+大数据”探索不同业务场景
2013年“棱镜门”事件发生后,我国开始推动“国产数据库”的搭建。大批大数据创业者于此时涌现,有的基于业务、有的专注底层研发。
大浪淘沙后,国内数据库行业已形成三大“派系”:一是阿里、腾讯、华为等这样的通信及互联网巨头;二是以武汉达梦、南大通用、人大金仓等为代表的“高校派”;三是以录信数软为代表的创业“新秀”们——出身于互联网大厂、有深厚的技术积累。
“录信数软的底层技术以索引见长,通过研发大数据场景下的各类索引来满足不同的业务需求,这也是我们的技术壁垒所在” 。
孙雪平以交通监控大数据为案例进行了相关介绍:“城市中24小时各路口车辆通行的数据量很庞大,数据汇总到录信数软的数据库后, 系统会针对车辆型号、颜色、地理位置及行驶时间等多个时空维度的信息建立符合数据分布模式的索引,从而能在套牌车鉴别、同行车分析等需要数据关联碰撞的业务场景下实现秒级响应”。
且录信数软的数据库在超大规模数据量下针对单维和多维的检索统计均可达到秒级。她接着举例,“一座城市一天内记录同一车型的数据量非常大,在排查涉事车辆时,在目击者只看到车型的情况下,系统可呈现该车型不同色系及车况特征数据统计,无论什么条件的组合检索都能秒级响应,快速返回结果有助于思维连贯性,激发办案人员联想到其他查询条件,这样一步步分析探索,直到锁定目标车辆。”在交通缉查中,能减少办案人员的决策时间,极大提升了办案效率。
据了解,录信数软产品性能优势主要体现在三个方面:
一是对海量数据的处理。目前商用的最大单集群数据规模数十万亿,节点数达千台,可支持最高50PB的数据总量;
二是帮助客户节省成本。在大多数业务场景下,往往需要将擅长不同方向的多套系统组合使用,而录信数软只需维护一套系统和一份数据。由此,整体维护成本、数据存储成本可相应减少60%-70%;
三是高效便捷的使用体验。系统使用标准SQL语言、提供标准JDBC和HTTP接口,降低了学习和使用难度。
“人无我有,人有我更优”
随着5G的商用化进程推进,数据洪流时代正加速到来,这也将加速传统行业数字化转型,国产数据库业务或将迎来“爆发”。
纵观行业的发展情况,较早进入赛道的录信数软有着一定的先发优势。
而在产品角度,录信软件坚持“人无我有,人有我更优”。孙雪平表示:“面对海量数据检索分析场景时,能把全文检索、关联查询、统计分析都做好的产品极少,但我们能做到,且单项性能也不比其他专门产品差”。
这得益于录信数软在产品性能打磨上的孜孜不倦。团队平均每90天更新一个版本,以最新的产品功能带给用户及合作伙伴更好的体验。“如果客户看重性能指标,我们更有优势” 。
作为一家注重研发投入的技术型公司,录信数软自主研发步伐也从未慢下。2020年4月,录信数软着手研发第二代数据库产品“LXDB”,在LSQL的基础上,对数据的实时更新以及高并发检索统计场景有了更好的支持。孙雪平透露,目前该款产品处于内测阶段,争取年内在运营商和金融行业探索合适的场景落地。
录信 LXDB技术生态定位
值得一提的是,这笔研发资金正好来自凯风创投的种子轮融资。除了对技术及团队的认可,更特别的“缘分”在于该机构合伙人系情报系统出身,双方在行业认知及产品逻辑上达成“默契”。
成立两年多以来,录信数软从最初的“两人转”扩大至当前的20人团队,支撑起上百个项目。之所以产生较高的人均产出比,离不开团队的务实。
录信数软团队成员(部分)团建合影
“我们只有做好产品, 才能不负客户的信任,这是一份沉甸甸的使命。”在孙雪平眼里,她没有雷军、马云等大佬那样波澜壮阔的创业故事,与成千上万普通创业者一样,平凡而又倔强着。
创业前期,大多数企业不得不囿于团队规模及资金。对此,孙雪平始终保持清晰的认知:“得卯足劲先做好一个场景、一个行业”。
今年,录信数软将继续在大数据检索分析垂直领域优化产品;在服务客户方面,也将继续与更懂业务的行业集成商合作。
“对于有巨大需求的检索分析型数据库市场,一家独大不是好事,国内需要更多人投入到基础研发领域。”孙雪平平静的语气中带着些许坚定。
她和团队走的这条路注定充满艰辛,而机会或许也隐藏其中。