李锦香坐在我们的对面,笑逐颜开。她思路快捷,聊起工作滔滔不绝。事实上,她有足够的理由感到开心——即便是在此次疫情中,全员被封禁了2个月的情况下,烯牛数据的各项年收入已经早早达标,工作也在有条不紊地进行中。这些天,她正不断地面试新人,为下一轮的企业发展积蓄力量。
李锦香的乐观还有一层更深的原因,创业以来,她总是能前瞻到行业的发展态势,并且在运营中精准把握细节。在这位烯牛数据的创始人身上,眼光和执行力完美的结合在一起。
精准对标数据应用场景
从北大信息管理硕士毕业后,李锦香先后做过产品、咨询等工作。2012年,她在戈壁创投担任VP(投资副总裁)期间,慢慢产生了创业的想法。“那时的主要工作就是看各种项目,一个个地看,一个个地筛。项目实在太多了,看不过来。"在这个过程中,她首次发现了数据缺乏和缺失的痛点。
其实仅仅几年前,创投数据库数据库多半反映的还只是后发性的信息,采集渠道也多半来自人脉圈、新闻媒体、FA等途径,数据采集并不全面和真实。
所以,信息管理硕士出身的李锦香就想“通过大数据量化系统展现早期创业公司的各项数据,从而帮助一级市场投资人找到好的创业项目”。
她希望,能够量化地把数据的价值前置出来,解决该行业的痛点和需求。利用自动化工具提高效率,主动挖掘海量数据中所埋藏的价值。
2016年,李锦香创办了烯牛数据,这是一家数据智能服务商,致力于构建实时全量的企业知识图谱,挖掘中国优质企业,为金融机构及B2B企业业务赋能。平台包括的内容很广泛:工商变更、融资事件、媒体舆情、产品动态、竞品消息、招聘异动等11大板块近百个维度,可以做到一键追踪和实时推送。
“我们知道,一家企业从成立之初,就已经开始在工商登记和媒体报道中留下各种痕迹。随着融资发展、业务规模成长,会逐步产生很多的数据。当数据样本足够大,就能够从中提炼出新的价值。这能够及时反映行业的最新变化趋势。”李锦香介绍说。
“底层数据会自动保持更新,节省了人工成本。有需求的客户,在这些数据的基础上可以获取各种需求。”有别于一般的SaaS只有各种功能模块而无数据支撑,烯牛所提供的动态数据是极具参考价值的。
烯牛数据一经推出,就切实地帮助了投资人判断行业,了解这个细分领域有多少家公司在做,竞争对手情况怎样,包括投后的项目管理等,其功能贯穿了整个投资过程的始终。
在这个基础上,一场新的变革自然而然地开始了。
打标签,打数据标签,打人工智能标签!
几年下来,烯牛的团队逐渐认识到:最终用户并不在乎产品底层数据的多寡,数据产品也应该把项目亮点提取出来。
于是,烯牛数据产品开始设计场景应用,数据产品还上线了行业赛道功能,提供基于细分赛道的一级市场为主,二级市场为辅的数据分析、上下游产业链图谱、以及相关行业报告。通过智能工具对企业数据进行聚合、清洗和挖掘,最终达到提升投资效率的目的。
目前烯牛数据的服务对象包括一级市场生态上下游的母基金、FA(财务顾问)、VC/PE、企业战投;也包括银行、券商等传统金融机构及各类To B服务企业。
事实上,当数据呈现方式变化后,产品的应用场景也顺理成章地扩张开来。李锦香举例说——在非上市公司中其实包含了一大批拥有创新科技能力、市场前景巨大的隐形潜力公司。而往往这样的公司都处于发展期,行事低调、埋头做事。对于许多B2B企业来说,它们具有特殊的价值。在烯牛的平台上,这些ToB服务的企业纷纷以定制数据服务的方式,去跟踪和挖掘标的公司的商业机会。
对此,李锦香特别举了深交所的案例:“深交所接触到烯牛数据后,深感其数据分析背后的巨大机会,主动找到我们开发定制的模型,去筛选一些高成长潜力的优质企业。”
如果你打开烯牛数据的应用界面,就会在各个导航栏下看到大量“标签”,它们像图书馆里的书架排序一样,标记出各种高价值的企业信息。
值得一提的是,烯牛数据公司团队规模为几十人,大多为技术人员,数据团队由专家定义标签规则、背后通过算法来落地实现,由机器提取数据,日常90%以上的数据“打标签”均由机器自动进行。
“我们同时关注几十个一级行业,数百万体量的企业,如果要人类做标签信息的梳理,背后的管理、培训体系复杂度会极高,一致性也无法保障。”李锦香更相信技术驱动的力量。事实上,这也是烯牛胜出的诀窍。
李锦香进一步解释说:我们的智能标签是经过深思熟虑的,每个项目的长尾标签多达几十个,运用了神经网络等算法,排除了人为干扰,数据分析依赖机器运算。当然,页面只展示热门标签,后台将长尾标签打得越精细,后续才能做更多内容。
第一类标签用于行业分类,覆盖多重创新行业,同时支持动态调整,满足创新行业的快速变化。“我们每天用大量的时间去思考、归类和整理标签,你会发现很多小的细分领域正在快速发展,几乎是一夜之间就可能够支撑起一个大的概念。”似乎是为了验证李锦香的介绍,我们在列表中,惊讶地发现了“户外帐篷”、“空气炸锅”和“元宇宙”这一类最新流行的商业标签。
第二类标签则属于烯牛特色算法标签,例如团队优秀、知名风投、第一次冲进iOS榜单、下载激增等等。对于用户来说,这套标签让客户可以从大量数据中找到头绪;也支撑起了烯牛数据“场景应用”的核心。
用数据构建创业生态圈
目前市场上已有多家提供创业投融资信息数据的服务商,但烯牛数据的特色却非常明显,李锦香的理想从没有止步于“一个数据库产品”。
“服务投资人的相关产品市场上也有,但比较单一,许多只集合融资信息,没有对项目进行详细分类,更不提动态更新。”
在精确度上,烯牛数据对于不同数据源的权威性有一套自己的评判体系,会基于信息源的质量作出实时调整。李锦香也承认机器打标签这件事情上,结果并非百分比完美。“目前,我们也在用人工与机器结合的方式处理特色标签,对一些重点项目做数据加工;未来会不断调整算法尺度,把准确度不断提升,增加更多自动校准机制,提高数据质量。”
简单来说,烯牛数据就是从技术的方式,集中在网上抓取项目,并跟据项目特点,给项目贴上标签,以方便投资人识别。投资人可以根据自己的需求订制、收藏自己感兴趣的项目,并且投资公司内部也可以通过烯牛数据进行投后项目追踪与竞品机构追踪。
烯牛数据依托于底层数据与专业团队的强大基因,带来了两项重磅更新,致力于把“发现优质公司”的初心做到极致。
在烯牛数据“中华优质企业库”根据企业的发展周期,囊括并同步更新了所有中国最优秀的科技创新企业:如私募融资企业、四板挂牌企业、新三板挂牌企业、科创板及A股上市公司、港美股上市的中概股企业、上市辅导企业等,并对他们做出了数据分层。
在宏观层面,烯牛数据还引入了各项科技认定和来自工信部、发改委、科技部等多个权威政府部门的200余种政府奖励名目,可按照企业的不同发展阶段、各部委的奖励认定中发现优质公司。
另外,烯牛数据在与证券交易所的合作中,通过人工智能技术实现了“一二级市场互通的行业分类标准与概念联通”,解决了一二级市场之间的话语体系割裂的顽疾,以行业分类和标签体系的双核驱动来探索新兴的创新领域与创新公司。
通过打通一二级市场行业分类以观察科技创新与资本市场之间的关联,烯牛数据拓宽了全新的行业研究视野,“将市场研究者从信息孤岛中解放出来”。
用信息手段,抓取更多的优质公司
当下,客户群体是否具有高成长价值?如何精细化自己的客户画像?并找到符合自己客户画像的潜在客户?如何唤醒客户池中的睡眠客户?这些问题让很多企业感到困扰。拥有大数据,能够更有利的为企业发展做出改革突破,有着关乎发展的重大意义。
创业这些年,烯牛数据这个平台越来越展现出独特的生态价值,已吸引了多家投资机构、银行、券商、寻求转型的传统企业等客户积极实践。
因为项目非常垂直,所以普通级别的用户也许不能快速发现其内在的价值。今年,李锦香也在考虑用简配版来获取更多的外部用户。一旦外部出口扩展得更大,各种机会和可能性也就随之而来。
“我们会继续把数据做好,通过‘机器+人工’方式提升数据采集、清洗、处理的效率;同时平台会根据用户反馈,在“数据+产品化应用”的道路上探索更多可能性。”李锦香说。
截至目前,烯牛数据平台已拥有超过500万家公司数据,20万家基金数据,近30万条融资信息,超过5万个特色标签。
“怎样更好地挖掘有价值的优质公司?”,这始终是李锦香思考的问题。她希望把数据的价值体现出来,将数据与应用场景结合,基于数据变化主动挖掘出优质公司,“让数据来说话”。
(来源:新视线)