景联文科技完成数千万元Pre-A轮融资,布局公共数据生产运营
文 | 李安琪
编辑 | 李勤
36 氪获悉,数据服务公司「景联文科技」于近期完成了数千万元 Pre-A 轮融资,投资方为杭州金投集团旗下基金。据悉,景联文科技本轮融资将用于公共数据生产运营的布局、智能化语料工程平台构建、以及自建垂直领域高质量标注基地,打造 " 平台 + 基地 + 行业 " 的数据链闭环生态。
景联文科技成立于 2012 年,是一家 AI 数据服务运营商。据景联文 CEO 刘云涛介绍,公司业务经历了从生物识别算法,到数据采集标注,再到高质量 AI 数据集生产运营三个阶段演变。目前,公司聚焦的领域包括公共数据、AI 大模型、自动驾驶与医疗等。
刘云涛向 36 氪表示,高质量数据集是人工智能发展的 " 燃料 "。"AI-ready 的前提是 Data-ready,数据质量决定模型效果。高质量数据集的供给是 AI 行业化落地的关键要素,也是促进数据要素繁荣交易的根基。"
今年 5 月国家数据局表示,将继续加大中央财政资金投入,支持地方、行业建设一批基础性、公益性、长远性数据基础设施项目。
而聚焦公共数据生产运营,也是景联文科技今年的业务重心。景联文的目标是,成为地方政府的公共数据生产、运营商,帮助挖掘公共数据的最大价值。
此前,景联文已经与华为数据存储达成合作,联合推出 AI 数据湖联合解决方案,该方案旨在解决公共数据中 " 治理难、供不出、流不动、用不好、安全弱 " 等痛点,充分挖掘、盘活数据价值。景联文表示,公司将与华为在各地落地实施该方案。
在布局公共数据运营的同时,景联文还将进一步加强数据标注 " 基本功 "。刘云涛向 36 氪表示,数据标注已从人工标注到人机结合标注演变,人员属性方面也从普通标注向领域标注和专家级标注转变。因此,景联文科技将聚焦重点行业场景,自建标注基地,以提供稳定、高效的标注服务与数据集产品。
在数据工程化方面,刘云涛表示,近年来景联文在技术方面不断投入研发力度,已形成从数据汇聚、数据治理、语料开发、语料沉淀、语料交易的数据全链路的 Solar Sence 智能语料工程平台,平台适配文本数据、音频数据、图像数据、视频数据、多模态数据等全域数据类型。本次融资过后,景联文将构建更智能的数据处理平台。
刘云涛表示,今年公司预计营收增速 400% 以上,目前客户结构已涵盖政府、头部 AI 厂商、AI 研究机构。而布局公共数据运营业务后,景联文将构建完整的数据服务生态体系。