澳鹏中国:预计2029年将跨入年营收10亿人民币大关
在AI与大模型数据服务这条赛道上,澳鹏Appen位于Everest Group 2024 AI/ML数据标注解决方案Peak Matrix领导者象限第一。2019年,澳鹏(中国)正式成立了,作为独立于澳鹏Appen全球而在中国市场"白手起家"的澳鹏(中国),5年来闯过了中国AI数据"江湖",实现了在中国市场遥遥领先。
从 2020 年到 2023 年,5年来澳鹏的复合营收增长率是 90+%以上,2023年澳鹏(中国)实现了近2.5亿人民币营收,刚刚发布的2024年上半年实现了1.83亿人民币(2540万美元)营收,远超业界头部友商。预计2024年将实现3.5~4亿人民币营收,YOY 的收入增长率 50%~60%以上,2029年将跨入年营收10亿人民币大关。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示:“过去5年澳鹏(中国)的成功,可以总结为五大因素:顺势而为、创新为要、资源多样化、洞察客户需求、员工满意与数据合规。
所谓AI数据,即经过人工或机器方式标注过的数据。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示,澳鹏(中国)在近五年经历了三大AI浪潮,同时收获了AI数据在三个维度的爆发式裂变增长红利:即从深度学习和机器学习浪潮、到自动驾驶浪潮、再到大模型的"滔天巨浪";相应带来AI数据在数据规模、数据质量和数据复杂度等三个维度的裂变增长。
整体而言,经过了2019年到2024年的飞速发展,从深度学习/机器学习的精品式小模型训练,到自动驾驶的规模化模型训练和高频次迭代,再到"百大"大模型和生成式 AI的规模化生产,引发了AI数据在规模、质量和复杂度三个维度的同时爆发式裂变,这对于AI数据服务商来说,既是机遇更是挑战。
技术能力是传统数据标注服务商长期缺失的核心能力。随着AI数据在三个维度的爆发式裂变,单纯依靠手工方式进行数据标注已经远远不能满足需求,更无法持续降低数据标注项目的成本、提高数据标注的质量、加快数据的有效流转。
在全球市场,2019年的时候也仅有包括澳鹏Appen在内的少数顶级AI数据标注服务商投资了自有的数据标注工程平台。在2019年澳鹏(中国)成立的时候,当时除了从IBM等世界一流IT公司出来的几位核心主创人员以及澳鹏Appen全球对中国团队的初始投资外,可以说"一穷二白"。
与其它全球公司的中国分公司不同,由于数据行业的高度安全合规要求,澳鹏(中国)必须要独立自主地在中国市场重建所有的资源、系统和流程。摈弃了"拿来主义",摆在澳鹏(中国)创始团队面前的就是一张白纸,而团队决定对技术进行"押注"式投入:目前公司有60余名全职资深研发技术工程师,其中一半专门聚焦于公司的技术平台产品研发;另一半专门聚焦于和客户在平台数据接收和验收的无缝对接。2023年,澳鹏(中国)投资近5000万元用于技术和系统建设,包括对澳鹏MatrixGo企业级高精度数据标注平台和大模型智能开发平台的开发和增强。
今天的澳鹏(中国)有两大拳头产品:MatrixGo企业级高精度数据标注平台和大模型智能开发平台,并用这两大平台扛住了AI数据三维度裂变的"滚滚洪流"。澳鹏MatrixGo平台和大模型智能开发平台完全由澳鹏(中国)团队在本地研发,拥有全部的知识产权和产品主导能力。
目前,澳鹏(中国)对MatrixGo平台和大模型智能开发平台每年迭代近百次,相当于每周都有产品更新,国内本地客户的 AI 数据需求能够快速反应到产品设计和开发中。同时澳鹏自主研发的预标注通用模型和交互式算法在数据标注任务中能产生25%至10倍以上的效率提升。
澳鹏大模型智能开发平台是澳鹏(中国)在2023年全新开发的一个新技术工程平台。针对大模型场景,澳鹏(中国)研发了专业的多模态数据标注工具、多轮对话数据标注工具、思维链数据标注工具、工具调用数据标注工具、知识库数据标注工具等多种专业标注工具,支持RLHF、RLAIF、SFT等多种高质量数据的生产;该平台对数据集管理、模型评估进行了针对性设计,通过A/B测试、红蓝对抗、排序打分等对大模型质量进行评估和分析;该平台还集成了算力资源的调度和对接,可以进行算法的微调和部署,一站式完成大模型数据开发。
大模型智能开发平台的快速上线让澳鹏(中国)迅速抓住了大模型商机。2023年,澳鹏(中国)在中国、日本和韩国共拓展了82家新客户,其中8家客户带来了20个大模型项目。2023年全年,澳鹏(中国)大模型业务营收接近3300万,2024上半年更直逼5000万,呈爆发式增长态势。
澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示,正是依托澳鹏MatrixGO平台和大模型智能开发平台两大平台的技术能力,让澳鹏(中国)在众多数据项目中脱颖而出,也是获得头部客户青睐的重要原因。
在自主创新方面,澳鹏(中国)目前累计申请的专利数达到24项(其中20个专利申请处于已递交状态);软著登记共计62项,其中56项已获证。澳鹏(中国)与很多高校和科研院所在计算机视觉、多模态算法、大模型等领域进行了项目合作,也与许多院校在人工智能训练师、人工智能数据标注产业培养等方面深入合作。
正是因为坚持对核心技术进行布局,澳鹏(中国)成功入选艾瑞咨询的《2024年中国AI基础数据服务研究报告》,并作为行业标杆之一被列入AI基础数据服务厂商案例。而在2024世界人工智能大会(WAIC2024)期间,澳鹏(中国)入选了亿欧的2024 AI产业链图谱,并被评选为2024中国AI企业商业落地基础设施服务商Top20等。