战略投资两大方向,布局新十年超级周期 虽然公司在2024年取得了跨越式发展,但澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士认为,以DeepSeek等大模型为代表的大模型红利才刚刚开始,AI数据服务行业将进入10-20年的景气周期,澳鹏中国将在技术、交付、安全和渠道等方向持续布局,其中的战略重点是技术和交付。而澳鹏作为AI数据服务行业的龙头,其面向未来十年超级周期的布局,也将影响整个行业的发展方向。 澳鹏(中国)在2024世界人工智能大会(WAIC2024) 技术和研发是澳鹏中国持续性战略投资的重要方向。田小鹏博士表示,技术是绝对生产力,未来5年,澳鹏中国将向研发再投入2-3亿元人民币,以确保公司在大模型超级周期中的持续竞争力,公司也将持续转型为算法辅助型、深化垂直领域的数据服务能力,同时通过人机协同模式提升数据标注的专业性和准确性。 澳鹏中国研发负责人、产品和工程副总裁钱程介绍,公司目前80%以上的研发人员都参与了大模型相关的研发任务,主要研发方向包括面向大模型的数据服务平台、面向大模型的数据标注工具以及大模型相算法的研发和应用等。2025年,澳鹏中国将投入研发资源打造智能化成品数据集生产管理平台,通过自动化的数据标注、清洗挖掘和质量评估快速构建大规模高质量成品数据集,为大模型的模型训练提供高质量数据养料。 此外,随着大模型应用向垂直领域的不断深入,澳鹏中国将结合自身在大模型和各垂直领域数据服务中积累的丰富经验,研发高精尖垂类数据标注平台,澳鹏中国计划在2025年上半年推出专业的大模型医疗数据标注平台和具身智能数据标注平台,进一步赋能垂直领域客户构建高质量模型训练数据。 当前正处于超级周期的启动阶段,大模型发展迅猛且竞争激烈。许多AI数据标注项目具有实验性质,澳鹏需要迅速调整相关的平台和资源以适应不同的数据需求。钱程指出,大模型的发展,尤其在后训练阶段非常迅速,客户不断尝试新方法以优化效果。澳鹏团队与客户紧密合作,支持模型训练的数据需求,助力模型能力的不断提升。 对于尝试性实验项目,澳鹏需要迅速构建数据处理工具和工作流程,采集和标注数据,并进行结果训练和验证。这需要一个灵活的平台工作流、自定义标注模板和敏捷的项目管理。澳鹏的大模型智能开发平台通过自定义模板引擎,能够在几分钟内快速配置数据标注模板,而定制化小型工具的开发则可在几天到一周内完成。 钱程指出,客户需求快速迭代,创意层出不穷,澳鹏的产品研发团队为深度参与在这一快速发展的赛道而感到兴奋。一方面,他们积极跟进国内外大模型训练的技术变化;另一方面,与客户实时交流前沿发展趋势,共同探讨数据服务的构建方法。 "以AI赋能AI"是澳鹏产品研发团队不断提升数据服务效率的宗旨,为了提升团队的生产力和效率,澳鹏在数据处理和生产管理中广泛应用大模型,替代传统算法。这不仅大幅提高了技术和工程团队的代码编写效率,还帮助数据交付部门提升了数据服务和项目管理的智能化水平。 在大模型时代,尽管之前有不少科技企业都有自己的数据标注工具或平台,但随着大模型和生成式AI需求的激增,企业越来越依赖澳鹏这样的外部专业数据平台和服务商,既能满足不断变化的工具和平台开发需求,又能结合垂直领域专业标注人员的RHLF强化学习,一体化满足大模型和生成式AI的持续迭代要求。 面向垂直领域的交付能力也是澳鹏的战略投资方向。继通用知识后,专业知识是大模型下一步的重点发展领域。澳鹏在已有垂直领域能力的基础上, 2024年开辟了金融、法律、音乐、多语种、文学、TTS、数学、医疗、代码等九个大模型垂直领域团队,专门负责开发和培养这些垂直领域的复合型人才,以及承担相应的数据服务项目。 什么是面向垂直领域的复合型人才?简单理解就是对传统垂直领域的人才进行培养,例如金融、法律、医疗、音乐等,让专业领域人才理解AI与大模型、AI数据与AI数据项目交付等技术和项目管理实践,将专业领域知识与AI和数据项目交付结合起来,从而更好地服务客户大模型对于多种垂直领域数据的需求。这些专业人才不仅能够完成更高质量、更专业的数据标注,更能从专业逻辑上满足大模型推理的连贯性要求。 澳鹏中国在医疗AI领域布局近5年,为国内最早在医疗AI领域大规模投入的公司,拥有500+全职医疗专业人员和1000+众包团队,覆盖临床医学、中医、中西医、护理、药学、心理、营养学等多个学科,已为国内30多个客户交付500+医学项目、超1000万条数据。 自2023年下半年起,澳鹏组建了400+金融背景全职团队,其中拥有金融、经济或财会学本科及以上学历占比99%,70%持有基金或证券从业资格,支持风险管控、数据分析等金融应用开发,并具备完善的数据安全合规体系。 2024年,澳鹏在代码大模型领域取得显著增长,拥有120+全职技术人员覆盖主流编程语言,提供代码生成、调试等服务,业务扩展至能力评估、运维、测试等场景,团队规模翻倍,并持续积累高质量代码数据集,确保代码模型在多种编程场景和任务类型上的泛化能力。 此外,澳鹏在大模型各垂类领域都拥有丰富的专业人才资源:在法律领域,拥有专业的法律人才,涵盖法律检索、庭审、风控体系建设等核心能力;多语言领域,团队覆盖200+语种,具备丰富的多语言项目交付经验;音乐领域,拥有500+兼职音乐专业人员支持编曲、标注、制谱等任务;TTS领域,拥有数十个国家TTS采集经验,录音棚覆盖全国主要城市;文学领域,团队成员均具备深刻的文学理解与鉴赏能力,支持跨领域多模态融合与创新、情感交互与智能推荐系统等领域大模型的发展……澳鹏凭借强大的专业团队和丰富经验,持续为大模型提供高质量数据支持。 值得一提的是,在专业人才招聘方面,澳鹏面向各个垂直领域,不仅有强大的全职招聘团队,在中国无锡、大连、重庆,在海外菲律宾、越南、印度、马来、英国、美国等部署高信安基地,还有独有海内外的众包资源和 2000+家供应商合作伙伴渠道,也与数百家学校展开深入合作,部署垂直领域人才的前置实训培养,从而更好地储备人才。 数据安全和合规一直是澳鹏的强项,特别是 2024 年澳鹏中国取得了中国 AI 数据行业首家 ISO 37301合规管理体系认证,覆盖 AI 数据采集、数据标注和劳动合规等领域,这是继澳鹏中国在 ISO 27001安全合规、ISO 27701个人和隐私安全合规、ISO45001 职业健康安全等进一步夯实和固守合规底线。澳鹏不断地强化安全合规举措,为所有客户提供安全、可持续的数据服务,田小鹏博士表示,2024 年澳鹏各个基地顺利通过了 50+多次的客户"飞检"和现场审计,为客户的大模型高数安要求保驾护航。 澳鹏获全国数据交易联盟“年度优秀数据要素创新企业奖” 总结而言:随着以DeepSeek开源大模型为代表的大模型第二波浪潮刚刚开始,一个真正的技术、经济和数据的超级周期才正式启动。在大模型第一波浪潮中,启动的主要是AI和科技公司;而在大模型第二波浪潮中,启动的将是所有行业领域的公司和政府机构,并将从中国聚焦到全球拓展,形成了从技术进步到生产力提升再到营收增长以及更多技术投资的正向循环。 在超级周期的正向循环中,数据真正成为了经济增长的"燃料",一个AI数据服务的多年期蓝海正在形成。田小鹏博士表示,"到2030 年,澳鹏中国制定了非常远大的营收目标——20+ 亿人民币,更重要的是澳鹏中国将不遗余力地成就我们中国 AI 客户,通过持续创新让中国的 AI 的产品和服务能领先于世界!" 中国首席商业资讯门户;更多内容请关注中国商业网各频道、栏目资讯。 免责声明:凡未注明来自本站的稿件和图片作品,系转载自其它网站,转载目的在于信息传递,并不代表本站赞同其观点和对其真实性负责 。 |
2014-07-18
2017-12-07
2017-08-08
2017-06-03
2018-01-22