4月1日-2日,2025中国生成式AI大会在北京圆满举行,汇聚超过50位产学研界重量级嘉宾,深度解构DeepSeek引发的变革狂潮,全面展示深度推理模型、多模态模型、智能体及具身智能等前沿领域的最新进展。大会以"大拐点 新征程"为主题,吸引了1500余名现场观众,线上观看人次更是突破百万,成为国内AI领域最具影响力的产业峰会之一。澳鹏Appen作为AI数据服务行业的领军企业重磅亮相,分享了大模型时代数据服务的前沿洞察与实践经验。
澳鹏重磅亮相 展示数据硬实力
2025中国生成式AI大会由智猩猩、智东西共同发起。澳鹏Appen携全面的大模型数据解决方案亮相大会,展示了如何以专业、精准、安全的高质量训练数据赋能大模型开发,特别是在垂直领域的深度应用。澳鹏展位吸引了众多参会者驻足交流,尤其是来自金融、医疗、法律等垂直行业的专业人士。
澳鹏展位吸引众多参会者驻足交流
澳鹏Appen 2024年年报显示:中国业务营收突破4.2亿,年增长达到71%,其中大模型/AIGC业务增长了526%,几乎所有行业龙头,特别是大模型AI企业都成为了澳鹏的客户。展会期间,澳鹏团队与与会者共同探讨高质量训练数据如何赋能大模型在垂直领域的精准应用,为金融风控、医疗诊断、法律检索等专业场景提供更智能、更可靠的解决方案。
澳鹏副总裁董成发表精彩演讲
在大模型峰会上,澳鹏Appen中国及韩国区副总裁董成发表了题为《大模型时代的AI数据服务》的主题演讲,通过澳鹏在各领域大模型部署中的数据训练最佳实践,分享了对大模型应用趋势的深刻观察。
董成指出,以AI Agent为代表,未来大模型必定会深度应用到金融、医疗、代码、音乐、文学等具体垂直领域中。这一趋势对数据的高质量、专业度和多垂类覆盖提出了越来越高的要求。面对这一挑战,澳鹏提供了多种AI辅助的前沿数据采标工具和方案,包括文本对话、多模态交互、思维链推理工具等,以满足不同垂直领域的专业化需求。
澳鹏副总裁董成发表精彩演讲
"大模型愈往垂类应用端发力,对数据质量要求愈高,"董成强调,"在通用语言任务上,第一梯队模型的性能已经趋于一致,开源模型如Llama和DeepSeek的性能已经赶上甚至超过部分闭源模型。但在更复杂的垂直领域任务中,高质量的专业数据将成为决定模型性能的关键因素。"
澳鹏全面大模型数据解决方案
在演讲中,董成系统介绍了澳鹏全面的大模型数据解决方案,覆盖从通用能力到垂直领域的全链条数据需求,包括:
全面的大模型数据生产工具链:澳鹏开发了覆盖文本对话、图像/视频描述、多模态融合、思维链和工具调用等场景的专业数据生产工具,满足大模型训练对多样化数据类型的需求。
智能体训练数据生产:针对快速发展的AI智能体领域,澳鹏专门开发了针对GUI Agent的数据解决方案,支持智能体在多步骤任务中的数据训练需求。
澳鹏GUI Tracker采集工具
自动化数据标注回环:澳鹏采用"以AI赋能AI"的开发策略,通过自研的预标注大模型与不同领域项目实践相结合,构建了自动化数据标注回环系统,大幅提升数据生产效率。
高质量成品数据集:澳鹏提供大规模、高质量、多模态的成品数据集,包括多模态多步骤思维链数据集、千万级多语种平行语料数据集、千万级知识百科和垂类问答数据集、千万级代码数据集、亿级高质量学科题目数据集以及百万级图像文本多模态数据集等。这些数据集为大模型的快速迭代提供了丰富的数据养料。
澳鹏Appen中国及韩国区副总裁董成表示:"澳鹏已在金融、医疗、法律、代码、音乐等9大垂直领域建立了专业团队,确保我们能够为各垂直领域的大模型训练提供高度专业化的数据支持,帮助客户在特定领域实现模型性能的突破。"
2025中国生成式AI大会的成功举办,彰显了高质量数据作为大模型发展核心引擎的重要价值。作为AI数据服务领域的领军者,澳鹏Appen始终以专业、精准、安全的高质量训练数据为全球AI部署提供强劲动力。站在大模型技术爆发与垂类应用落地的关键节点,澳鹏Appen将持续致力于为AI应用开发和落地打造坚实的数据基石,助力中国大模型产业在通用与垂直领域实现协同突破。