关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:017665人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德国“激光照射”碰瓷,东大保持战略定力

浏览 9558 07-14

河南省为何突然新晋成了“造车大省”?

BT财经 浏览 973 07-17

少林寺管理处:目前少林寺运行一切正常

第一财经 浏览 7610 07-29

美国总统20年来首次造访美联储:手里拿着一本账

每日经济新闻 浏览 7313 07-27

网红“健康”食品,把中产绕晕了

虎嗅APP 浏览 632 07-17

国常会:切实规范新能源汽车产业竞争秩序

网易财经 浏览 566 07-17

上半场比分紧咬因三分太铁?黄思静:命中率会有起伏 防守是根本

直播吧 浏览 2035 07-16

青海隐形首富北京豪宅被1520万拍下 物业费已拖欠45万

极目新闻 浏览 8579 07-11

记者:森林接近与博洛尼亚就恩多耶达协议,转会费3400万镑

直播吧 浏览 4116 07-29

为什么有的人一看就很有气质?这5个变美法则一生受用

LinkFashion 浏览 4697 06-20

律师发现高速路收费延期 申请公开缘由被回复"涉密"

大风新闻 浏览 2940 07-10

午评:沪指半日跌0.68% AI硬件、创新药概念股再度大涨

网易财经 浏览 1452 07-31

小吧译言家 双10号驾到!库尼亚与姆贝莫将如何重塑曼联战术体系

直播吧 浏览 5036 07-29

荣耀 MagicGUI 大模型发布并开源,效果比肩 SOTA 模型

IT之家 浏览 9512 07-26

队报:巴黎相信舍瓦利耶能接班,考虑续约成本愿意卖多纳鲁马

懂球帝 浏览 9107 07-29

乌无人机深入俄腹地 俄证实多个机场遭恐怖袭击

财联社 浏览 3094 06-03

年少成名的张一山似乎成为了下一个文章,一步错步步错,争议不断

新语爱八卦 浏览 1541 07-14

德国是否提供“金牛座”导弹援乌陷入真假疑云

环球网资讯 浏览 1468 05-28

美方威胁:"二级关税"这一刀砍向中印 俄罗斯才会真疼

澎湃新闻 浏览 1370 07-16

牛增亮出任华泰人寿总经理,精算“老将”填补三年空缺

蓝鲸Insurance 浏览 4699 07-12

泰柬将在马来西亚谈判 前线交火仍在持续

界面新闻 浏览 6668 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11