关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018043人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纯电续航最高410km,岚图汽车发布“岚海智混技术”

观察者网 浏览 292 08-23

美记:很多人相信托马斯会接受年薪2000万合同 篮网没给这种报价

直播吧 浏览 339 08-11

主打二排的舒适体验 全新岚图知音内饰发布

网易汽车 浏览 9006 07-24

白宫:10万美元的新H-1B签证费不适用于现有持有人

参考消息 浏览 165 09-21

2比4不敌张本智和 媒体:国乒不能只靠王楚钦独挑大梁

澎湃新闻 浏览 338 08-12

真神复仇,天后重启:李佳薇的歌声为什么有一种“经济上行期的美”?

仙女事件簿 浏览 3302 07-08

黄奕嘲讽网友惹众怒,放话前夫贩毒与女儿无关

萌神木木 浏览 9431 08-10

标配华为全家桶 尚界H5上市售15.98万元起

网易汽车 浏览 153 09-25

中国科学家首次观测到理论预言的“三级能隙”

IT之家 浏览 3925 08-11

动作片王者归来,赵文卓新片燃爆,票房断崖式领先,不输院线片

最爱酷影视 浏览 284 08-27

中候补陈永奇跨省履新后 再添新职

上观新闻 浏览 345 08-26

最美央视才女,甩掉孙红雷嫁给张嘉益

郑皓文 浏览 172 09-19

以色列催美国对胡塞武装目标动手

扬子晚报 浏览 8165 07-12

"最悲催乘客"因暴雨备降贵阳 起飞后又备降成都

极目新闻 浏览 2515 07-10

小明 Q6 Neo 投影仪开启预约:首创转一转双臂云台,799 元

IT之家 浏览 6779 08-09

具身智能开启汽车产业万亿新赛道

车质网 浏览 55 11-11

50岁陈紫函的体面,终于被她的婚姻撕碎了

喵喵娱乐团 浏览 142 09-26

俄乌冲突中 螺旋桨飞机现身防空作战前沿

中国青年报 浏览 2628 05-31

突然涌入!中国股市,传来大消息!

券商中国 浏览 5481 08-07

16岁炒马斯克鱿鱼,SpaceX天才转投北大数学校友赵鹏麾下

量子位 浏览 280 08-20

致态 TiPlus 7100s 固态硬盘发布:长江存储新一代颗粒,659 元起

IT之家 浏览 52 11-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11