关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018258人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全球市场后续“脚本”来了

国际金融报 浏览 5670 08-10

云南人口突围战:留住380万“过客”,不论老少

时代周报 浏览 3866 08-10

犯罪团伙大胆却“业余”,珠宝黑市隐蔽且暴利,FBI前探员拆解卢浮宫劫案

环球网资讯 浏览 306 10-24

716分考上中专,是倒退,还是超车?

智谷趋势 浏览 3743 08-07

“私募一哥”A股清零,大恒科技再临十字路口

每日资本论 浏览 327 10-13

E句话|戴军自曝为前任买房后惨遭分手?

仙女事件簿 浏览 44 05-09

钟楚曦合影风波升级!杨幂刘亦菲差点没挤进去

萌神木木 浏览 283 10-25

32岁费南多失业9个月后露面:向中超索1700万元年薪 拒为国足出场

风过乡 浏览 360 09-20

一名美国公民被指禁止离境中国 中方回应

外交部网站 浏览 4988 07-22

胡梅尔斯:告别战一切都很完美,再多踢一会儿体能就要撑不住了

直播吧 浏览 524 08-11

WAIC前线|首款“时空算力背包”来了:帮助机器人走向室外

网易科技报道 浏览 8783 07-27

赵丽颖新剧收视走势差,表演短板全暴露,后续没存货半年没进组

萌神木木 浏览 228 01-13

给你一个互换生活的机会,你敢吗?

时尚COSMO 浏览 1919 06-25

传美国入股?台积电不予置评

看看新闻Knews 浏览 513 08-21

从造豪车到百万亿美元公司,追觅俞浩:怕我们膨胀,但我们稳得很

贝壳财经 浏览 223 01-18

字节飞书亮剑AI企服战场​

华尔街见闻官方 浏览 9719 07-11

欧盟一些成员国欲"另起炉灶" 绕开欧盟跟美国直接谈

澎湃新闻 浏览 271 12-16

离婚后高调秀恩爱的杨子,没给黄圣依留一丝体面

乡野小珥 浏览 470 08-20

特朗普:乌表示随时准备签署美乌矿产协议

浏览 10667 07-14

一箭双雕!拉什福德实现儿萨梦,接过偶像亨利的14号球衣

直播吧 浏览 2732 07-24

提前关窗!马卡:皇马的夏窗已经关闭,球队完成所有计划中的签约

直播吧 浏览 420 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11