关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018254人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

离婚4年佟丽娅又官宣喜讯,陈思诚已高攀不起

窥史 浏览 9787 07-31

网友600多买天津飞北京机票 中转成都30多个小时游玩

极目新闻 浏览 230 12-19

"巴铁"越打越猛阿富汗塔利班致电北京 中方斩钉截铁

健身狂人 浏览 189 03-17

男导演曝丑闻 蒋欣的含金量还在上升

刘森森 浏览 265 11-04

保安被同事推倒昏迷多月未醒 女儿:警方立为行政案件

扬子晚报 浏览 1210 08-14

直击MWC2026|AI重构通信网络,6G“卡位战”提前到来

第一财经资讯 浏览 173 03-03

永恒经典!赵丹大师诞辰110周年纪念展开启

幕味儿 浏览 389 09-10

业务调整、AI广泛应用,印度IT业“无声裁员”冲击数万岗位

环球网资讯 浏览 292 10-13

美拟收紧外国公司在美上市 外交部回应

环球网资讯 浏览 5476 06-06

媒体:高市早苗当选首相 对华采取挑衅措施的可能提升

界面新闻 浏览 270 10-22

武大图书馆"性骚扰案"二审判决:驳回杨某媛上诉

界面新闻 浏览 426 09-20

打破传统漫展模式,小红书首个二次元大型线下活动收官

大象新闻 浏览 528 08-12

《老友记》钱德勒死因大反转 真相揭晓不是溺亡

新民周刊 浏览 3847 07-28

普通人穿衣没那么多花招!找到一些简单的搭配方式,舒适耐看

静儿时尚达人 浏览 38 05-08

一路走好!歌手千百惠因病离世,享年62岁,黄安发讣告证实

扒虾侃娱 浏览 449 08-21

与独行侠续约无望!曝浓眉迫切希望交易离队 愿前往老鹰猛龙打球

罗说NBA 浏览 193 01-08

“金字招牌”业绩几近腰斩,韩国免税业迎接“寒冬”

环球网资讯 浏览 144 03-17

OrangePi 6 Plus 开发板公布:12 核 CPU,双 M.2 SSD 双 5GbE

IT之家 浏览 315 10-13

加拿大总理:努力解决加中两国油菜籽贸易问题

环球网资讯 浏览 377 09-05

防晒品穿"马甲"进药店 企业钻医保漏洞拿下9000万大单

央视财经 浏览 184 11-10

迪马:如果签不下卢克曼,国米备选方案是冈萨雷斯、桑乔和恩昆库

直播吧 浏览 1443 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11