关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018257人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子花5000多元在淘宝网购2台空调 却只收到4包抽纸

大风新闻 浏览 9251 07-24

叶军离职,钉钉站在十字路口

21世纪经济报道 浏览 1324 07-15

乌官员:袭击乌方设施的俄"榛树"导弹未携带弹头

环球网资讯 浏览 226 01-11

佟大为夫妇云冈石窟被偶遇,46岁关悦近照曝光,路人生图超真实

扒虾侃娱 浏览 9905 08-14

黄金越涨越买?这届年轻人心态变得太快了

说财猫 浏览 346 10-17

抖音发布医师节数据:年增医疗创作者1.8万 科普内容获赞42亿次

环球网资讯 浏览 507 08-19

万科再“瘦身”:消失的区域公司

YOUNG财经 浏览 7219 07-26

14岁少年强奸杀害女同学被判无期 奶奶受刺激闭门不出

潇湘晨报 浏览 71 04-29

美国公布六代机动画 网友吐槽:用AI软件3分钟搞定

环球时报 浏览 295 09-24

理想汽车服务网点总数达 642 家、覆盖城市 225 个

IT之家 浏览 2776 07-13

拥抱Z世代,国潮IP品牌“福福贴贴”创始人到访红豆集团探讨战略合作

Daily每日财报 浏览 7918 07-24

莫斯科大学突破:普通照片实现房间结构与物品识别

科技行者 浏览 263 10-22

“滴滴助学计划”高考奖学金公布获奖名单

网易科技报道 浏览 404 09-11

机场摆渡车挤满人闷热难耐 女乘客晕倒后有人砸窗自救

大风新闻 浏览 9430 07-14

32岁章泽天,开播客节目采访刘嘉玲

娱乐圈笔娱君 浏览 220 01-15

2025款零跑B10车主原音回放 再现调查现场

车质网 浏览 272 11-09

预售价27.99万起!乐道L90这波「掀桌」能成吗?

科技丛林 浏览 8874 07-12

美特使:美国已开始减少在叙利亚的军事存在

新京报 浏览 6963 06-04

"泼天富贵"砸向中国商业航天市场 结果供应商凑不够数

经济观察报 浏览 414 09-08

10月第一周豪华SUV销量榜 奥迪Q5L第2/宝马X3第5

小李子体育 浏览 254 11-09

最显腿细的西装短裤,这么穿更有女人味!

Yuki女人故事 浏览 9469 06-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11