关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018038人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

固特异股价蒸发40%,百年轮胎帝国遭遇“中年危机”

轮胎报官方 浏览 280 08-20

女子疑因家暴离世 知情人披露详情:被抓的婆婆是医生

新快报新闻 浏览 314 08-26

卫星对比图:伊朗核设施及军事设施受损严重

澎湃新闻 浏览 3760 06-19

A股板块轮动加速 基金净值“跑偏”泄露调仓动向

证券时报 浏览 150 09-29

赛季首胜!切尔西5-1大胜西汉姆联 佩德罗1射2传恩佐&凯塞多建功

直播吧 浏览 225 08-23

幻方量化员工“亿元返佣”背后:券商与量化私募的隐秘关联被揭开一角

界面新闻 浏览 8568 08-09

世体:皇马拒绝让女超杯在迈阿密举行,女足俱乐部都感到不满

懂球帝 浏览 116 10-16

美防长回应记者质疑:带把大铲子去伊核设施挖挖看

每日经济新闻 浏览 2181 06-29

小鹏汽车招聘计划上调至8000人 聚焦AI与智能驾驶领域

智车情报局 浏览 2903 07-18

好起来了!王楚钦连夺世乒赛、美国大满贯两项重要赛事男单冠军

直播吧 浏览 2066 07-14

小米、华为常年被追着骂?前魅族高管李楠撕了车圈的遮羞布!

雷科技 浏览 1309 07-15

马思纯因戏得抑郁症?林志玲满眼心疼

快乐娱文 浏览 3422 07-29

有望年内亮相 全新起亚K4旅行版渲染图曝光

车质网 浏览 293 05-29

8个观众,票房仅233元,2025年9月最惨新片诞生了

靠谱电影君 浏览 228 09-02

为利益斗到底 马斯克新建“美国党”

浏览 3871 07-14

隐婚生子风波后,王鸥再被曝猛料!

通鉴史智 浏览 1535 07-16

王健林身边人,又少了一个

创业家 浏览 6536 07-27

许传智被查:在中纪委工作超30年 曾任宁夏纪委书记

界面新闻 浏览 119 10-15

华为高管:一款好的辅助驾驶汽车保费更低,二手保值率更高

第一财经资讯 浏览 198 09-09

今年夏天“蓝衬衫”火出圈了,这样穿时髦松弛又高级!

LinkFashion 浏览 680 07-22

大部分人都没做成的 C 端 AI 硬件,科大讯飞怎么做成的?

晚点LatePost 浏览 4063 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11