关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:016772人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上半年利润同比“腰斩” 全聚德关闭多家亏损门店

中国商报 浏览 3340 07-16

人形机器人扎堆,大模型卷应用,AI眼镜热闹…细数WAIC2025黑科技

创业邦 浏览 4206 07-27

200亿广州知名国企,董事长总经理先后换将,人均薪酬超过20万

华美财经 浏览 3874 07-27

以官员称美国通报以色列 将否决联合国安理会加沙决议

环球网资讯 浏览 3880 06-05

被限制得很难受!米西半场进攻端8中0颗粒无收 拿到6板3帽

直播吧 浏览 3422 07-16

靠“给血管做彩超”,这群“80后学霸”干出一个IPO!

野马财经 浏览 4410 07-17

美财长称中美第三轮磋商下周在瑞典举行 外交部回应

北京日报客户端 浏览 3457 07-24

我国基本医保参保率巩固在95%

商业观察杂志社 浏览 3103 07-17

记者:AC米兰为埃斯图皮尼安提出首份报价,谈判还在最初阶段

直播吧 浏览 591 07-18

受台风"竹节草"影响 上海两机场近三成航班调减取消

界面新闻 浏览 1743 07-31

高管:看到东契奇减重照片时人傻了 以为是PS、AI或者化妆的产物

直播吧 浏览 267 07-30

杨洋《凡人修仙传》开播差评一片?理由出奇一致

娱乐圈笔娱君 浏览 6703 07-29

列出截止日期 美国想让谈判对象拿出"让步清单"

环球网资讯 浏览 9722 06-04

《轻于鸿毛》定档,宋佳、佟丽娅双美争艳,对手戏张力十足

最爱酷影视 浏览 1441 07-29

iCAR V23高性能版官图发布 最大马力455匹

网易汽车 浏览 1114 07-17

无敌!樊振东收获乒超第二阶段4连胜,本赛季乒超11战11胜

直播吧 浏览 4590 07-27

3万亿公积金,放大招了

中国新闻周刊 浏览 9404 07-13

奇瑞汽车澄清与印度 JSW 合作相关情况:未涉及技术领域

IT之家 浏览 320 07-25

离婚、争议、被嘲过气?杨幂用《酱园弄》证明自己:姐玩的是韧性

娱乐白名单 浏览 1377 07-18

央行:上半年人民币贷款增加12.92万亿

界面新闻 浏览 967 07-15

中国科协年会举办空天飞行器、深海地球、电-氢协同发展等专题论坛

环球网资讯 浏览 8747 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11