关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017131人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

直播间引流卖假货、申请退款即“失联”!最新曝光来了!

中国基金报 浏览 4576 08-07

从短剧到漫剧,快手的内容大生意

定焦One 浏览 46 11-11

长安汽车归属仍是谜,控股股东更名有何深意

帮宁工作室 浏览 1716 06-26

福建舰、山东舰、辽宁舰 作战能力不止“1+1+1”

上观新闻 浏览 34 11-14

“消失”一年后,43岁的贾玲官宣喜讯,全网恭喜

梅亭谈 浏览 265 08-23

美媒:杜特尔特家族在菲中期选举中表现抢眼

环球网资讯 浏览 8250 05-15

到底什么人还在买油车?终于我悟了

汽车公社 浏览 96 10-22

苹果19年来首次!今年等不到新款MacBook Pro了

快科技 浏览 7782 07-14

成龙自曝家里有弹药库,3000杆枪10万发子弹,他的特权远不止这些

不八卦会死星人 浏览 239 08-22

我国发现新稀土矿物“钕黄河矿”

IT之家 浏览 698 07-18

悉尼枪手父亲被击毙儿子被制服 愤怒民众猛踩头部

潇湘晨报 浏览 4 12-15

高效训练新标杆!华人开源原生VLM-NEO,以少数据追平顶级模型

DeepTech深科技 浏览 76 10-29

张天阳再破天花板,他让整个娱乐圈都沉默了

陈意小可爱 浏览 274 08-17

女子称车停成都却收到重庆罚单:车牌号后面都一样

极目新闻 浏览 184 09-15

美媒称马杜罗请求普京提供导弹等援助 佩斯科夫回应

环球时报国际 浏览 63 11-03

东方甄选”一日惊魂”

网易财经 浏览 291 08-20

中国飞鹤生死局:业绩大跌,股价萎靡,分红能否挽回信心?

博望财经 浏览 4391 07-17

中报喜增 杭州银行赢在战略蓄力 还有啥短板?

铑财 浏览 8476 07-24

特朗普连收3大噩耗对华态度大变 十几国等中国做决定

梁讯 浏览 5004 08-05

英媒:热刺新援高井幸大在球场进行单独训练,离合练不远了

懂球帝 浏览 258 08-26

王曼昱4-2战胜桥本帆乃香, 国乒包揽欧洲大满贯女单四强

懂球帝 浏览 246 08-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11