关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:016791人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

B费:大多数巴西人都很开朗,库尼亚很快就和大家打成一片了

懂球帝 浏览 5031 07-27

俄罗斯失事客机上有一名中国公民

界面新闻 浏览 6779 07-25

西岸有一座“百变黑盒”,让“上天入海”成为可能

文汇报 浏览 1591 07-18

董璇再婚现场照曝光!关悦佟丽娅出席场面朴实,男方黑历史被扒

萌神木木 浏览 3468 07-16

60多w到账了,开心

越女事务所 浏览 1680 07-15

河北张家口崇礼发生3.4级地震 震源深度20千米

中国地震台网速报 浏览 4434 07-10

美国三大股指全线收跌 诺和诺德重挫21%

中新经纬 浏览 8106 07-30

乘龙卡车回应对撞试验中"撞不过理想i8":被摆了一道

红星新闻 浏览 1783 07-31

疯狂!药ETF惊现“乌龙指”,创新药行情再度走强

券商中国 浏览 213 07-16

网友称有大学生因在宿舍泡牛奶被通报 涉事高校回应

环球网资讯 浏览 2660 07-24

小红书文玩女孩,反向造爆款

定焦One 浏览 3518 07-26

鸿蒙智行首款旅行车享界S9T来了,余承东:高颜值、大空间、高性能

网易科技频道 浏览 8287 07-14

太坑了!外卖平台AI商家泛滥,4招教你识破“幽灵外卖”真身

雷科技 浏览 762 07-26

5.3%!下半年,8个重大变化

正和岛 浏览 1728 07-16

智元稚晖君发布“灵渠OS”开源计划,自研大模型获SAIL之星奖

上观新闻 浏览 3848 07-27

大行“买”小行,长城华西银行要改名了?四川银行43亿接手控股权

时代周报 浏览 5034 07-16

"飞行的五角大楼"已抵达华盛顿附近

红星新闻 浏览 9519 06-20

多名副部职务调整 中候补当选省级政府“一把手”

上观新闻 浏览 1660 07-22

江西一网红餐厅“人狗同桌用餐” 餐厅老板回应

扬子晚报 浏览 5749 07-23

伊朗证实福尔多核设施部分区域遭袭

CCTV国际时讯 浏览 5049 06-22

央视记者:德黑兰已经没有安全的地方了

央视新闻 浏览 7971 06-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11