关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017350人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小鹏汽车副总裁回应“G6 降本方案传闻”:虚假消息,恶意造谣

IT之家 浏览 5901 07-27

拔出萝卜带出泥!49岁赵薇近况被曝,原来圈内封杀只是冰山一角

凡知 浏览 8474 07-23

日本战机首次飞往欧美四国

环球网资讯 浏览 348 09-19

LLM越狱攻击威胁被系统性高估? 基于分解式评分越狱评估新范式

机器之心Pro 浏览 319 10-13

泽连斯基接受采访期间马林斯基宫两度停电 俄官员回应

环球网资讯 浏览 223 11-11

吉尔伯特质疑斯瓦泰克温网冠军含金量:夺冠路上连TOP10都没遇见

网球之家 浏览 3650 07-16

拉什福德渴望永久转会愿大幅降薪!暗讽曼联,称巴萨让他重获新生

罗米的曼联博客 浏览 285 10-19

海军航空兵某部开展飞行训练

金台资讯 浏览 3724 06-08

半年不到DeepSeek就凉了?鉴定为学新闻学的

差评XPIN 浏览 5475 07-12

亲民大众SUV 外观年轻酷似新能源 配五代EA888

小史谈车 浏览 482 06-16

30.98万起交个朋友!2026款小鹏X9纯电版首搭第二代VLA上市

网易汽车 浏览 159 03-03

《不期而遇的生活》大结局:最圈粉的不是程心

潇洒的怂熊 浏览 230 01-08

六十二岁李连杰最新动态曝光,住院面色浮肿苍白

阿废冷眼观察所 浏览 469 08-21

网友晒周末外卖大战战绩:点了20单外卖17单是"0元购"

极目新闻 浏览 10047 07-13

叶珂黄晓明:正式解绑,各自安好。

会说话的舌 浏览 5529 07-21

这是什么?瓜迪奥拉左脸颊有一块白色

直播吧 浏览 284 09-22

首回合告负!穆帅:在这个球场我从未赢过,但我总能淘汰费耶诺德

直播吧 浏览 5350 08-07

10月汽车召回盘点|召回合计19.6万辆,以自主品牌召回

大象新闻 浏览 209 11-17

迪丽热巴第二套造型美,孙俪漂亮,倪妮刘雯同框

清游说娱 浏览 372 08-20

问界M8纯电版开启预订:预售价37.8万元起,8月上市

IT之家 浏览 7513 07-25

国内车企频频对比特斯拉,中汽协副总工程师王耀:要正视与国际先进水平差距

红星资本局 浏览 5704 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11