关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017352人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

摄影比赛第一名被指是AI生成图片 被取消成绩

封面新闻 浏览 222 01-12

首负日本!巴西遭36年之耻 安帅气炸直接离场+判头号罪人“死刑”

风过乡 浏览 337 10-15

上海,要让互联网内容创造者活力四射

上观新闻 浏览 3883 07-13

媒体:出轨女生拟被开除 传播视频另一方岂能逍遥法外

极目新闻 浏览 8584 07-14

十年前的百度,聚拢了硅谷最杰出的天才,每个都比姚顺雨耀眼……

字母榜 浏览 216 01-29

小米SU7最低配的算力才84,车主真的够用吗?

车有梗 浏览 9933 07-26

近五场与富勒姆的联赛交手中,曼联取得4胜1负

懂球帝 浏览 431 08-24

5000亿,这哥俩燃爆了!

华商韬略 浏览 445 08-24

28岁华裔天才成百亿富豪 却献计特朗普封锁中国AI技术

策略述 浏览 240 01-12

布拉特:FIFA成因凡蒂诺的一言堂 他将足球输给沙特&世俱杯不该办

直播吧 浏览 3334 07-13

2025 Google开发者大会宣布第四期“出海加速器”开启申请

DeepTech深科技 浏览 505 08-19

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 217 01-13

舒淇最爱穿的裙子搭配,真的很适合春天!

黎贝卡的异想世界 浏览 172 02-27

普通人衣服没必要买太多,准备好这些实用的单品,百搭又舒适

静儿时尚达人 浏览 269 10-30

小区业主发函要求调低物业费 物业将20户业主告上法庭

每日经济新闻 浏览 462 09-09

“超级周”来袭!美联储,降息稳了?

券商中国 浏览 267 10-27

新款捷尼赛思G80最高涨价3.32万元,是自信还是冒险?

车宇世界 浏览 501 05-19

佟丽娅儿子正脸曝光,五官气质超像爸爸

80后房车生活 浏览 9159 07-22

上汽通用五菱与华为深化合作 首款车宝骏华境S亮相

网易汽车 浏览 402 09-08

内塔尼亚胡罕见承认:以色列受到了孤立 面临经济威胁

参考消息 浏览 439 09-17

张馨予减肥致体质差,170身高仅百斤两月发烧三次

把喜欢都给他 浏览 227 02-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11