Meta推出新的AI模型 可转录和翻译近百种语言
时间:2023-08-23 08:56:00 来源:财联社
当地时间周二(8月22日),Meta发布了一个名为SeamlessM4T的人工智能(AI)模型,可以翻译和转录近百种语言。
(资料图片仅供参考)
据Meta介绍,SeamlessM4T可以翻译近100种语言的语音到文本和文本到文本。对于语音转语音和文本转语音的操作,它可以识别100种输入语言,并将其转换为35种输出语言。
SeamlessM4T是根据知识共享许可(CC) 协议4.0发布的,允许研究人员对其进行迭代。
除了SeamlessM4T,Meta还发布了其开放翻译数据集SeamlessAlign的元数据。
Meta表示:“建立一个通用语言翻译器,例如像《银河系漫游指南》中虚构的巴别鱼那样,是具有挑战性的,因为现有的语音对语音和语音对文本系统只覆盖了世界语言的一小部分。”
《银河系漫游指南》是由英国作家道格拉斯·亚当斯所写的一系列科幻小说,而巴别鱼是这部作品所创造的一种神奇生物,体型小到足以放进人的耳朵,靠接受脑电波为生。如果将巴别鱼放到耳朵里,人们可以理解任何语言。
对于SeamlessM4T模型,Meta研究人员在一篇研究论文中表示,他们从400万小时的原始音频中收集了音频训练数据,这些音频来自一个公开的抓取网络数据存储库,但没有说明是哪个存储库。
研究报告称,文本数据来自去年创建的数据集,这些数据集从维基百科和相关网站上提取了内容。
Meta表示,SeamlessM4T代表了一个重大突破,因为这个模型可以一次性完成整个翻译任务,而不像其他大型翻译模型那样,将翻译分成不同的系统。
SeamlessM4T建立在Meta之前的翻译模型之上。Meta去年发布了支持200种语言的文本到文本的翻译模型。它开发了用于多语言语音到语音翻译的数据集,以及用于语音识别的大规模多语言语音。Meta去年展示了它的通用语音翻译器,可将闽南语转化为英语。
(来源:财联社)
标签:
最新文章推荐
- 陕西7名核酸检测阳性外省游客活动轨迹公布
- 万人说新疆 | 棉花朵朵赛白云,阿克苏美出新高度!
- 万人说新疆 | 孙芳红:我在新疆每天过得很充实也很快乐
- 万人说新疆 | 棉农阿卜来提开心地笑了
- 万人说新疆 | 阿迪力的棉花合作社年入300万
- 四川乐山犍为县发生4.3级地震 无人员伤亡
- 西安全面开展排查管控 目前20481人核酸检测结果均阴性
- 陕西7名核检阳性者为一旅行团同行人员 活动轨迹公布
- 西安交大举行2021级本科生迎新会 校长:学习是主动作为之事
- 【母亲河畔的中国】黄河岸边的这个村庄如何打好旅游服务牌?
X 关闭
资讯中心
2022-08-06
2022-07-08
2022-05-20
2021-10-18
X 关闭
热点资讯
-
1
华为Mate X5直接开售,秒售罄!除价格外,其他信息已汇总
-
2
长飞特种光纤助力高质量光通信网络与数据中心建设
-
3
国信证券:港股底部条件具备,等待美联储加息结束
-
4
同一个作者的作品,为什么西行纪可以做成年番,武庚纪却不行?
-
5
河岸“会客厅”打造京城新地标
-
6
股票行情快报:亿联网络(300628)9月8日主力资金净卖出212.22万元
-
7
个人ip如何打造 ip的意思是什么
-
8
“速度王者”DNBSEQ-G99获国家药监局批准 华大智造再拓18亿销售空间
-
9
李墨谦(对于李墨谦简单介绍)
-
10
受降雨影响,居庸关长城景区夜长城及部分区域暂时关闭
-
11
新华社权威快报|10位国际友人获颁首届兰花奖
-
12
几内亚西芒杜铁矿北部区块开发快速推进:中国宝武即将“进场”项目投资
-
13
记者观察丨违规减持屡禁不止 上市公司守信合规要加强
-
14
恒宇信通:9月7日融资买入480.22万元,融资融券余额2345.29万元
-
15
儿童友好看雄安丨“我与雄安一同成长”儿童友好科普教育基地巡礼活动举办
-
16
贵港重点在园区发展保障性租赁住房 着力解决产业工人职住问题
-
17
白醋怎么洗脸才美白祛斑视频(白醋怎么洗脸)
-
18
《灌篮高手》日本下档, 票房已突破155.2亿日元
-
19
没想到,辣椒素是牛生长不可缺少的因素,辣椒素对牛的好处有哪些
-
20
交易异动!鸣志电器:无未披露的重大事项