LOADING

热门

MEXMA – Meta推出的预训练跨语言句子编码器

AI工具8个月前发布 AI工具

MEXMA是什么

MEXMA是由Meta AI推出的一种新型的预训练跨语言句子编码器。基于结合句子级和词语级的目标提升句子表示的质量。在训练过程中，MEXMA用一种语言的句子表示预测另一种语言中被遮蔽的词语，支持直接更新编码器中的句子表示和所有词语。MEXMA在多个任务上展现优越的性能，超越现有的预训练跨语言句子编码器，如LaBSE和SONAR。MEXMA支持80种语言，在句子分类等下游任务中表现出色。

MEXMA的主要功能

跨语言句子编码：MEXMA将不同语言的句子编码成固定大小的向量，向量在一个共享的多语言空间中进行比较和操作。
句子和词语级目标结合：基于同时考虑句子的整体含义和句子中各个词语的贡献，MEXMA提高句子表示的质量和对齐。
多任务性能提升：MEXMA在多种下游任务中表现出色，包括句子分类、文本挖掘和语义文本相似度任务。
80种语言支持：MEXMA支持多达80种语言，适用广泛的多语言应用场景。

MEXMA的技术原理

结合句子级和词语级目标：MEXMA用句子级目标训练模型，引入词语级目标。在训练过程中，模型学习句子的整体表示，和学习句子中每个词语的表示。
交叉语言遮蔽任务：MEXMA用一种语言的句子表示预测另一种语言中被遮蔽（masking）的词语。交叉语言的遮蔽任务迫让模型学习能捕捉句子核心信息的句子表示，确保信息在不同语言之间是可对齐的。
直接更新编码器：在MEXMA中，句子表示能更新编码器，每个词语的表示直接更新编码器。双向更新机制让模型更有效地学习到高质量的句子和词语表示。
对称架构：MEXMA基于对称架构，同时对两种语言的句子进行遮蔽和预测，确保模型在两种语言之间是平衡的，能生成两个干净的句子向量，对于语言之间的对齐至关重要。
非对比性损失函数：为避免模型崩溃（collapse）并提高表示的质量和对齐，MEXMA用非对比性损失函数，如均方误差（MSE）损失，加强不同语言中语义等价句子的空间接近性。

MEXMA的项目地址

GitHub仓库：https://github.com/facebookresearch/mexma
HuggingFace模型库：https://huggingface.co/facebook/MEXMA
arXiv技术论文：https://arxiv.org/pdf/2409.12737

MEXMA的应用场景

跨语言信息检索：用MEXMA将不同语言的文档转换成相同的嵌入空间，进行跨语言的搜索和检索。
机器翻译：MEXMA改善机器翻译系统，基于提供更准确的跨语言句子表示增强翻译质量。
多语言文本分类：在处理多语言文本数据时，MEXMA能分类文本内容，如情感分析、主题分类等。
语义文本相似度评估：MEXMA评估不同语言句子之间的相似度，适用比较和匹配相似的文本内容。
跨语言问答系统：在多语言的问答系统中，MEXMA帮助理解不同语言的问题，在相应的语言中找到答案。

AI工具 # # AI

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

新手必备的9个WordPress文章编辑技巧

新手必备的9个WordPress文章编辑技巧

AI工具 AI快讯

2个月前

040

presti – 专注于针对室内家具领域的AI图像生成工具

presti – 专注于针对室内家具领域的AI图像生成工具

AI工具 # # AI

6个月前

020

Whispo – AI语音转录工具，一键录音与转写

Whispo – AI语音转录工具，一键录音与转写

AI工具 # # AI

8个月前

0130

AI Baby Generator – AI一键预测未来宝宝外貌

AI Baby Generator – AI一键预测未来宝宝外貌

AI工具 # # AI

8个月前

0360

暂无评论

暂无评论...