站长之家 - 业界 2023-08-30 15:08

阿联酋 G42 推出开源阿拉伯语人工智能模型Jais

站长之家(ChinaZ.com) 8月30日 消息:据路透社报道,阿联酋科技集团G42最近与硅谷创业公司Cerebras Systems合作,发布了一款开源的阿拉伯语人工智能语言模型Jais。这款语言模型拥有130亿个参数,其训练数据来源包括大量阿拉伯语数据以及英语计算机代码。Jais的命名源自阿联酋的最高山峰。

这个项目由一组工程师、研究人员以及Cerebras Systems的团队合作完成。Cerebras Systems是一家致力于人工智能计算硬件的创新型创业公司。该公司设计的芯片与英伟达的芯片一样,可用于高强度的人工智能计算。Cerebras Systems为此项目提供了必要的计算资源。

大模型 元宇宙 (1)

开发团队表示,计算机代码数据对提高Jais的推理能力非常重要,因为纯阿拉伯语数据还不足以训练一个如此大规模的语言模型。Jais以开源方式向公众开放,希望可以推动阿拉伯语人工智能技术的发展。

业界相关人员指出,类似Google的英语语言模型BERT已经取得长足进展,而针对阿拉伯语的语言模型还非常稀缺。Jais的推出是阿拉伯语人工智能发展方面的重要进步。这不仅有利于阿联酋地区,也将促进全球阿拉伯语人工智能技术的繁荣。

Jais将基于开源许可证对外开放。该语言模型未来可广泛应用于语音识别、机器翻译、文档生成等领域。它也是阿拉伯语地区首个规模如此庞大的语言模型。业内人士预计Jais的问世将大大推动阿拉伯语人工智能的进一步研究和应用。

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看