站长之家 - 业界 2024-02-05 16:24

蚂蚁集团CodeFuse-VLM开源 支持多模态多任务预训练/微调

站长之家(ChinaZ.com)2月5日 消息:CodeFuse-VLM是一个支持多种视觉模型和语言大模型的框架,用户可以根据自己的需求搭配不同的Vision Encoder和LLM。

CodeFuse-VLM-14B模型在多个通用和代码任务上的性能超过LLAVA-1.5和Qwen-VL。

该框架还支持高效的PEFT微调,能有效提升微调训练速度并降低对资源的需求。

此外,CodeFuse-VLM还被用于训练网页图片到前端代码的多模态大模型,提高了前端工程师的开发效率。

微信截图_20240205162518.png

CodeFuse-MFT-VLM 项目地址:

https://github.com/codefuse-ai/CodeFuse-MFT-VLM

CodeFuse-VLM-14B模型地址:

https://modelscope.cn/models/ss41979310/CodeFuse-VLM-14B/files

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看