快科技1月28日消息,爆火的国产大模型DeepSeek又放大招,今天凌晨突然发布Janus-Pro多模态大模型,进军文生图领域。
在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E 3,还击败了Stable Diffusion、Emu3-Gen等热门模型。
Janus Pro采用MIT开源协议,这意味着可无限制用于商业场景。
DeepSeek方面表示,该大模型是2024年11月13日发布的JanusFlow大模型的高级版本。
相比前代模型,Janus-Pro优化训练策略、扩展了训练数据,模型也更大。
得益于此,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面取得重大进步,同时还增强了文本到图像生成稳定性。
虽然Janus-Pro暂时只能处理384x384分辨率的图像,但考虑到模型如此紧凑”却能达到如此水准,足以令人惊艳。
作为多模态模型,Janus-Pro不仅能文生图,还能对图片进行描述,识别地标景点,识别图像中的文字,并能对图片中的知识进行介绍。