人工智能

DeepSeek多模态Janus-Pro-7B模型发布并开源击败OpenAl DALL-E3

字号+作者：新浪科技来源：新浪科技 2025-01-28 08:51 评论(创建话题) 收藏成功收藏本文

深度求索（DeepSeek）创始人梁文锋深夜发文官宣，DeepSeek刚刚发布并开源了一款名为Janus-Pro-7B的多模态AI模型，可以生成图像。据梁文锋介绍，在GenEval和DPG-B'...

深度求索（DeepSeek）创始人梁文锋深夜发文官宣，DeepSeek刚刚发布并开源了一款名为Janus-Pro-7B的多模态AI模型，可以生成图像。据梁文锋介绍，在GenEval和DPG-Bench基准测试中，Janus-Pro-7B击败了OpenAI的DALL-E3和StableDiffusion。”7Ag品论天涯网

就在今日凌晨，DeepSeek工程师们已经在HuggingFace平台上传了JanusPro7B和1.5B模型。这俩模型是去年DeepSeek10月发布的Janus模型升级版。7Ag品论天涯网

据DeepSeek介绍，Janus-Pro是一个新颖的自回归框架，统一了多模态理解和生成。Janus-Pro是基于DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base模型构建的。7Ag品论天涯网

在多模态理解任务中，Janus-Pro采用SigLIP-L作为视觉编码器，支持384x384像素的图像输入。而在图像生成任务中，Janus-Pro使用一个来自特定来源的分词器，降采样率为16。7Ag品论天涯网

7Ag品论天涯网

AI 人工智能

本网除标明“PLTYW原创”的文章外，其它文章均为转载或者爬虫(PBot)抓取；本文只代表作者个人观点，不代表本站观点，仅供大家学习参考。本网站属非谋利性质，旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的，可来信联系本站删除。本站邮箱[email protected]