人工智能

Hugging Face最受欢迎15大AI机构出炉!清华第五,OpenAI第十,冠军竟是它?

字号+作者: 来源:新智元公众号 2023-11-24 14:48 评论(创建话题) 收藏成功收藏本文

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。【新智元导读】Hugging Face作为开源AI社区的代表,总结了社区最欢迎的前'...

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。vUh品论天涯网

【新智元导读】Hugging Face作为开源AI社区的代表,总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里,哪些机构对于开源AI贡献最大。vUh品论天涯网

Hugging Face上最受欢迎的15个AI公司出炉了!vUh品论天涯网

目前的冠军,是Stability AI。vUh品论天涯网

开源英雄Meta AI,取得亚军之位。vUh品论天涯网

而我们熟知的微软、谷歌、OpenAI,分别名列第八、九、十的位置。vUh品论天涯网

图片vUh品论天涯网

15个最受AI开源社区欢迎的公司vUh品论天涯网

截止23年11月24日,榜单如下——vUh品论天涯网

1. Stability AI,20000个赞vUh品论天涯网

2022年AI大爆炸的两个标志性事件,一个是ChatGPT,一个就是Stable Diffusion。vUh品论天涯网

作为开源的图像生成模型,可以说,Stable Diffusion的发布将AI生图提高到了全新的高度,影响不亚于Open AI发布ChatGPT。vUh品论天涯网

Stability AI,就是大名鼎鼎的Stable Diffusion背后的公司之一,掌门人和联合创始人是Emad Mostaque。vUh品论天涯网

不过,他此前有一些不好的传言。vUh品论天涯网

另外,Stability AI也开源了自己的大语言模型——StableLM。vUh品论天涯网

2. Meta AI,20000个赞vUh品论天涯网

实至名归,Llama模型的开源鼻祖,如今大模型领域开源和闭源模型能够分庭抗礼,没有全被OpenAI、谷歌等明星初创公司和大科技公司垄断,Meta AI功不可没。vUh品论天涯网

也因此,小扎被公认为「开源英雄」,而图灵三巨头之一的Yann LeCun,在Meta也起着定海神针的作用。vUh品论天涯网

虽然排名第二,但是赞数和第一完全没有差距。可以说Meta AI就是最受开源社区欢迎的AI公司。vUh品论天涯网

正所谓,「开源AI社区共一石,Meta独占八斗」。如果没有Meta和LeCun对于AI开源社区的贡献,整个AI行业的格局都会完全改变。vUh品论天涯网

整个AI行业和开源AI的未来的发展,某种程度上都要倚仗LeCun和小扎继续真金白银的投入,以及不断地摇旗呐喊。vUh品论天涯网

3. Runway,11000个赞vUh品论天涯网

视频生成工具Gen-2,已经成为生成式AI视频领域的标杆,每次一发布更新,都能引起业内不小的震撼。vUh品论天涯网

图片vUh品论天涯网

从三无青年到15亿美元独角兽CEO,Runway CEO的故事,不过是又一个「平平无奇」的硅谷神话。vUh品论天涯网

2018年,Cris Valenzuela(CEO)、Anastasis Germanidis和Alejandro Matamala-Ortiz 在纽约创办Runway, 今年5月,Runway已完成了1.41亿美元的C轮融资,估值达到15亿美元。vUh品论天涯网

4. CompVis,10000个赞vUh品论天涯网

Stable Diffusion,是Stability AI、RunwayML、LMU Munich、EleutherAI 和LAION的研究人员合作的结果。vUh品论天涯网

在CompVis领导下的Stable Diffusion V1,改变了开源AI模型的性质,在全球范围内催生出了数百个其他模型和创新。vUh品论天涯网

Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach领导了这个项目,他们在海德堡大学CompVis小组的研究奠定了这个项目的基础。vUh品论天涯网

在海德堡大学,他们创建了广泛使用的VQGAN和Latent Diffusion。这两个模型再加上OpenAI和Google Brain的成果,使Stable Diffusion得以实现。vUh品论天涯网

5. 清华KEG,7,000个赞vUh品论天涯网

清华KEG实验室,一直是国内AI技术的领头羊。vUh品论天涯网

中国顶尖开源大模型ChatGLM2-6B,可以说是清华系的ChatGPT,由清华知识工程研究室和智谱AI训练。vUh品论天涯网

图片vUh品论天涯网

ChatGLM2-6B允许免费商用后,我国的开源大模型也开启了「安卓时刻」。vUh品论天涯网

而清华系17人,则直接撑起了中国大模型创业的半壁江山。vUh品论天涯网

6. BigScience,7,000个赞vUh品论天涯网

BigScience Research Workshop,不是正式成立的实体,而是由HuggingFace、GENCI和IDRIS发起的开放式协作组织,以及一个同名的LLM研讨会,汇聚了全球1000+研究人员。vUh品论天涯网

这1000多名志愿研究者,在BigScience项目中创建了拥有1760亿参数的模型BLOOM。vUh品论天涯网

图片vUh品论天涯网

BLOOM是BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的缩写,全名代表着大科学、大型、开放科学、开源的多语言大模型。vUh品论天涯网

7. 阿联酋技术创新研究所,7000个赞vUh品论天涯网

阿联酋技术创新研究所隶属于阿布扎比政府先进技术研究委员会 (ATRC) ,负责监督酋长国的技术研究。vUh品论天涯网

2023年9月6日,阿联酋(UAE)技术创新研究所(TII)推出Falcon180B,再次突破生成式AI的界限。vUh品论天涯网

Falcon180B拥有惊人的1800亿参数,经过3.5万亿个token的训练,在预训练LLM的HuggingFace排行榜上名列前茅。甚至,它在各种基准测试中,都胜过了Meta的LaMA2这种级别的竞争对手,包括推理、编码、熟练程度和知识测试。vUh品论天涯网

图片vUh品论天涯网

而且作为第一个有影响力的不限制商用的开源模型,Falcon用中东金主爸爸的豪气,把开源模型的限制彻底打下来了。vUh品论天涯网

这就不奇怪为什么开源社区对他们好感爆棚。vUh品论天涯网

8. 微软,6500个赞vUh品论天涯网

在ChatGPT大爆发之后,突然化身「创业公司」的微软,成为了硅谷大厂中今年最亮的一颗星。vUh品论天涯网

微软快速跟进,利用大模型能力改造了Bing,加班加点推出Copilot,并把他们塞进了自家的拳头产品Office和Windows之中,给科技圈秀了一把这家「年近50」科技巨头的「狼性」。vUh品论天涯网

图片vUh品论天涯网

另一边,微软Azure作为云计算行业的头部玩家,无缝驶入了AI算力需求的快车道。vUh品论天涯网

他们和Meta合作,对Llama2等开源模型提供的良好支持,也进一步刷了一波在开源社区的好感度和存在感。vUh品论天涯网

在最近的OpenAI惊天宫斗系列剧中,微软差点通过「OpenAI0元购」,成为了AI赛道的「终极寡头」。vUh品论天涯网

9. Google AI,6000个赞vUh品论天涯网

作为对于AI技术投入最早也最大的科技巨头,谷歌在AI社区中的影响力不用怀疑。vUh品论天涯网

图片vUh品论天涯网

从AI基础研究到AI产品,谷歌早已浑身上下都流淌着AI的血液。vUh品论天涯网

DeepMind在强人工智能领域不断地取得令人瞩目的突破,谷歌云作为AI算力提供商是AI行业的基础设计建设中最重要的一环。vUh品论天涯网

虽然谷歌Bard和Palm大模型暂时在竞争之中不占优势,但传说中的Gemini似乎迟早要将谷歌拉回AI行业舞台的最中心。vUh品论天涯网

图片vUh品论天涯网

而对于开源社区的发展,谷歌的贡献同样功不可没,无数的开源项目已经成为AI开源社区的基石。vUh品论天涯网

图片vUh品论天涯网

10. OpenAI,4000个赞vUh品论天涯网

作为AI行业今年大爆发的直接引领者,OpenAI的地位是毋庸置疑的。vUh品论天涯网

虽然被调侃为「ClosedAI」,但是OpenAI对于AI开源社区的贡献也是有目共睹的。vUh品论天涯网

Whisper作为开源且性能最好的语音识别模型,几乎所有相关的从业人员都能从中受益。vUh品论天涯网

图片vUh品论天涯网

希望刚刚结束了「权游」的OpenAI,能继续瞄准AGI,为整个AI行业开拓上限。vUh品论天涯网

11. BigCode Project,4,000个赞vUh品论天涯网

BigCode是一个开放的科学合作组织,致力于为编码应用程序进行负责任的LLM训练。vUh品论天涯网

他们的主要工作有——vUh品论天涯网

StarCoder,一种最先进的代码语言模型。vUh品论天涯网

图片vUh品论天涯网

BigCode项目中的StarCoder,是一个160亿参数的模型,它使用了80多种编程语言、GitHub问题、Git提交和Jupiter 笔记本的一万亿个token。vUh品论天涯网

StarCoder可以通过聊天进行微调,创建一个性化的编码助手StarChat。vUh品论天涯网

另外还有OctoPack,用于指令调优大型代码模型的工件;The Stack,最大的可用预训练数据集,具有外围代码;SantaCoder,一个1.1B参数的代码模型。vUh品论天涯网

12. MosaicML,4000个赞vUh品论天涯网

在今年6月被DataBrick斥资13亿刀收购的独角兽MosaicML,非常引人瞩目。vUh品论天涯网

从此,MosaicML的生成式AI平台和Databricks的数据管理能力结合,将形成双赢。vUh品论天涯网

这家公司创立于21年,仅有62人。vUh品论天涯网

创始人Naveen Rao是创办的第一家公司Nervana Syatems,被英特尔收购。另一位创始人Hanlin Tan,是一位连续创业者,曾创立云计算公司,以及在谷歌、微软和英特尔担任职位。vUh品论天涯网

MosaicML提供了一些开源、可商用的LLM,比如MPT模型。vUh品论天涯网

MPT-7B和MPT-30B两个模型,是目前最先进的开源、可商用的LLM之一。vUh品论天涯网

图片vUh品论天涯网

13. UKP Lab,3000个赞vUh品论天涯网

UKP Lab(无处不在的知识处理实验室)由Iryna Gurevych教授于2009年创立,是达姆施塔特工业大学计算机科学系的一部分。vUh品论天涯网

UKP Lab在自然语言处理(NLP)方面开展前沿研究,重点关注大型语言模型、对话式人工智能、问答、跨文档NLP以及新颖的数据集和问题定义。vUh品论天涯网

14. EleutherAI,3000个赞vUh品论天涯网

EleutherAI成立于2020年7月,由Connor Leahy、Sid Black和Leo Gao创立,从一个讨论GPT-3的Discord服务器,发展成为一个专注于大规模人工智能研究的非营利性研究机构。vUh品论天涯网

现在,它是是一个开源的社区人工智能项目,旨在创建一个完全去中心化的、具有自治文明的单例人工智能。任何能连接互联网且有GitHub帐户的人都可以参与。vUh品论天涯网

2021年,EleutherAI发布了The Pile,是一个825GB的多样化文本数据集。vUh品论天涯网

2021年6月,EleutherAI公布了GPT-J,它是一个60亿参数的模型,在Pile上训练。发布时,它是世界上最大的公开GPT-3风格的语言模型。vUh品论天涯网

随着GPT-NeoX的出现,EleutherAI计划将参数一直提高到1750亿,发起了争夺最大GPT-3模型的挑战赛。vUh品论天涯网

2023年4月,它发布了Pythia系列大模型。vUh品论天涯网

15. Salesforce,3000个赞vUh品论天涯网

Salesforce,是创建于1999年3月的一家客户关系管理(CRM) 软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台。vUh品论天涯网

创始人是Marc Benioff。27岁时,他就成为Oracle历史上最年轻的高级副总裁。vUh品论天涯网

正是因为预见到,会有越来越多的企业通过互联网得到软件服务,他才选择离开Oracle,在37岁时创立Slesforce。vUh品论天涯网

他提出了云计算和SaaS的理念,被誉为「软件终结者」。vUh品论天涯网

当下Salesforce正在推出AI功能,试图将人工智能整合到办公空间即时通讯应用Slack等产品中,并为销售人员等推出了一款名为Einstein GPT的生成式人工智能产品。vUh品论天涯网

Benioff称,「我们非常渴望确保Salesforce成为第一大人工智能CRM。」vUh品论天涯网

参考资料:vUh品论天涯网

https://twitter.com/osanseviero/status/1727260746289905920vUh品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]

相关文章