HI!欢迎登录财华智库网

专注港股20年,做最有深度的原创财经资讯

其它登录方式

HI!欢迎注册财华智库网

专注港股20年,做最有深度的原创财经资讯

其它登录方式
开源大模型

开源大模型

零一万物回应大模型架构争议:其研发大模型基于GPT成熟结构 对模型和训练的理解做了大量工作

11月14日,据《科创板日报》讯,李开复旗下AI企业零一万物开源大模型被指责完全使用LLaMA的架构 ,只对两个张量(Tensor)名称进行修改。对此,零一万物表示:GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。

2023-11-14 16:11

华为云昇腾AI云服务百模千态专区上线 收录业界主流开源大模型

9月20日,华为云官微宣布正式面向全球企业和开发者上线昇腾AI云服务“百模千态”专区。据介绍,专区收录了业界主流开源大模型,并全面基于昇腾AI云服务进行适配和优化。(财联社)

阿里云:已有15款支持中文的开源大模型在魔搭社区上线

6月15日,阿里云微信公众号发布,2023开放原子全球开源峰会上,阿里云公布1+4开源战略,在操作系统、云原生、数据库、大数据四大开源领域之外,AI模型社区魔搭首次亮相。目前已有15款支持中文的开源大模型在魔搭社区上线。

2023-06-15 16:04

润和软件:公司AI中枢平台可以利用语料工程对接商业大模型

5月24日,润和软件(300339.SZ)在互动平台表示,公司的AI中枢平台可以利用语料工程对接商业大模型,也可以支持对接各类开源大模型。为了保障NLP大模型的可持续供应,公司还将布局NLP基础大模型的自主可控,基于现有开源大模型LLaMA、ChatGLM、OPT、T5等基础上,利用Topic-Guided Red-Teaming Self-Instruct、Principle-Driven Self-Alignment、Principle Engraving、Verbose Cloning等模型训练技术掌握自主可控大语言模型,为企业用户提供可私有化部署的大模型能力,相关最新进展请您以公司的官方信息为准。公司目前已与智能装备企业在工业、智能制造等领域进行合作。

2023-05-24 14:23

1998-2024深圳市财华智库信息技术有限公司 版权所有
经营许可证编号:粤B2-20190408
粤ICP备12006556号