【财华社讯】4月30日,小米大模型团队通过“Xiaomi MiMo”公众号发布,今天,小米开源首个为推理(Reasoning)而生的大模型「Xiaomi MiMo」,联动预训练到后训练,全面提升推理能力。在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI 的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。据介绍,MiMo来自全新成立不久的「小米大模型Core团队」的初步尝试。
【财华社讯】2月27日,云天励飞(688343.SH)在互动平台表示,公司的推理芯片和加速卡目前已经支持适配云天书、通义千问、百川智能、智谱清言、Meta等30+开源大模型,涵盖1.5B参数到70B参数量,预期能使大模型推理成本大幅度下降。
【财华社讯】盛业(06069.HK)公布,集团自主研发的“盛易通云平台”与国产开源大模型DeepSeek完成深度融合。集团将通过高质量的产业数据训练提升大模型对产业的理解,不仅为中小微企业提供更精准、高效的普惠金融服务,还将在供应商管理智能化、供应链业务流程自动化、进销存智能决策支持等方面积极探索,研发并输出智能的供应链赋能能力,携手产业供应链合作伙伴实现数智化发展。
【财华社讯】2月10日,数码视讯(300079.SZ)在互动平台表示,公司已基于DeepSeek-R1开源大模型完成接入及本地化部署,对公司经营和业绩尚无显著影响,请投资者注意投资风险。
【财华社讯】2月8日,据“工信微报”微信公众号消息,2025年春节期间,基础电信企业积极利用AI开展创新服务,融合其在5G、云平台、大数据等方面能力,多领域布局,拓展AI应用场景,丰富AI应用供给。积极利用AI赋能,为春节注入现代科技活力,中国移动推出AI“一图变装”等36种AIGC玩法,用户规模超千万;中国电信借助数字人高效交互能力,为客户带来便捷的全新体验。运用AI、5G技术助力企业数字化能力提升,春节期间提供百亿次高精定位服务调用,助力车企提供智驾车辆春运导航;提供春节语音质检服务,提升金融企业对疑似涉诈等的检测能力;打造云电脑,支持企业随时随地高效办公。运用AI、大数据技术助力政府治理能力提升,中国联通开展春运、景区客流的实时监测与动态研判分析,对重点设施等进行全天候智能监控,对春节假期消费情况和节后复工复产开展分析,深度赋能2025年春运、文旅、安全、经济等多项工作。力推最新AI技术普惠应用,三家基础电信企业均全面接入DeepSeek开源大模型,实现在多场景、多产品中应用,针对热门的DeepSeek-R1模型提供专属算力方案和配套环境,助力国产大模型性能释放。
11月14日,据《科创板日报》讯,李开复旗下AI企业零一万物开源大模型被指责完全使用LLaMA的架构 ,只对两个张量(Tensor)名称进行修改。对此,零一万物表示:GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。
6月15日,阿里云微信公众号发布,2023开放原子全球开源峰会上,阿里云公布1+4开源战略,在操作系统、云原生、数据库、大数据四大开源领域之外,AI模型社区魔搭首次亮相。目前已有15款支持中文的开源大模型在魔搭社区上线。
5月24日,润和软件(300339.SZ)在互动平台表示,公司的AI中枢平台可以利用语料工程对接商业大模型,也可以支持对接各类开源大模型。为了保障NLP大模型的可持续供应,公司还将布局NLP基础大模型的自主可控,基于现有开源大模型LLaMA、ChatGLM、OPT、T5等基础上,利用Topic-Guided Red-Teaming Self-Instruct、Principle-Driven Self-Alignment、Principle Engraving、Verbose Cloning等模型训练技术掌握自主可控大语言模型,为企业用户提供可私有化部署的大模型能力,相关最新进展请您以公司的官方信息为准。公司目前已与智能装备企业在工业、智能制造等领域进行合作。
1998-2025深圳市财华智库信息技术有限公司 版权所有
经营许可证编号:粤B2-20190408
粤ICP备12006556号