国内大型集体国庆日!国内编程的最强大模型诞
作者:BET356官网在线登录日期:2025/10/15 浏览:
Zhidongxi -Set Li Shuiqing编辑Moying Zhidongxi在9月30日报道说,在国庆日前夕,AI全球竞争骑着一个小峰会,而国内大型模型共同进行了巨大的动议。今天下午,Zhipu AI正式发布了新一代大型型号GLM-4.6。昨晚,DeepSeek还宣布了DeepSeek-V3.2-Exp版本的实验版本发布。大型国内车型的两家顶级公司在当今的国定假日上不放松,并且一直在加班以促进技术的变化。在海洋的另一侧,克劳德十四行诗4.5同时发布,预计Google Gemini 3.0也将在10月进行处理,全球大型竞争模式进入了激烈的舞台。作为Zhipu GLM系列的最新版本,实现了BYGLM-4.6实际编程,长上下文处理,推理功能,信息搜索,写作功能和代理应用程序的全面改进离子及其整体性能超过了DeepSeek-V3.2-Exp。它也是新的“中国最强的编码模型”,据说它使用户能够享受Claude Sonnet 4附近的代码功能,仅为1/7。 Zhidongxi首次对GLM-4.6进行了实际测试,发现其编程能力很棒。与GLM-4.5相比,该代码及其实施的质量及其实施大大提高,并且与Claude Sonnet 4.5和GPT-5相当。同时,它在理解文本,逻辑,内存,获取和代理调用方面的经验有了显着改善。目前,GLM-4.6是在Zhipu Maas BigModel.cn上启动的,并将同时拥抱面部和模型。诸如Cambrian和Moore Thread等国内AI芯片制造商已尽快完成了改编,这标志着国内大型型号和国内芯片的加速发展。经验经验:https://chat.z.a我的技术报告:https://z.ai/blog/glm-4.61。GLM-4.6扫除了八个权威分析,并具有防止新的高位和代币节省30%的编程功能。根据《公约》,让我们首先看一下GLM-4.6评估的结果。在八个功能强大的基准试验中,例如AIME 25,GPQA,LCB V6,HLE和SWE-BENCHER,GLM-4.6的性能要比DeepSeek-V3.2-Exp和Claude Sonnet 4在最有力的列表中的表现更好,并且在国内模型中严格升高。麻省理工学院做到了很难。 GLM-4.5是GLM-4.6生成的先前模型,最初于7月28日发布,这是单个模型中首次获得识别,编码和代理能力的本地融合。代码功能中其余的GLM-4.5性能使Zhipu Maas平台的商业化能够达到10倍以上。 GLM-4.6在此基础上实现了全面的飞跃,不仅设定了新的高On代码功能,但也增加了多年生和降低的数量。昨天,DeepSeek发布的整体性能超过了DeepSeek-V3.2-Exp。这些改进也反映在实际的编程审查中,GLM-4.6也实现了全面的超出。为了测试该模型实际编程活动的能力,Zhishu在Claude代码环境中进行了74台Thoseal-Life Scenario活动编程活动。结果表明,GLM-4.6实际上是超过Claude十四行诗4的测量,并且比其他国内模型更好。就平均令牌消耗而言,GLM-4.6与GLM-4.5相比节省了30%以上,这是类似模型中最低的。为了确保透明度和信誉,Zhipu揭示了所有测试问题和代理轨迹,以验证和复制行业。链接:https://huggingface.co/datasets/zai-org/cc-nench-trajectores 2。实际的测试程序很棒,能够复杂的联系ActivitieS,可与Claude和GPT-5智能事物相提并论,重点是GLM-40编程技能。发现与GLM-4.5相比,这不仅有了显着改善,而且可以达到更复杂的编程任务,其完成率更高,而发电代码和预览对多个任务的质量达到了与Claude Sonet 4.5和GPT-5相当的水平。首先,我们尝试了“旋转六角形弹跳球模拟”。经验发现,GLM-4.6可以准确地模仿旋转容器的作用,质量对碰撞的影响,能量预防现象和动量传递效果,并提供控制选项,例如调整旋转速度,重力控制和摩擦。输入:在旋转的六角形中模拟一个弹跳的球,两个球具有相同的体积,球A的质量是球的两倍。 GLM-4.6输出:当我们将相同的直接单词发送到GLM-4.5时,输出的效果如下。弹球弹出了NG六角形边界,仿真效果不如GLM-4.6好,并且没有更多的控制选项。从这个示例中,我们可以直观地看到GLM-4.6与GLM-4.5相比的形成。如何将GLM-4.6与今天的Claude Sonnet 4.5的最新版本进行比较?如下图所示,这是使其“惊讶”的用户X平台的“提示单词”的一个示例 - 一次创建一个交互式太阳系。用户说,如果在GPT-5上测试了相同的提示,而没有获得有效的代码,则GLM-4.6是否有能力?如下图所示,即使您输入一个非常简单的直接单词,GLM-4.6也会理解抽象单词“交互式”的含义以及天文学“太阳系”的概念,并执行相对准确的模拟。控制台模仿行星在太阳系中的位置和操作至少克劳德十四行诗4.5。输入:创建太阳系的交互式模拟。 GLM-4.6输出:GLM-4.6还可以在SVG动画生成的示例中实现超过GPT-5的理解和编程功能。如下图所示,X平台上的用户使用GPT-5来生产“ Capybara Bicycle”的SVG动画,但是动画并未准确地产生的Capybara,该用户是由用户制造的,因为用户怀疑GPT-5似乎不仅形成了在训练数据中出现的内容,而且也许是因为Capybara无法出现,因此无法出现。我们要求GLM -4.6测试相同的问题,并发现它很快开发了一种准确,逼真的动画 - Animated Spainbara的Animated版本在现实世界附近具有形状,而Capybara则骑着带有手工的车把的自行车座椅,这更准确。输入:SVG,Capybara自行车动画。 GLM-4.6输出:交互式游戏正在尝试大型模型编程的能力。当我们让GLM-4.6提出一个简单的3D射击游戏,GLM-4.6快速开发了736行代码程序。预览是具有三维意义的空间。单击鼠标射击并移动事物,并具有奖励和评分机制的打击效果。输入:用三分JS制作一个简单的3D射击游戏。 GLM-4.6输出:GLM-4.6实现了改进的前部设计,GitHub集成,更长的上下文和其他全栈开发升级,我们也对其进行了测试。我们需要GLM-4.6来制作“群集和基于强度进化的速度”的THEA模拟,该模拟将检查前开发,物理模拟,状态管理,系统体系结构,抽象建模,简化的复杂性和工具链的使用中的许多GLM-4.6功能。如下图所示,GLM-4.6完成了执行的步骤,不仅模仿了快速去除速度类型种群类型的物理定律,而且还通过模块化控制板,模拟控制的形成,提供参数设置,人口A和B的动态指标。前端视觉效果是如此美丽,可以说它“内部和外部”。输入:有两个人群,人口A的重点是发展力量,人口B专注于超速行动。请模仿与这两个人群的接触,并提供解释。视觉状态需要以“小球”的形式模仿。输出:除了经历GLM-4.6代码功能外,我们还证明了GLM-4.6的功能,可以通过AI PPT生产来理解文本,代理调用,获取和多模式。通过多次对话周期,我们认为GLM-4.6的“手与眼睛”功能更有效。它不仅可以准确地了解一代人的要求,而且还可以准确地搜索和完善有关该主题的信息。文本和图像内容与主题紧密相关,在同时,精确地观察到许多对话说明。输入:第1轮:对“当代青年社交的新方式”进行PPT。请产生一个4-P的PPT大纲,其中涵盖了四个主题:“社交”,“ MBTI Social”,“全职儿童”和“追逐社交”。内地2:全职儿童更倾向于家庭关系。请更换有关“城市步行中的社交特征”的内容,并保持格式和深度作为其他页面。第三个旋转:图片相当不变,增加了一些时尚的视觉元素。将一些相关照片添加到4个PPT中。输出:总体而言,我们发现,尽管GLM-4.6仅是GLM-4.5的名称之一,但实际的测试效果非常直观地改善,在某些情况下,其效果比GPT-5和Claude SONNET 4.5更好。国内大型模型的重复速度令人惊讶 - 尤其是我们的情绪一致rday。 3.国内芯片立即适应,国内灯会降低价格并提高质量,AI使更多的人受益。在发布GLM-4.6时,国内AI芯片的制造商迅速响应。寒武纪和摩尔线几乎立即完成了GLM-4.6的改编,国内大型模型和国内芯片的协同效率超出了我们的想象。 GLM-4.6实现了Cambrian领先的国内芯片中FP8+INT4膨胀的混合体积。这是第一个将FP8+INT4模型芯片解决方案放置在国内芯片中。在保持准确性保持不变的同时,理解和创造可行芯片操作大型型号的可行途径的成本大大降低了。同时,摩尔线程基于VLLM推理的Balangkas完成了GLM-4.6的适应。新一代GPU可以以民间FP8的准确性稳定地运行该模型,从而充分验证了Archite的好处在生态和谐和快速适应方面,Musa和全功能GPU的序列。 Cambrian和Moore Thread制造的GLM-4.6和国内芯片的组合将通过Zhipu Maas平台提供即将到来的公共服务和企业。将来,国内原始GLM模型和国内芯片将共存性能和模型培训效率和理解的性能。这种协同效应不仅在技术层面上可以看到,而且还可以从完成用户中受益。随着GLM-4.6的发布,Zhipu同时升级了GLM编码计划,并发布了每月的20元节日套餐,Pusiusers允许该计划在1/7时享受9/10 IQ Claude。同时,它启动了GLM编码计划企业版软件包,该软件包为企业级用户提供了结合安全性,成本效益和国际绩效的编码解决方案。以前订阅了GLM编码计划每月包au的用户脉冲升级GLM-4.6,添加图像和搜索识别功能,并支持10多个主要的编程工具,例如Claude Code,Roo Code,Kilo Code和Cline。 Zhipu还使用Claude Max(20倍)计划提供了三次GLM编码为高频重型开发人员。可以看出,国内大型模型的“质量和降低价格的提高”更为清晰,预计将更快地促进大型模型技术的模式,并更容易。多个开发人员和企业可以以较低的成本享受领导AI功能。结论:在改善型号价格的质量和降低的背后,建筑和国内芯片的升级使Synergy从GLM-4.5到GLM-4.6。 Zhipu AI在短短两个月内就取得了显着的增长,显示出强烈的技术差异。在提高模型质量的同时,价格继续崩溃,使工具的大型模型覆盖了开发人员和企业。这不仅是一个简单的性能改进,而且是加速升级国内大型模型的一般技术体系结构的缩影。国内大型模型与国内芯片之间的深入合作建立了AI的更独立和受控的Tecnology。 Cambrian和Moore的线程已经完成了GLM-4.6的改编,以及使用AI芯片(例如华为和Cambrian)进行的Deptseek改编,该芯片标志着国内AI芯片和切割模型,能够重复一种协调的方式,这为独立基础架构的发展奠定了坚实的基础。
特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。
注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息stor年龄服务。
相关文章