欢迎光临,我们是一家专注中小型企业营销推广服务的公司!

咨询热线:400 9868 577
淮南兰乔电子商务有限公司
新闻中心News
淮南兰乔电子商务有限公司

xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制

作者:聖光之護 | 点击: | 来源:聖光之護
1811
2025
马斯克旗下的AI公司xAI正式发布Grok4.1,宣称该模型在对话智能、情感理解与实际应用能力方面实现了全新突破,重新定义了行业标杆。目前,Grok4.1已登陆grok.com以及iOS和Android应用平台,用户可通过模型选择器手动切换至“Grok4.1”模式使用。据官方介绍,Grok4.1在创造力、情感交互能力与协作性能上均有显著增强,同时延续了此前版本所具备的高智商与稳定性。为达成这些进步,xAI在Grok4大规模强化学习的基础上,进一步优化了模型的“...

马斯克旗下的 ai 公司 xai 正式发布 grok 4.1,宣称该模型在对话智能、情感理解与实际应用能力方面实现了全新突破,重新定义了行业标杆。目前,grok 4.1 已登陆 grok.com 以及 ios 和 android 应用平台,用户可通过模型选择器手动切换至 “grok 4.1” 模式使用。

据官方介绍,Grok 4.1 在创造力、情感交互能力与协作性能上均有显著增强,同时延续了此前版本所具备的高智商与稳定性。为达成这些进步,xAI 在 Grok 4 大规模强化学习的基础上,进一步优化了模型的“风格表达、人格化特征、辅助性功能及对齐机制”。此次升级特别引入了一种创新方法:采用“先进的代理式(agentic)推理模型”作为奖励模型,使其能够自主评估响应质量,并实现大规模迭代优化。

Grok 4.1 技术亮点与基准测试表现

  • 在 LMArena 的 “Text Leaderboard” 测试中,Grok 4.1 的“思考模式”(代号 quasarflux)取得了 1483 Elo 分的成绩,领先于所有非 xAI 开发的模型;其“非推理模式”(代号 tensor,即无思考 tokens 的即时回复模式)也达到 1465 Elo,超越其他模型在完整推理配置下的表现。
  • 在情感

    智能测评(EQ-Bench3)中,Grok 4.1 展现出更强的共情能力、心理洞察力和人际互动水平。
  • 创意写作评测(Creative Writing v3 benchmark)结果显示,新模型的语言更具角色个性,情感表达更丰富,叙事张力明显提升。
  • 在降低“幻觉”现象(即对事实问题给出错误回答)方面亦取得进展。特别是在“非推理模式”下结合搜索工具时,幻觉率显著下降。这一改进通过 FActScore(生物传记类问题基准)得到了验证。

了解更多:https://www./link/8f94f061698ba1df2c83661cd4ab9000

源码下载地址:点击获取

相关推荐
我要咨询做网站
成功案例
建站流程
  • 网站需
    求分析
  • 网站策
    划方案
  • 页面风
    格设计
  • 程序设
    计研发
  • 资料录
    入优化
  • 确认交
    付使用
  • 后续跟
    踪服务
  • 400 9868 577
    info#ilanqiao.cn
Hi,Are you ready?
准备好开始了吗?
那就与我们取得联系吧

咨询送礼现在提交,将获得兰乔电子商务策划专家免费为您制作
价值5880元《全网营销方案+优化视频教程》一份!
下单送礼感恩七周年,新老用户下单即送创业型空间+域名等大礼
24小时免费咨询热线400 9868 577
合作意向表
您需要的服务
您最关注的地方
预算

直接咨询