这首先嘛,当然是为了赚个好名声:
Grok 4作为前车之鉴,其能力越强,人们的评价标准或预期也会随之提升,这往往会导致负面评价的数量增加。
另一大好处在于能借助开源社区的力量完善技术生态。
K2开源仅仅不到24小时,社区便迅速涌现了多种相关实现,包括适用于Mac设备进行训练与部署的MLX版本,以及4bit量化技术等。
要知道K2这次开源的模型版本有两个:
光靠Kimi内部,一些后续开源工作确实难以快速实现。
不过最最重要的是,开源能够倒逼模型进步。
开源之后,开源模型的效果必须确保“可重复验证”,不能依赖各种手段来掩盖问题。只有当任何人获得相同的权重后都能轻松地重现出相同的结果,这样的模型才算真正稳固可靠。
与此同时,他亦对众人有关Kimi在市场营销和流量引入方面能力出众的传闻作出了回应。
自今年年初起,Kimi便已停止了流量投放。具体来看,在国内众多应用商店中,搜索Kimi的用户甚至无法在首页找到相关信息;而在苹果App Store以及国内各大搜索平台上,搜索结果则会优先推荐其他竞争对手。
年初DeepSeek-R1的爆火让他们认识到,强大的技术实力是最佳的推广手段,只要模型质量上乘,便能在市场上赢得认可。
甚至他还透露了一个细节:
就是说,Kimi是少数还在坚持投入基础模型研发的创业公司。
即便在Agent项目大红大紫之际,面对外界对Kimi不应投身于大型模型开发,而应专注于Agent产品研发的质疑,Kimi依然坚定地维持着自己的选择。
Kimi工程师强调,在Claude的支持下,绝大多数Agent产品才能发挥其应有的作用,否则将变得毫无价值。
除却前述两点,该工程师还指出,Kimi团队在产品开发以及基础技术构建方面进行了深入的思索。
自Claude 3.5版本起,AI在前端编写方面的能力已基本实现实用化。然而,传统聊天机器人输出的Markdown格式,往往难以满足将内容排版成一张A4纸的具体要求。
因此,在上个月推出的Kimi Researcher功能中,尝试采用了除纯文本以外的交互方式。
随着AI系统将输出形式从“文字”切换至“前端页面”,人机交互体验实现了质的飞跃,呈现出全新的面貌。
除此之外,Kimi团队原本计划在强化学习(RL)的框架内,结合MCP的真实工具对AI进行训练,然而,由于部署过程中的困难以及登录权限的限制,这一尝试最终未能成功。
团队调整了策略,考虑到预训练模型已经“接触”了众多API调用,实际上已经掌握了工具使用的相关知识,所以关键是要激发这种潜能。
随后,他们借助多智能体技术,成功构建了丰富的工具调用数据集,即便无需大量的人工标记,也能实现出色的训练效果。
更多细节也将在之后的技术报告中详细揭秘。
Kimi K2作为Kimi最新推出的MoE基础模型,其总参数量达到了1T,激活参数则有32B,在代码、Agent以及数学推理等任务上均展现出卓越的表现。
此外,所遵循的依然是经过修订的麻省理工学院许可证(修订版MIT协议)。
MIT协议堪称相当宽容的协议(几乎可以说是随心所欲使用)。Kimi的改动则体现在,一旦以Kimi K2为基础开发的产品或服务,其月度活跃用户数超过一亿,或是月度收入突破了两千万美元,那么便必须在相应的用户界面中标注“Kimi K2”。
Kimi K2,这款在风格上做出重大转变,采纳了开源策略的产品,自亮相以来便迅速吸引了众多目光。
那么,Kimi K2真实能力究竟如何呢?我们这就实测一下。
实测一下Kimi K2
具体实测的方向,咱们直接从广大网友cue到的K2亮点展开:
针对前端开发领域,我们选取了经典游戏“打砖块”作为案例,旨在比较Kimi的原始模型与Kimi K2版本之间的性能差异。

输入“构建一个基础版的breakout游戏,并以单一HTML页面形式呈现”至Kimi的原始模型后,其生成的结果呈现如下:
在代码之下还“附赠”了游戏说明:
按照指示,将代码保存为.html文件,打开后是这样的:
画面十分简洁,缺乏任何指示,仅通过键盘上的左右上下键进行操作,一旦角色坠落,屏幕便会显现“游戏结束”的字样,即便所有方块都已消失,这一提示也不会改变。
然而,一旦采用K2模型,其输出的结果会显得相当复杂(同时,生成速度也显著降低):
Kimi的输出仅有4KB,而K2模型的输出则是10.7KB,这比前者多出了2.6倍。
画面与玩法得以大幅丰富,新增了得分与生命机制,同时操作方式也转变为使用鼠标进行。
尽管与网友所展示的有所出入,然而至少,它的外观现在已颇具雏形。
而我们只用了一句话作为提示:
既然这种简单的breakout游戏表现优异,那么尝试换为更为复杂的贪吃蛇游戏又会如何呢?
在这场演示中,它详细阐述了游戏的特色与操作方法(而之前基于K2构建breakout游戏时,仅呈现了代码):
将文件保存为.html格式,第一次生成的效果实在是……令人失望!几乎每次打开都需要重新开始,这绝对不是我操作不熟练的表现!
迫不得已,咱在原有的对话下加入了新的要求:
耗时约三分钟,系统成功生成了全部代码,并附上了相应的修改说明。
结果显示,这次的贪吃蛇游戏在速度和难度上都有了很大的改进:
至于工具调用功能,让我们本土化一点,这么近那么美。
它给出了这样的结果:
居然!每一个步骤都很详细,并且可以直接点击链接跳转!?
可以说是很高效了!
对于K2的创意写作特性,网友们显然提出了不少独到见解:他们建议K2能够撰写一封告别的信件。
于是,我们也试着让K2写一封“给宇宙和自己最后的告别信”。


Copyright C 2018All Rights Reserved 版权所有 丽水招聘网 鄂ICP备2025091810号-6
地址:丽水市经济开发区生态产园集聚区 EMAIL:
Powered by PHPYun.