久久99青青,香蕉久久夜色精品国产,国产精品久久久久久妇女 ,激情丁香综合

首頁 > 科技原創 > 科技原創 > Kimi K2 不僅搶了開源第一,還搶了自家論文署名:我“夸”我自己

Kimi K2 不僅搶了開源第一,還搶了自家論文署名:我“夸”我自己

發布時間:2025-07-24 23:09:11

上周,月之暗面發布了全新版本的大模型,Kimi K2。

這是目前世界上第一個參數量達到萬億級別的開源模型,發布后迅速引爆了圈內討論。

它不僅在各種評估基準上表現亮眼,也收獲了國內外開發者社區的普遍好評。

在 LMSYS 的開源模型排行榜(LMArena)上,Kimi K2 直接躍升至第一名。

第一列是開源模型內的排名,前四都是國產開源模型,Kimi K2 排在第一名;第二列是所有(開源和閉源)模型中的排名。圖片來源:https://lmarena.ai/leaderboard/text

但也有不少人質疑 Kimi K2 是在「抄襲」DeepSeek。

Kimi 團隊則大方回應:確實是在 DeepSeek V3 的基礎上做了改進。

甚至有網友直接對比了兩者的架構,指出了細節差異:

Kimi K2 發布后,網友整理 DeepSeek V3 和 Kimi K2 的模型架構區別,來源:https://sebastianraschka.com/blog/2025/the-big-llm-architecture-comparison

就在大家還在討論這些差異、參數規模、以及模型路線時,Kimi 今天又放出了一份干貨:Kimi K2 的技術報告正式發布

我第一時間打開來看,快速掃了一遍,關鍵詞大概是:萬億參數的混合專家模型、讓訓練更穩定的 MuonClip 優化器、不斷被強調的 Agentic 智能,還有自我批評式的通用強化學習……

直到我翻到附錄,發現一張有點意思的作者列表,除了看到月之暗面創始人楊植麟的名字,竟然!

Kimi K2 技術報告作者頁面

Kimi K2……自己也是作者之一?

我突然有點恍惚,把你「造」出來,你還參與了如何「造出你」的論文撰寫?

那我還研究什么,既然它都上作者署名了,直接問他就好了!

我就把這份技術報告交給 Kimi K2 來分析一下,看看它能不能講明白,Kimi K2 到底做了什么。

于是,這篇文章就變成了:我,把技術報告丟給了 Kimi K2,讓它「揭秘」它自己。

Kimi K2:為「智能體時代」奠基的萬億級開源大模型——《Kimi K2 Technical Report》深度解讀

從「會聊天」到「能干活」:為什么需要新一代大模型

過去兩年,大模型的競賽焦點集中在「誰能把考試題刷得更高」,但真實世界的需求正在迅速轉向「誰能像人一樣干活」。

從自動修復代碼漏洞、跨工具協同辦公,到自主完成科研實驗,業界把這種「感知-規劃-執行-反思」的閉環能力稱為 Agentic Intelligence(智能體智能)。

Kimi K2 正是這種范式切換下的第一個系統性成果:它不僅要會做題,更要能在復雜、動態、多工具環境中像「實習生」一樣自我進化。

速看省流版:

技術層面:MuonClip 優化器、稀疏 MoE 架構、改寫數據策略,共同給出了「高質量數據稀缺」時代的超大規模訓練新范式;

數據層面:合成+真實混合環境的十萬個工具軌跡為社區提供了可復現、可擴展的智能體數據生產線;

開源層面:1 T 參數的 base + instruct 權重全部放出,相當于把一輛 F1 賽車開源給了所有工程師。

模型一覽:萬億總參數、320 億激活的「稀疏巨人」

規模:總參數 1.04 T,激活參數 32 B,MoE(混合專家)架構,稀疏度 48(每 token 只激活 8/384 位專家);DeepSeek V3 的參數總量是 6710 億,其中激活參數量為370 億 。

訓練數據:15.5 T token,涵蓋網頁、代碼、數學、知識四大領域,全部經過質量清洗與「改寫法(數據增強技術,增加數據多樣性)」擴增。

訓練穩定:首次在大規模模型訓練過程中,損失函數沒有發生任何大的波動或異常,歸功于新優化器 MuonClip。

上下文窗口:128K token,滿足長文檔、多輪工具調用的需求。

MuonClip:大規模模型超高效訓練方法

Muon 優化器以訓練效率高著稱,但在參數規模較大時,可能會出現注意力權重爆炸的問題,即 logits 值過大,導致訓練不穩定。

作者提出 QK-Clip 機制融合到 Muon 優化器中。QK-Clip 能夠在 logit 過大時,自動進行調節;同時,不會改變網絡結構,對模型干預極小,但作用極大。

注意力權重爆炸問題大多出現在超大規模的大模型訓練中,這也是此次 Kimi K2 萬億參數能夠成功訓練的重要突破之一。

沒有使用 QK-Clip 的 Muon 優化器在訓練時,會無法控制 logits 數值,從而導致大模型訓練的不穩定;而 Kimi K2 的 MuonClip 在整個訓練過程中都可以很好的控制 logits 。

實驗顯示,MuonClip 在中等規模,90 億激活參數時,就可抑制 logits 超過 1000,在 K2 全量訓練中全程沒有不穩定和優化問題出現,始終確保了訓練的穩定性。

文本數據:合成數據+真實數據雙 buff

高質量數據越來越稀缺,而在訓練中簡單多輪重復讀取容易導致模型的過擬合。Kimi K2 提出兩套改寫策略:

知識文本:用 LLM 以不同風格、視角重寫維基百科,同時保持語義一致性自動校驗,例如把「光合作用」改寫成「植物如何制造養分的偵探故事」;

數學文本:按「學習筆記」風格重寫并多語種翻譯,把奧數競賽題都改寫成「費曼式講解」。

數據改寫流程,將輸入拆分為保留上下文的小塊,按順序重寫,然后拼接成完整的重寫段落。

Kimi K2 也在多個實驗進行了測試,結果顯示一次改寫+單輪訓練的準確率(28.94%)優于原始文本反復讀取十輪(23.76%)。

智能體數據:2 萬工具、10 萬軌跡

要讓模型會調用工具,最難的是「可擴展的真實環境」。作者搭建了混合管線:

工具庫:3000+ 真實 MCP 工具,2 萬+ LLM 合成工具,覆蓋金融、城市物聯網、軟件開發等 20 余領域;

「任務-智能體-評估」三元組自動生成智能體訓練樣本:每條生成的軌跡(即模型的輸入、輸出、決策過程、以及所采取的每一步行動)由 LLM Judge 打分,通過率 <10% 時,采用拒絕采樣方法;確保只選擇符合要求的樣本進行進一步的訓練或評估;

真實智能體任務數據補充:例如代碼類任務直接扔給開源的容器編排平臺,執行任務并測試,保證反饋真實。

工具庫使用的數據合成流程,工具來自真實世界的工具和LLMs;智能和任務從工具庫中生成。

最終產出超過 10 萬的高質量軌跡,用于監督微調與強化學習。

強化學習框架:可驗證獎勵 + 自我批評

可驗證獎勵的強化學習:對于數學、代碼、邏輯題等任務,直接跑單元測試或數值驗證,客觀評估模型表現;

自我批評獎勵:而對于非客觀任務(比如寫詩等),模型用 30 多條標準(清晰、客觀、對話流暢、安全等指標)給 Kimi K2 的回答打分,實現無參考答案的對齊;

預算控制:拒絕「廢話連篇」,強制用最少 token 解決問題(節省推理費)。

成績匯報:開源第一,逼近閉源

所有對比均為「非思考」模式,不考慮測試時計算資源的差異。

Kimi K2 在代碼、數學、工具使用和長文本四項關鍵能力上均取得或逼近當前開源模型的最優成績,并在多項任務上超越閉源標桿。

詳細結果圖,從上至下依次是代碼、工具、理工科以及通用任務。

局限與展望

多步復雜推理場景下輸出過長,可能被截斷;

在多輪任務中,如果觸發了錯誤工具,或者工具調用失敗,會拉低表現;

Kimi K2,是「Agentic-aware」模型(接受過 agent 任務訓練),但還不是一個「完整 Agent 框架」系統。在長流程開發任務中的一次成功率,Kimi K2 仍然低于那些完整 Agent 框架驅動下的系統。

Kimi K2 后續將圍繞推理效率、工具自我評估、長過程推理規劃繼續迭代。

Kimi K2 的意義不止于又刷新了幾個 benchmark。可以預料,隨著開源社區在此基礎上繼續改進,2025 下半年將出現一批「比 K2 更會干活」的垂直智能體,真正把大模型從「聊天框」帶進「生產線」。

科技原創更多>>

小米汽車官方披露1月交付數據,單月交付量突破39000臺,行業多家權威媒體同步確認該數據 欣旺達重新提交港股招股書申請:核心經營穩健,IPO進程穩步推進 天齊鋰業終審敗訴!全球最大鋰鹽湖保衛戰敗了 增幅近20%,科思創大幅提升在華TDI產能 福特與通用汽車就向破產供應商First Brands提供預付款融資展開談判 2025款寶騰X50中期改款發布:換裝1.5T四缸發動機 FF阿聯酋工廠交付兩臺FX Super One 新測試表明AI實際辦公準確率不足25%,但進展比想象更快 三菱汽車宣布下任社長人選岸浦惠介,2026年4月1日正式生效 階躍星辰完成超50億人民幣B+輪融資 印奇出任董事長 38歲姚班天才,又有了新身份 王傳福、魏建軍、李斌、李想們,將在2026年進入“超級智力”競賽周期 商業航天搶灘2026:藍箭航天、星河動力、中科宇航三大總工程師同臺披露最新時間表 韓國工業機器人安裝量全球第四 零部件主要從中國進口 蔚來樂道已增投超7309塊全新電池,電池翻倍進度超90% 2025全球汽車集團銷量榜:比亞迪躋身前五 吉利增長飛速 特斯拉申請FSD自動駕駛相關缺陷調查5周寬限期,美監管機構批準 小米18/18 Pro發布節奏確認:9月見 官方確認!ChatGPT答案底部將現廣告,付費用戶免打擾 Steam面向開發者提出新規:應說明游戲中哪些玩家可見內容使用AI 蘋果App Store測試新設計:移除廣告藍色背景 夸爆小米SU7的福特CEO,要花300億梭哈電車 OpenAI全面上線“廉價版”ChatGPT Go訂閱方案:每月8美元 2025年手機銷量基本確定:VIVO第1、小米第2、蘋果第3 日本車企認輸:中國車像智能手機,日本車像翻蓋手機 馬斯克萬萬沒想到,華為吹的牛又實現了,激光雷達降至1000元內 12月新勢力最大黑馬誕生:直接進前3,比小米汽車銷量還高 壁仞虧大了?跑到香港上市,市值僅摩爾線程、沐曦三分之一 被高估的特斯拉:銷量為比亞迪三分之一,市值卻是11倍 感謝華為、寒武紀等廠商努力,中國市場“一英獨大”時代終結
久久99青青,香蕉久久夜色精品国产,国产精品久久久久久妇女 ,激情丁香综合
日韩av影院| 久久亚洲人体| 1024精品一区二区三区| 日韩欧美另类一区二区| 精品久久久久中文字幕小说| 日韩av一区二区在线影视| 亚洲三级毛片| 日韩精品三级| 国产精品一卡| 欧美在线91| 久久gogo国模啪啪裸体| 国产一区二区三区91| 精品一区电影| 精品国产18久久久久久二百| 麻豆国产精品777777在线| 久久91视频| 天堂av在线| 91精品推荐| 精品欧美激情在线观看| 国产女优一区| 另类国产ts人妖高潮视频| aa亚洲婷婷| 日韩欧美中文字幕在线视频| 欧美日韩一区二区高清| 国产欧美日韩精品高清二区综合区| 欧美一区二区三区久久精品| 欧美国产另类| 日韩国产欧美| 亚洲香蕉网站| 日韩中文字幕91| 日韩亚洲精品在线观看| 久久不见久久见中文字幕免费| 久草精品视频| 欧美日韩免费观看视频| 亚洲二区三区不卡| 美女精品网站| 日韩va欧美va亚洲va久久| 国产精品主播| 91精品国产调教在线观看 | 亚洲精品进入| 久久国产麻豆精品| 高清在线一区| 99视频一区| 日本免费在线视频不卡一不卡二| 国产精品99久久久久久董美香| 日韩国产激情| 免费美女久久99| 国产精品第一国产精品| 国产 日韩 欧美一区| 影音先锋国产精品| 日韩高清不卡一区二区| 精品国产aⅴ| 欧美午夜精品一区二区三区电影| 亚洲最大av| 鲁大师精品99久久久| 99久久精品网站| 色综合视频一区二区三区日韩| 精品国产亚洲日本| 波多野结衣一区| 久久国产日韩欧美精品| 日韩一区二区中文| 丝袜脚交一区二区| 国产一区二区亚洲| 中文字幕亚洲影视| 麻豆成人av在线| 米奇777超碰欧美日韩亚洲| 日韩高清不卡一区| 99精品在线免费在线观看| 日韩动漫一区| 91精品99| 久久久久九九精品影院| 亚洲少妇一区| 精品视频亚洲| 亚洲免费资源| 999久久久免费精品国产| 国产亚洲久久| 亚洲精品一区二区在线看| 国产另类在线| 日韩精品一二三| 国产伊人久久| 日本亚洲不卡| 午夜国产精品视频| 精品国产乱码久久久久久樱花| 亚洲精品伦理| 欧美精品一区二区三区精品| 精品免费视频| 日韩不卡一二三区| 国产日韩综合| 亚洲www啪成人一区二区| 国产日产一区| 亚洲伊人精品酒店| 国产99精品| 精品国产亚洲一区二区三区在线| 中文字幕一区日韩精品| 日韩精品欧美| 国产精品对白| 日本午夜精品视频在线观看| 欧美中文日韩| 久久婷婷丁香| 国产96在线亚洲| 国产精品久久久网站| 快she精品国产999| 国精品一区二区| 亚洲午夜天堂| 精品国产18久久久久久二百| 国产一卡不卡| 亚洲精品极品| 亚洲在线网站| 久久一区二区中文字幕| 免费日韩成人| 91午夜精品| 亚洲精品第一| 蜜桃视频免费观看一区| 性欧美69xoxoxoxo| 欧美精品一区二区久久| 久久在线电影| 99视频精品视频高清免费| 国产999精品在线观看| 麻豆中文一区二区| 美腿丝袜亚洲三区| 国产福利资源一区| 欧美aaaaaa午夜精品| 国产精品欧美日韩一区| 日本视频在线一区| 亚洲精品系列| 婷婷精品在线| 亚洲1区在线| 中文字幕视频精品一区二区三区| 伊人成人在线视频| 欧美日韩国产高清| 亚洲欧美日韩一区在线观看| 女主播福利一区| 美女国产精品| 蜜桃久久久久久| 视频精品一区| 日韩国产一二三区| 青青国产91久久久久久| 国产日韩欧美| 久久99视频| 欧美经典一区| 久久精品资源| 欧美xxxx中国| 久久国产直播| 久久理论电影| 精品91久久久久| 亚洲深深色噜噜狠狠爱网站| 中文字幕日韩亚洲| 日本aⅴ亚洲精品中文乱码| 国产日产精品一区二区三区四区的观看方式| 日韩1区2区日韩1区2区| 鲁大师精品99久久久| 日本午夜大片a在线观看| 久久久精品午夜少妇| 性欧美69xoxoxoxo| 亚洲精品黄色| 国产精品视频一区二区三区四蜜臂 | 麻豆理论在线观看| 三级小说欧洲区亚洲区| 最新日韩欧美| 日韩精品一页| 国产精品magnet| 日韩国产一区| 亚洲黄色在线| 日本在线一区二区三区| 欧美精品中文字幕亚洲专区| 精品国产欧美日韩一区二区三区| 日韩精品第一区| 亚洲神马久久| 国产九九精品| 久久久久91| 日韩一区中文| 国产成人精品一区二区三区在线| 久久在线视频免费观看| 亚洲日本欧美| 精品视频91| 一区二区亚洲精品| 久久国产麻豆精品| 99久久激情| 日韩国产一区二| 成人亚洲一区| 国产日韩专区| 老司机精品视频网| 不卡一区2区| 国产精品www.| 欧美天堂亚洲电影院在线观看| 日本午夜精品视频在线观看| 亚洲天堂资源| 亚洲欧美在线专区| 日韩在线不卡| 欧美精品福利| 一区二区三区四区在线看| 日韩av不卡一区二区| 日韩三区免费| 欧美日韩亚洲一区在线观看| 综合日韩av| 亚洲男人在线| 久久免费高清| 国产精品亚洲综合色区韩国| av亚洲在线观看| 麻豆高清免费国产一区|