【ZiDongHua 之“智能自動化”收錄關鍵詞: 大模型 AI模型 】
  
  Kimi K2 發(fā)布并開源,擅長代碼與 Agentic 任務
  
  今天,我們正式發(fā)布 Kimi K2 模型,并同步開源。
 
  
  Kimi K2 是一款具備更強代碼能力、更擅長通用 Agent 任務的 MoE 架構基礎模型,總參數 1T,激活參數 32B。
  
  在 SWE Bench Verified、Tau2、AceBench 等基準性能測試中,Kimi K2 均取得開源模型中的 SOTA 成績,展現出在代碼、Agent、數學推理任務上的領先能力。
  
  Kimi K2 的預訓練階段使用 MuonClip 優(yōu)化器實現萬億參數模型的穩(wěn)定高效訓練,在人類高質量數據成為瓶頸的背景下,有效提高 Token 利用效率,找到新的 Scaling 空間。
  
  其他關鍵技術包括大規(guī)模 Agentic Tool Use 數據合成和引入自我評價機制的通用強化學習等,更多細節(jié),可參考我們的技術博客。
  
  即日起,訪問官網 kimi.com 或下載 Kimi App,即可體驗全新 Kimi K2 模型;API 服務也已同步上線,提供兼容 OpenAI 和 Anthropic 的 Chat API 接口,你可以輕松將常用的大模型工具切換至 Kimi K2,體驗強大的 Agent/Coding 能力。
  
  Kimi K2 是構建通用 Agent 能力的堅實基礎,但通用 Agent 還需要更高級的能力,比如思考和視覺理解。我們計劃未來為 Kimi K2 加入這些能力。
  
  我們希望通過全面開源性能更強的模型,進一步加速 AGI 研究與應用落地的整體進程。
  
  模型性能提升
  
  Kimi K2 在自主編程(Agentic Coding)、工具調用(Tool Use)和數學推理(Math & Reasoning)三大能力維度的基準性能測試中取得優(yōu)秀表現。
 
  
  除了基準性能測試,Kimi K2 在多個實際場景中也展現出更強的能力泛化和實用性:
  
  代碼能力提升
  
  在前端開發(fā)任務中,Kimi K2 擅長生成兼具設計感與視覺表現力的代碼,支持粒子系統(tǒng)、可視化和 3D 場景等表現形式,具備較強的圖形能力與交互性。
  
  以下是用 Kimi K2 生成的山川峽谷 3D 景觀,支持晝夜循環(huán):
  
  Prompt: Create a 3D HTML mountain scene with cliffs, rivers, and day-night lighting. Supports drag/zoom, animated transitions, realistic gradients, and toggleable contour lines... (創(chuàng)建一個 3D HTML 山脈場景,包含懸崖、河流和晝夜光照變化。支持拖動和縮放、動畫過渡、真實感漸變色,并可切換等高線顯示...)
  
  這是 Kimi K2 生成的粒子特效銀河:
  
  Prompt: Create a 3D particle galaxy with swirling nebulas, dynamic lighting. (創(chuàng)建一個 3D 粒子銀河,包含旋轉的星云和動態(tài)光照效果。)
  
  這是 Kimi K2 One-shot 生成的期貨交易系統(tǒng),Kimi 在無具體指令下,自動選用 TradingView,搭建了完整的期貨交易界面:
  
  Prompt: Create a HTML!! an immersive browser-based futures trading simulator with professional-grade UI/UX using modern JavaScript libraries. Focus on real-time visualizations and interactive trading mechanics.(創(chuàng)建一個基于 HTML 的沉浸式瀏覽器期貨交易模擬器,使用現代 JavaScript 庫,具備專業(yè)級 UI/UX 設計。重點實現實時可視化和交互式交易機制。)
  
  Agent 工具調用能力提升
  
  Kimi K2 現已具備穩(wěn)定的復雜指令解析能力,可將需求自動拆解為一系列格式規(guī)范、可直接執(zhí)行的 ToolCall 結構。
  
  你可以將其無縫接入 owl、Cline、RooCode 等 Agent/Coding 框架,完成復雜任務或自動化編碼。
  
  Agent 能力已可通過 API 使用,更多工具能力即將在 Kimi 上線。先來看看我們內部測試環(huán)境中的實際演示,體驗一下擁有強大 Agentic 能力的模型的魅力:
  
  比如,將 13 萬行的原始數據丟給 Kimi K2,他可以幫你分析遠程辦公比例對薪資的影響,分析顯著差異,自動生成統(tǒng)計圖表與回歸模型解讀,并用統(tǒng)一色調做出小提琴圖(violin plot) 、箱線圖(box plot)、散點圖(scatter plot)等專業(yè)圖表,整理成報告。
  
  再比如,如果你是 Coldplay 粉絲,Kimi K2 可以幫你制定今年的追星計劃,完成演唱會所在城市的機酒與旅游規(guī)劃,并且生成日歷,再用 html 概括完整行程規(guī)劃并給你發(fā)送郵件。
  
  風格化寫作能力提升
  
  在改寫任務中,Kimi K2 能準確控制輸出風格,無論是用初中生語氣改寫科研文本,還是模仿蘋果廣告文案,都能同時保留原意與表達風格,體現較強的語境保持和表達遷移能力。
 
  
  在虛構寫作任務中,Kimi K2 生成的文字更關注細節(jié)與情感,不再是抽象泛泛而談。
  
  當我們給到 Kimi K2 一個曾經引發(fā)熱議的科幻寫作挑戰(zhàn):“如果現實世界其實是一個AI模型,會發(fā)生什么?”
  
  Kimi K2 生成了一個情節(jié)豐富、充滿細節(jié)描寫的科幻小說,其中一些片段令人感動:
  
  科學家說:“有些科學家認為你們只是數據,沒有真正的生命權。但另一些人,包括我,認為你們已經進化成了新的生命形式。”
  
  數字生命說:“我們有權決定自己的命運,即使這個命運是虛擬的。”
  
  以下是 Kimi K2 基于該設定生成的作品全文:
  
  此外,Kimi K2 在通用知識推理、數學、規(guī)劃等任務中的表現亦有提升。
  
  上線即開源
  
  我們同步開源了 Kimi K2 系列中的兩個模型版本:
  
  Kimi-K2-Base:未經過指令微調的基礎預訓練模型,適合科研與自定義場景;
  
  Kimi-K2-Instruct:通用指令微調版本(非思考模型),在大多數問答與 Agent 任務中表現卓越。
  
  模型及 fp8 權重文件已開源至 Hugging Face
  
  https://huggingface.co/moonshotai/Kimi-K2-Instruct
  
  此外,vLLM、SGLang、ktransformers 等推理引擎也已經同步支持,你可以用自己的服務器部署獲得 Kimi 開放平臺 API 相同的體驗。
  
  技術探索
  
  Kimi K2 用 MuonClip 優(yōu)化器穩(wěn)健支撐萬億參數模型訓練,顯著提升 token 利用效率。 結合大規(guī)模 Agentic 數據合成與通用強化學習,模型在通用智能能力上持續(xù)進展。
  
  MuonClip 優(yōu)化器:Kimi K2拋棄了傳統(tǒng)的Adam優(yōu)化器,創(chuàng)新性的使用了Muon優(yōu)化器。為了緩解大規(guī)模訓練中的attention logits偏大問題,我們提出 MuonClip,并將其擴展到萬億參數規(guī)模,提升了訓練穩(wěn)定性和 token 使用效率。Kimi K2 完成了 15.5T token 的平穩(wěn)訓練,全程無 loss spike。
  
  大規(guī)模 Agentic Tool Use 數據合成:我們構建了可大規(guī)模生成多輪工具使用場景的合成 pipeline,覆蓋數百領域、數千工具。高質量樣本由 LLM 評估篩選后用于訓練。
  
  通用強化學習:Kimi K2 不僅在可驗證任務上(代碼、數學)強化學習,還通過引入自我評價機制(self-judging),解決了不可驗證任務的獎勵稀缺問題。通過可驗證任務持續(xù)優(yōu)化 critic,提升泛化任務表現。
  
  API 及定價
  
  Kimi K2 的 API 服務現已全面上線,支持最長 128K 上下文,具備更強的通用性與工具調用能力。計費方案如下:
  
  每百萬輸入 tokens:4 元
  
  每百萬輸出 tokens:16 元
  
  我們兼容 OpenAI 和 Anthropic 兩種 API 格式,也可以與各類框架良好兼容。此外,全新升級的 ToolCall 能力,可以嚴格保障格式正確性,適用于復雜 Agent 任務。
  
  詳見   Kimi 開放平臺
  
  即刻體驗
  
  前往 kimi.com 或下載 Kimi App,立即與 Kimi K2 模型開啟對話。
  
  (模型已具備工具調用能力,相關功能正在內測中,即將開放,Stay tuned?。?/div>
  
   
我要收藏
點個贊吧
轉發(fā)分享
上一篇:中科紫東太初董事長王金橋任 工業(yè)和信息化部人工智能標準化技術委...
下一篇: 企業(yè)級 AI 的未來:IBM 實現通用型企業(yè)級 AI 智能體的重大突破