分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-03-25 07:58:46 聽(tīng)新聞
作者:一財(cái)科技 責(zé)編:高明妍
DeepSeek在開(kāi)源平臺(tái)上線了升級(jí)后的DeepSeek-V3模型,而非此前業(yè)界預(yù)計(jì)的R2模型。據(jù)悉該模型參數(shù)為6850億。DeepSeek在其官方交流群中稱,DeepSeek V3模型已完成小版本升級(jí),歡迎前往官方網(wǎng)頁(yè)、App、小程序試用體驗(yàn)(關(guān)閉深度思考),API接口和使用方式保持不變。
從網(wǎng)友反饋的實(shí)測(cè)效果來(lái)看,V3編碼能力已經(jīng)接近Claude3.7,數(shù)學(xué)能力也有提升,能像推理模型一樣能夠解題。
DeepSeek發(fā)布Prover-V2模型;快手成立可靈AI事業(yè)部;Grok 3.5早期測(cè)試版下周將向SuperGrok訂閱者發(fā)布。
阿里云方面表示,性能大幅提升的同時(shí),千問(wèn)3的部署成本大幅下降,僅需4張H20即可部署千問(wèn)3滿血版,顯存占用僅為DeepSeek-R1的三分之一。
騰訊混元3D生成模型發(fā)布2.5版本新模型;小鵬自研通用模型今年或?qū)婇_(kāi)放;OpenAI重組為營(yíng)利性公司的目標(biāo)遇阻。
針對(duì)開(kāi)發(fā)者面臨的數(shù)據(jù)難獲取、模型難訓(xùn)練、開(kāi)發(fā)成本高、工程門檻高等問(wèn)題,Genie Studio推出“數(shù)據(jù)采集、模型訓(xùn)練,仿真評(píng)測(cè)、模型推理”四大核心模塊。
第一財(cái)經(jīng)記者從了解黃仁勛中國(guó)之行細(xì)節(jié)的人士方面證實(shí),黃仁勛全程未與DeepSeek會(huì)面。