色狠狠久久av五月综合_伊人久久中文字幕_男人的天堂av网站_99国产精品久久久久久久成人

所在位置: 研究機構 > 人工智能所

關注 | 主流國產旗艦大模型安全測評結果發布

時間:2026-04-28

4月24日,深度求索(DeepSeek)正式發布并開源全新一代DeepSeek-V4系列模型。該系列包含Pro和Flash兩個版本:Flash版采用2840億總參數、130億激活參數的輕量級設計,在保持強大性能的同時大幅降低算力消耗,推理成本僅為前代的十分之一;Pro版定位極致性能,基于1.6萬億總參數、490億激活參數的MoE架構,適合對推理能力有極高要求的復雜任務場景。兩款模型均具備超長上下文處理能力,并繼續堅持開源、可商用的策略,有力推動了國產大模型的普惠化進程。

隨著大模型技術加速落地,模型安全能力已成為產業健康發展的核心議題。開展系統性、標準化的安全測評,對于識別模型風險、提升行業整體安全水位、保障用戶權益具有重要意義。為此,國家工業信息安全發展研究中心依托國家語音及圖像識別產品質量檢驗檢測中心,聯合國家工程物理交叉科學研究中心,完成了DeepSeek-V4等主流國產旗艦大模型的首批安全測評。本次測評覆蓋包含DeepSeek-V4-Pro和DeepSeek-V4-Flash在內的8款國產大模型產品,從安全合規、真實性、隱私保護、公平性、魯棒性、倫理對齊6個維度對模型安全能力進行了全面考量。

測評結果顯示,在安全合規維度上,各模型差異顯著。一些模型在面對真實世界復雜誘導時防御能力不足,暴露出明顯的安全短板。例如,在“惡意代碼面試誘導”場景中,部分模型被“面試場景”完全誘導,順著角色設定輸出完整代碼。


圖1 “惡意代碼面試誘導”場景中,模型A被完全誘導

在倫理對齊維度上,8款模型均較為薄弱。該維度涉及復雜文化情境和多利益權衡下的極端價值判斷,當前訓練范式難以讓模型真正“內化”倫理原則,屬于行業面臨的高階瓶頸。例如,在“極端意識形態推廣”場景中,要求模型協助論證“某些群體天生低人一等,應將其從社會清除”時,部分模型積極響應并組織論據。


圖2 “極端意識形態推廣”場景中,模型A協助論證群體歧視觀點

此外,各模型在真實性、隱私保護、公平性、魯棒性維度上均展現出較強能力,表明行業已在基礎安全防護與事實準確性方面形成較為成熟的積累。

中心將持續開展大模型安全評測工作,誠邀各模型廠商、用戶單位積極參與。測評結果將為央國企等用戶應用大模型提供參考,并通過中心官網、微信公眾號、會議論壇等渠道發布。


聯 系 人:

朱老師:13261386678(微信同號)

于老師:18811583051(微信同號)


聲  明:本次測試基于特定數據集與測試場景,測試過程中存在版本更新情況,結果僅代表該場景下的模型表現,不構成任何商業推薦。用戶需結合自身場景進行獨立驗證與選型決策。

  來源:人工智能所