科技圈又炸鍋了!華為開源盤古大模型剛收獲一波掌聲,就被卷入抄襲風波,被質疑基于其他廠商模型增量訓練,這究竟咋回事?

原來是有研究稱,盤古Pro MoE模型和阿里云通義千問Qwen-2.5 14B模型的注意力參數分布高度相似,開源代碼文件還標注著其他團隊版權聲明,這難免讓人浮想聯翩,難道華為真“抄作業”了?
面對質疑,華為盤古團隊迅速回應。聲明表示,盤古Pro MoE是基于昇騰硬件平臺獨立開發、訓練的基礎大模型,架構設計和技術特性都有創新,還提出分組混合專家模型(MoGE)架構,解決了大規模分布式訓練的負載均衡難題。
至于代碼中出現其他版權聲明,團隊解釋是部分基礎組件參考了業界開源實踐,嚴格按照開源許可證要求,清晰標注了版權聲明,這是開源社區常規操作,也是對知識產權的尊重。
抄襲質疑在開源大模型領域不是頭一回。此前,零一萬物開源大模型、斯坦福大學的Llama3-V項目都陷入類似爭議。AI大模型開源定義、協議規則還不夠清晰,也沒有明確的法律界定,導致亂象叢生。
此次華為盤古團隊回應,不僅是對質疑的有力反駁,也給行業提了個醒:在開源大模型賽道,創新是根本,合規是底線。只有堅守這兩點,才能在激烈競爭和復雜輿論中站穩腳跟,推動行業健康發展 。