“套壳、续训、洗水印这些行为引发了广泛关注。疑似某厂员工的自爆更是让事情扑朔迷离。套壳可能意味着对其他模型的模仿和盗用,续训则涉及对已有数据的进一步加工利用,而洗水印则关乎数据的真实性和版权问题。这一系列行为若属实,将对行业的正常秩序和创新环境造成严重冲击。我们应保持理性和客观,等待官方的调查和澄清,以确定事实真相,避免因不实信息而引发不必要的恐慌和混乱,同时也需加强对人工智能领域相关行为的规范和监管。”
需注意,这里只是基于给定内容的一种创作,具体情况需结合实际背景和更多信息来准确判断和分析。
之前我被某厂举报过,所以写这类文章特别谨慎。
昨天业内爆出了惊天大瓜一个疑似某厂员工的人进行了爆料,只不过我详细读了下,只根据现有信息量是无法下任何结论的,所以仅仅梳理一些信息,让大家对事件进行下快速回顾:
6 月 30 日:华为开源盘古-7B 稠密模型和 Pangu Pro MoE 72B;
7 月 4 日:GitHub 帐号 @HonestAGI 发布论文,用参数“指纹”法比对,认为 Pangu Pro MoE 与阿里 Qwen-2.5 14B 高度相似,疑似“套壳”;
7 月 5 日:华为官方发布声明,否认抄袭,称模型“基于昇腾平台独立训练”,并质疑论文方法学;
7 月 6 日凌晨:本次长文爆料者自称盘古四纵成员,详细描述多次“续训套壳”、内部治理失衡及人才流失等情况;
7 月 7 日:多家科技媒体跟进报道,社区继续对模型权重展开对比实测。
是否真实抄袭这个是没办法验证的,他至少缺乏原始训练日志、算力租用凭证、完整 git 历史等更硬核证据。
事实上,这里的是否抄袭我是并不关注的,假定爆料者确实是HW员工,那么我们应该如何看待这份材料呢?又应该如何从管理角度与个人安全角度看待这个事件?
一、信息通道失灵
之前我们在管理课程《揭秘公司治理框架》中提到过,公司所有问题的根源都会回归两点:信息失真与评价失效,如图所示:
其中有一节《信息通道建设》讲解了比较重要的内容:不公平评价一定会引发负能量,而经理层是首先处理负能量的英雄群体,但如果经理层心态出问题,那很容易引发系统性的大事件。
其实负面信息不可怕,但他一定要受到监督和管控,不能让他们隐藏起来,所以公司需要为(负面)信息留出输出通道,否则他们只会羁押,最后滋生负能量。
再看疑似HW爆料事件,他其实是可以定义为信息通道失灵 + 基层管理兜底失效的,最终结果就是负能量被放任了。
从这个角度来说,此事爆发其实是有一定必然性的,有不公的地方,自然就有反抗,比如这里有些信息可以佐证观点:
来这里是我技术生涯中的耻辱,在这里再呆每一天都是浪费生命。
话虽难听却让我无言以对。我担心我自己技术方面的积累不足,以及没法适应互联网公司高淘汰的环境,让我多次想离职的心始终没有迈出这一步。
所以,该爆料产生的原因可能有些出于义愤,但该义愤积累的原因是长期的不公平感,比如他多次控诉:团队的成果被人很轻易地拿走了!
试想一下,如果内部投诉通道有效,此事可能就不会进一步发酵......
总而言之:结构影响行为,但事件爆发后,系统必须思考自己哪里出问题了,否则类似事件只会持续爆发。
然后第二个问题:爆料者的行为是否值得提倡?
二、孤勇者?
其实国内外这种爆料事件经常发生,比较出名的就有:
1. 基因测序巨头安全隐患
首席工程师实名举报旗舰基因测序仪 NovaSeq X 存在设计缺陷(温度失控可能破坏样本),公司隐瞒风险继续销售。
公司这边的反击是:
公司以 “窃取源代码” 为由起诉(后查实仅为测试日志);
动用竞业协议禁止其入职同类企业(即使求职生物公司无关岗位);
个人结局是:
举报内容1年后被FDA查实,强制Illumina召回设备;
爆料人因诉讼耗尽积蓄,患抑郁症退出行业,Illumina未受处罚。
2. 硅谷明星AI芯片公司
硅谷明星AI芯片公司 Lightmatter CTO 被罢免后爆料创始人学历造假、芯片demo视频伪造(用竞品芯片运行)。
公司这边马上启动法律武器绞杀:
公司以 “性骚扰调查” 为由反咬(无证据但启动内部程序抹黑);
起诉其 盗取“光子计算专利” (实际为CTO入职前专利)。
最终结局:
爆料人社交媒体被封(公司投资人控制平台),技术社区集体沉默;
和解条件:CTO永久放弃专利所有权,闭嘴换撤诉。
3. 医疗AI诊断公司 Zebra
数据科学家匿名举报训练数据造假(用健康人影像冒充癌症患者)。
公司首先要求全员重签“渗透测试保密协议”:包含隐藏木马,可追踪员工外发文件。
其次,通过文档水印定位爆料人,以“违反网络安全法”报警。
最终,爆料人被刑事拘留37天,因证据不足释放。
公司反诉其 “非法获取计算机系统数据罪”(查看内部数据即违法),案件拖延至今。
上述事件中,有些是确实取得了群体性的良性发展的,特别是涉及公共医疗、安全等板块。
但站在个人角度来说:实名爆料属于自损一万,伤敌八百,而就我观察疑似HW这个爆料信,里面猛料是很多的!最要命的是其中主观推测的成分有些多。
三、爆料有多猛?
首先,文章指控的内容挺严重的,其中什么管理流程失效、人才流失等管理问题只是毛毛雨;
而系统性模型套壳造假、高层知情默许,如果被广泛采信,将是不小的丑闻。会严重打击公司在AI领域的声誉、技术可信度、商业合作(尤其是企业客户和云业务),甚至可能引发监管调查(如果涉及虚假宣传、知识产权侵权)。远超一般职场文化爆料的影响,接近技术欺诈的级别。
并且对于个人的影响更大,公司很可能以违反保密协议、损害商业信誉等理由提起民事诉讼索赔,金额可能巨大。如果爆料内容被认为不实,还可能面临诽谤诉讼。如果涉及泄露国家秘密(即使非本意,但大模型技术可能涉及敏感领域),后果不堪设想。
在类似案例中,“伤敌一千”往往能实现(尤其涉及造假),但“自损”绝不止“八百”,很可能远超爆料者的想象和承受能力,且未必能换来其期望的“内部净化”。
并且,爆料者提供了海量极其具体、只有内部核心人员才知晓的技术细节、项目代号、时间节点、人物关系和内部梗(如“点鼠标实验室”、“千古”、“四野”、具体模型迭代路径、训练问题、苏州集结细节)。
这几乎是为调查人员绘制了精准的定位地图。在大数据和内部排查面前,匿名非常脆弱。即使爆料者离职,追责依然可能发生。
讽刺的是,小模型实验室的模型似乎从来不受这些流程的约束,想套壳就套壳,想续训就续训,算力源源不断地伸手拿走。这种强烈到近乎魔幻的对比,说明了当前流程管理的情况:只许州官放火,不许百姓点灯。何其可笑?何其可悲?何其可恶?何其可耻!
这里其实也释放了关键信息:似乎公司是有绿色通道的!
如果真的如此,那我作为想成事的人,一定要去想方设法走这个绿色通道;如果我走不了,那么我一定会举报得大家都走不了,管理这个事情不患寡、患不均,没有人可以在举报的情况下可以公开走特权。
最后,公司一旦大了就会有很多系统性问题,有时候我们主动一点可以规避系统问题对我们成事的阻碍。
我也不是想要合理化系统性不公,只不过如何修复系统(制衡权力、捍卫诚信)不是一般牛马应该考虑的;我们有时候不得不在溃烂系统中苟活(提升抢功技能、忍受不公)......
世界上很多事情是不对,但总有更好的办法去处理手上的事情......
在溃烂系统中,要么学会跪着抢食,要么闭嘴消失,这确实是一种群体性的不公,但作为每个个体我们没办法去与所谓嫡系力量做太多抗争,我们当然可以批判:当偷窃成为规则,指责失主不会保护财产才是荒唐,但多半这于事无补。
结语
作为管理者,爆料文中有很多信息是值得大家警醒的,比如这句话:
HonestAGI的事情出来后,内部让大家不停地研讨分析,如何公关和“回应”。
诚然,这个原文的分析也许不够有力,给了WYH与小模型实验室他们狡辩和颠倒黑白的机会。
为此,这两天我内心感到作呕,时时怀疑自己的人生意义以及苍天无眼。
我是真的想不出,作者是出于什么样的委屈下,才能写出如此的控诉。
工作中确实有很多嫌贫嫉富,看不得你好,恨不得你倒的人,我们确实会在实际工作中遭遇各种烂人、破事。
但我这里需要再强调一下:互联网增量结束,市场确实不大好,但大家一定要警惕负能量的侵袭,这东西挺吓人的。
每一个愿意站出来控诉不公的都是英雄,只是英雄也需要保护好自己。再送一个漫画送给大家:
本文来自微信公众号:叶小钗,作者:叶小钗