编者按:本文来自微信公众号“连线Insight”(ID:lxinsight),作者 向阳 青松,编辑 水笙,36氪经授权发布。
短短几天时间,国产编程语言“木兰”坐了一次过山车。
1月15日,中科智芯发布编程语言“木兰”,其号称“由我国科研人员自主设计、开发和实现,与之配套的编译器与集成开发工具,也由科研团队自主实现”,这引起了广泛的关注。
但随后不久,CSDN博主“沉迷单车的追风少年”对“木兰”表达了质疑。
他经过亲身体验发现,在解析软件包的过程中,“木兰”与近几年火热的编程语言Python有很多相似之处。
图标跟Python的安装工具Pyinstall如出一辙、对话框与Python一样、提供的函数也与Python几乎雷同、甚至他在尝试反向破译的时候发现“木兰”并未采取加密处理......
该则爆料随后引发争议,“木兰”也被质疑是“Python”语言的套壳产品。
1月17日,“木兰”语言研发团队负责人、中科院计算所编译实验室员工刘雷在科学网发表回应称,“木兰”语言在8位单片机上的编译器是本团队开发的,但在32位单片机上的编译器是基于Python开源编译器进行的二次开发。
刘雷声明,图源科学网
这意味着官方的宣传话术存在夸大,“完全自主开发”其实只是部分自主开发。
被舆论推上风口浪尖的不仅是“木兰”和刘雷,还有背后的中科院。
今天,中科院计算所出面回应了此事,提到“木兰”语言系所内员工刘雷创办的中科智芯公司研发的面向青少年编程教育的集成化产品,该产品的开发包中包含了Python开源编译器,对外声称“完全自主”的行为存在欺瞒与虚假陈述的科研不端问题。
目前,中科院计算所已对当事人刘雷做出停职检查的决定,并就管理责任责令编译实验室负责人作深刻检讨。
图源中科院官网
因为此事,中科院与上市公司之间的合作模式再次受到关注,在中科院和企业合作研发的项目中,有不少被质疑为“伪自主”,夸大宣传的背后,有什么样的利益纠葛?
试想一下,假如木兰真如其所说的为“完全自主研发”,意味着什么?
编程语言被认为是构建信息技术生态的基石,是与操作系统并重的两大系统软件之一。
刘雷曾对中国青年报表示,信息产业依托编程语言,可以打造生态系统,有助于占领行业标准高低,把握该领域未来发展方向的主动权,带动上下游,实现技术可控。
“鉴于编程语言在信息技术产业中的重要价值,依赖开源等形式的外部技术,存在较大风险,我们需要大力发展编程语言,实现编程语言的自主可控。”刘雷这么说道。
事实上,计算机相关科研成果在国内并不算少,华为、阿里、百度等高新科技企业此前都曾发布过相关的成绩。但在编程这一环节,我国之前并没有太多的自主国产化。广为人知的C++、C语言、java,以及近年来火热的Python,都是舶来品。
这也就意味着,“木兰”在最初被寄予厚望,是因为其很可能带领我国在编程语言底层技术的发展上迈出重要一步。
刘雷最初的言论,也充满着自信,“我所在的计算机体系结构国家重点实验室编译组,长期致力于在CPU、编译器等关键技术领域实现突破,此次出炉的‘木兰’成果即属于掌握核心技术的编程语言和编译技术。”
但当谎言被拆穿后,另一个问题是,“木兰”为何不能被称为自主研发?评判编程语言是否为自主研发的标准究竟是什么?
对此,连线Insight向中国政法大学知识产权研究中心特约研究员李俊慧进行了求证。他告诉连线Insight,是否属于自主独立,关键要看该编程语言在源代码上是否具有自主控制或独立知识产权。
“自主独立的编程语言与全中文或纯中文编程并不是一个含义,其底层的含义是否具有独立知识产权,是否自主可控。不与其他软件或程序存在知识产权纷争或冲突。”李俊慧说。
对于是否具有独创性,他提到,从代码角度来看,可以比对查重,类似同一主题文章,可以对比查重的方式来识别是否抄袭。
将二次开发描述为完全自主开发,是这次“木兰”陷入争议的主因。
而虚假夸大宣传的不止于此,刘雷在接受采访时曾介绍,“木兰是一款定位于面向智能物联应用的编程语言,采用创新的弹性actor执行模型(擅长执行并行计算),可成倍地提高应用执行效率,在提高服务质量的同时大幅降低平台运营成本。”
他提到,如今,在智能物联应用领域,尚无一款专用的编程语言。就此来看,“木兰”对于我国编程事业的发展意义重大。
在致歉声明中,他承认,这点也是虚假宣传,木兰的适用范围,本来是主要用于中小学教育,在此前的介绍中他却将其扩大到了智能物联领域。
随着“木兰”套壳的热度不断攀升,其主体公司中科智芯的更多细节被挖出。
“中科智芯(北京)科技有限公司,是中国科学院计算技术研究所孵化企业,源中科院计算所计算机提结构国家重点实验室而成立,是中国科学院‘高端科研资源科普化’计划的衍生。”中科智芯在官网介绍中如此写道。
连线Insight从天眼查了解到,在中科智芯的股东之中,中科编易(北京)科技有限公司认缴金额为140万人民币,持股比例高达70%。
图源天眼查
而刘雷正是中科编易的控股股东,其持股75%,另一股东为北京中科算清资产管理有限公司,持股比例为25%,这家公司背后的疑似实际控制人,正是中国科学院计算技术研究所。
换句话说,刘雷实际上是中科智芯的实控人,而中科院则通过入股中科编易,间接成为中科智芯的股东。在共同利益上,二者盘根错节,互相影响。
天眼查数据同时显示,中科院计算技术研究所通过北京中科算源资产管理有限公司,间接入股了多达33家企业,商业版图越做越大。
但与企业的合作案例中,却屡次出现类似“木兰”的案例。
早有人回忆起来,“木兰”换皮的闹剧,只是历史的重演。
上一个故事发生在2017年,红芯时代(原名云适配)与中科院合作成立了红芯联合实验室,希望突破浏览器内核等关键核心技术。
红芯曾背负了很多期待,在诞生之初它的目标就很远大。当时红芯联合创始人高婧在接受媒体采访时毫不掩饰其野心,“红芯要做中国第一个有自主创新能力的浏览器内核,也是微软的IE、谷歌的Chrome、苹果的Safari以及火狐之外的第五大内核。”
在2018年6月16日,红芯联合实验室成立仅一年左右,它宣布完成2.5亿元的C轮融资,投资方有上市公司、政府客户、晨兴资本、达晨创投和idg资本。而当时,在红芯的官网上写道:“打破破美国垄断,中国首个自主创新智能浏览器内核。”
没想到的是,事情在一天内急转直下。融资带来的高关注,却成为祸端。
当日,微博用户 @Touko将该浏览器的解压过程制成小视频发到了网上,解压后显示的是Chrome浏览器文件,所谓的自主研发只不过是将Chrome浏览器进行了一番改装,这与红芯所宣传的自主创新内核Redcore不相符。随后媒体和用户的广泛质疑将事情推向高潮。
对此,红芯官方发了两条声明回应,第一条表示,“红芯浏览器内核确实是基于Chromium开源项目,在其基础上进行技术创新的,但不同于传统浏览器,专门针对企业办公场景设计。”
在被继续质疑之后,第二条回应则称:“在融资宣传过程中存在一定程度的夸大,给公众带来了误导,在此郑重地向大家道歉。”
红芯浏览器已经停止下载,图源红芯时代官网
之后创始人陈本峰曾对《财经》杂志提到,红芯错在宣传太浮夸,把自己摆得太高,而民众又对“伪自主骗国家”的行为深恶痛绝。如果肯踏踏实实地基于谷歌浏览器内核做扩展开发,满足企业客户的实际痛点,红芯还是一款不错的产品。
因为“红芯”的名称,人们不免联想到臭名昭著的“汉芯一号”造假事件,这可以说是中国科技史上最大的丑闻之一。
2003年,上海交通大学微电子学院院长陈进教授发明了“汉芯一号”。
2003年2月,“汉芯一号”研制成果的新闻发布会现场,图源中国青年报
一场隆重的发布会上,王阳元、邹士昌、许居衍等中科院和工程院院士和“863计划”集成电路专项小组负责人严晓浪组成的鉴定专家组作出了一致评定——“汉芯1号”及其相关设计和应用开发平台,达到了国际先进水平,是中国芯片发展史上一个重要的里程碑。
但三年后,“汉芯一号”被证明是一场骗局。2006年,一位用户在清华大学水木清华BBS上指出,在摩托罗拉公司做测试工程师的陈进,将一片从美国买来的MOTO-free scale 56800芯片,雇请他人磨掉原有标志,然后加上自己的“标识”,变成了所谓“完全拥有自主知识产权”的“汉芯一号”,申请了多项专利。
这位用户提到,借助“汉芯一号”,陈进当上了上海交大微电子学院院长、博导以及“长江学者”,还申请了数十个科研项目,骗取了高达上亿元的科研基金。
最后,陈进被上海交通大学撤销各项职务和学术头衔,国家有关部委与其解除科研合同,并追缴各项费用。但中国青年报记者向国家有关部委询问时了解到,确实没有相关责任人受到任何法律上的追究。因此,很多人不满意汉芯事件的处理结果。
一个本该振奋国产半导体芯片研发行业的事件,最后沦为一场荒唐闹剧,也给行业带来了低谷和阴影。
在争论与质疑背后,除了发布产品的企业,参与其中的中科院也不免被贬斥。
在“汉芯”事件中,让“汉芯一号”通过审核的两院院士背上了骂名。
事件爆发后,甚至有网友在论坛上批判,“中国科技造假事件,多为中科院。”
2004年开始,中科院引进民营资本进行企业社会化改革,开展孵化企业项目。
目前中科院与企业形成两种主要合作模式,即持股与合作开发。
具体有技术转让、委托研究、联合攻关、内部一体化、共建科研基地、组建研发实体、人才联合培养与人才交流等。
但在这样的模式下,却一次次被曝出丑闻。
2010年,中科院投资的“红旗2000”公司开发的RedOffice办公软件,被业内人士爆料,其代码90%以上复制于开源的OpenOffice,“红旗2000”只在其表面加了一个外壳,就声称100%自主知识产权,改个名字就直接宣布自主开发。
2014年,中科院联合上海联彤网络通讯技术有限公司“自主研发”的智能操作系统COS(ChinaOperatingSystem),被媒体质疑“自主”是徒有虚名,与HTC系统相似。
中科院软件所与上海联彤公司联合发布操作系统COS,图源腾讯网
据华尔街日报报道,知情人士透露一些HTC工程师曾“深度介入”这款操作系统的研发工作。另据TechWeb报道,当时宣传视频中演示的首款搭载COS 1.0系统的智能手机确认为HTC Butterly的改版机型,运行的应用与HTC Butterly操作系统上的完全一致。
在中科院饱受质疑的项目中,“龙芯”是最受关注的一个。
龙芯中科研制的龙芯1号、龙芯2号、龙芯3号三大系列,图源龙芯中科官网
2002年8月,中科院孵化的高科技企业龙芯中科,宣布首款通用CPU龙芯1号流片(检验测试芯片是否符合设计性能和功能的过程)研发成功,被媒体报道时形容成,终结了中国计算机产业“无芯”的历史。
但事情很快出现反转。
2005年7月,专业半导体调研机构In-Stat发布独立分析报告称,龙芯处理器架构与美国MIPS相似度达95%,龙芯二号处理器与美普思10年前推出的产品非常相似。
此消息被曝出后,龙芯中科被质疑以“伪自主”骗取国家科研经费,业界有人嘲讽:“汉芯龙芯,芯芯造假”。
15年过去,龙芯中科从未承认造假。近两年开始被当做正面形象宣传,外界亦有“龙芯”蒙冤的声音。
2019年6月,人民日报报道中提到,基于28纳米工艺,龙芯3号新一代产品3A4000的研制工作已经展开,预计比上一代产品性能提高一倍,有望达到国际主流中高端芯片水平;7月,央视报道龙芯中科发布了第一款基于龙芯芯片的国产域名服务器,软硬件均实现了国产化,“这是我国在互联网底层技术创新的又一个新成果。”
不变的是,质疑声依然在继续,如今在“中科院之声”这一官方微博号上,经常能看到其对网友质疑的回复。
中科院之声回应质疑,图源中科院之声微博
在争论与质疑中,中科院的声誉有所下降。
掺杂其中的,是国人对自主创新的焦虑感。这种焦虑感在中兴事件发生时爆发,一个被普遍认可的观点是,中国只有尽可能地掌握核心技术,才能不受制于人。
科研是一场和时间战斗的持久战,作为自主创新的主力军,中科院肩负着外界的期待,其与企业合作,本应是一件好事,可以更好地将理论与实践相结合。在一出出闹剧背后,中科院要做的是拿出更多的突破性成果重获大众信任。