5

对StarRocks “真假开源”之争的灵魂 9 问

 3 years ago
source link: https://segmentfault.com/a/1190000040658141
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

对StarRocks “真假开源”之争的灵魂 9 问

发布于 9 月 9 日

昨天,一篇题为“StarRocks 开源 —— 携手未来,星辰大海”的公众号文章,在开源圈内引发巨大争议。

这篇文章,以一封公开信的形式,向“各位大数据从业者”描述了目前数据分析构架所面临的各种困难和挑战,随后宣布“将核心产品 DorisDB 升级为 StarRocks,并全面开源(Github 搜索‘StarRocks’),和全球大数据从业者一起构建新一代极速统一的数据分析架构!”文内,来自大厂的一众大佬,通过视频的形式为其站台背书。

image.png

然而,这篇文章不仅没有为 StarRocks(原 DorisDB)收获一分好感度,反而引发了开源圈的“众怒”。

就在刚刚,沉默了一天的Apache Doris 也发布了最新声明。

原文链接:https://mp.weixin.qq.com/s/QnJ6LFaMOpLasdRpFzGFJA

Apache Doris对大家关心的“ Apache Doris 和 DorisDB、StarRocks 的关系”、“社区分化的原因”等问题做了答复,并就 StarRocks 本次“更名”和 “开源”做了表态。

Apache Doris表示,因为StarRocks选择的 Elastic 开源许可协议,OSI 根本不认可,“OSI认定其是‘伪开源协议’,充其量叫‘源代码可获取’”。“祝未来一切都好,StarRocks 飞得再高,也是站在了巨人肩膀上”。

SegmentFault 思否技术编辑团队在第一时间跟踪本次事态的发展,访谈 Apache Incubator(孵化器)导师吴晟,收集相关资料,对其存在的争议展开调研。并就此事件,向 StarRocks 团队提出灵魂九问:StarRocks,关于这几个问题,你怎么看?

一问:DorisDB 品牌名称是否侵犯 Apache 软件基金会权益,更名 StarRocks 背后的真实原因?

提到 StarRocks 不得不提其“曾用名”DorisDB,查看 StarRocks 公众号账号主体信息可以发现,其公众号注册于 2020 年 07 月 29 日,注册名为 DorisDB,并在 2021-09-08 更名并认证为 StarRocks。

在过去很长一段时间,鼎石公司都在使用 DorisDB 的品牌进行市场营销及推广,然而我们了解到 —— Apache Doris 作为开源项目在捐赠给 Apache 软件基金会时,就曾在其软件授权协议中明确:Doris 品牌及其品牌相应的版权、logo、商标等都一并捐赠给基金会。而基金会也明确规定,任何第三方公司,不得将 Apache 及其项目名称用于任何第三方商业公司的品牌。可见 DorisDB 这一品牌名称明显侵犯了 Apache 软件基金会的相关权益。

据了解,作为 Apache Doris 的捐赠方百度,Apache Doris 项目导师姜宁,Apache 孵化器导师吴晟,都曾多次直接或间接劝阻鼎石公司、联系其投资人加以劝阻无果。

而本次更名也并非其公关文中所谓“品牌升级”,而是迫于各方压力的无奈之举。但全文看下来,我们丝毫没有看到鼎石公司对于长期侵权行为的悔过和歉意,回避事实,无比高调。

二问:StarRocks 是 Fork Apache Doris 的 “山寨 ”项目吗?

侵权使用 Apache Doris 的品牌名,那么在技术层面,StarRocks 与 Apache Doris 有关联吗?答案是肯定的。

虽然山寨一词并不准确,但 StarRocks 毫无争议是 Apache Doris 的 Fork 版本,在其代码中,Apache Doris 的代码,Apache 的 License 被得以保留,在其项目声明中也明确表示了其项目源自于 Apache Doris。而这一点在 StarRocks 宣布开源的文章中并未提及。

三问:鼎石公司对 Apache Doris 的贡献到底有几成?

按照 GitHub 上的 Commits 数计算,最近一年 Apache Doris 项目贡献的前 20 位分别为:

  1. Moringman(陈明雨-百度)
  2. Yangzhg(杨政国-百度)
  3. HappenLee(李昊鹏-百度)
  4. stdpain(冯浩桉-前百度,一个月前刚刚入职鼎石)
  5. EmmyMiao87(缪翎-百度)
  6. xinghuayu007(汪细勖-小米)
  7. caiconghui(蔡聪慧-小米)
  8. Weizuo93(魏祚-小米)
  9. acelyc111(赖迎春-小米)
  10. xy720(徐洋-百度)
  11. Hf200012(张家峰-海底捞)
  12. Liutang123(刘立家-美团)
  13. Qiye(齐建亮-百度)
  14. Zouxinyi(邹新一-百度)
  15. Huangwei(黄威-小米)
  16. Wanbo(王博-美团)
  17. Luozenglin(罗甑林-百度)
  18. TingSun(孙挺-学生)
  19. Pxl(潘肖磊-百度)
  20. Haotan(谭浩-头条)

除一位刚刚离职百度入职鼎石短短一个月的工程师外,我们并未在这份榜单中看到鼎石公司的身影。可以说其对 Apache Doris 项目的贡献已经不能用多少衡量,而是鼎石公司已经完全脱离了对上游项目的贡献,只维护其 Fork 的版本和商业私有化版本。

当然作为一家商业公司,我们无权批判其不参与或少参与开源项目,我们批判的是下一个问题,似乎鼎石公司一直在可以营造其与 Apache Doris 的紧密联系。

四问:让公众误会其为 Apache Doris 捐赠方或核心贡献者,是否存在刻意误导?

众所周知,Apache Doris 是由百度捐赠到 Apache 软件基金会的开源项目。

但除了侵权使用 Doris 的品牌外我们发现,鼎石公司还存在其他可能存在误导的行为 ——在搜索引擎上搜索“Apache Doris”我们可以发现鼎石公司通过购买“关键词广告”的方式名列第一位。在 StarRocks(原 DorisDB)的微信公众号中也曾发布大量 Apache Doris 技术实践的文章

我们鼓励其积极推广开源技术的行为,但这背后是否存在某种暗示或可以引导呢?是否希望让用户将 DorisDB 与 Apache Doris 划上等号?我们不得而知。

上图为 2021-09-09 百度搜索结果

在此特别说明的一点是,我们从来不批判商业软件,不从道德层面批判你是否参与、贡献开源,也并不反对任何公司基于基金会的任何开源项目去做商业化,批判的是在这个过程中故意模糊概念、不实事求是、违背开源精神的行为。

五问:真真假假,StarRocks 开源了吗?

抛开以上不谈,StarRocks 文章中最核心的观点“将核心产品 DorisDB 升级为 StarRocks,并全面开源”同样受到了圈内的广泛质疑。

据 GitHub 公开信息显示,StarRocks 目前所谓的“开源”采用了 Elastic License 2.0。但问题是,这并非 OSI 认证的开源 License。

开源促进组织 OSI (Open Source Initiative,也被译为开放源代码促进会 https://opensource.org/ )是一个推动开源软件发展的非盈利组织。OSI 定义了近百种开源协议,这已经成为了开源协议的事实标准。换句话说,不被 OSI 认可就不是开源。

面对外界的质疑该公司“开源”的问题,StarRocks 方面表示,该公司已在 GitHub 上做了详细说明。

StarRocks 表示,Elastic 等开源软件公司会更倾向于和那些为开源社区做出贡献的公司合作。他们采用 Elastic License 2.0 作为开源许可证,可以确保用户可以继续免费使用、修改和分发 StarRocks 的源代码,同时保护 StarRocks 的版权和商标。

在我们看来 StarRocks 在这一问题上意图刻意混淆概念,Elastic 修改开源协议其本意是保护自身原厂的权益,要求未对项目作出贡献的情况下不得发布自己的开源及商业化产品。Elastic 拥有 Elastic Search 完全的版权,而 StarRocks 是完全不同的情况。

在这一点上 Apache Doris 也做出了回复 —— StarRocks Fork 的是 Apache Doris ,这身份已经本末倒置了,请问 DorisDB 是否有回馈上游?这不仅不遵守基本的 Upstream First 原则,还声称要保护 StarRocks 的知识产权,这也是十分双标了。

*开源许可证相关链接:
StarRocks: https://www.dorisdb.com/en-US...
Elastic License 2.0: https://www.elastic.co/cn/lic... *

六问:高调更名,是碰瓷营销,还是对开源文化和知识产权的践踏?

实际上这不是 DorisDB 的第一封“公开信”,在此前 DorisDB 也曾发布过“致 ClickHouse 用户的一封信”,被开源圈暗讽为“碰瓷营销”。

然而这一次,DorisDB 摇身一变,已经不仅仅是恶意碰瓷、在营销手段上有所不当了,而是完全无视知识产权,无视开源精神,无视开源文化。这样的肆意践踏,无论从道的层面还是术的层面都不可取。

或低调更名,或诚意道歉,这才是 StarRocks 该有的态度。

七问:捆绑“大佬”站台营销,真实情况大佬们知道吗?

来自阿里巴巴、腾讯、京东、顺丰、小米、携程、小红书、58 同城等公司的多位工程师在文内通过视频的形式为 StarRocks 站台背书,并表示愿意加入 StarRocks 社区进行贡献。

圈内相互捧场,互相支持是很正常的行为,正式开源发个视频庆祝、转个公关稿、发个朋友圈……但我们想问 ——

DorisDB 的各种侵权行为,大佬们知情吗?
DorisDB 的相关负责人有否说明实情,还是模糊了事实?
如果事态持续发展会不会影响到“大佬”们的个人信誉?
在找好友帮忙,还是在为好友挖坑?

DorisDB 这样做,真的厚道吗?

八问:性能是会否成为数据库商业公司的核心优势?

查看 StarRocks 最近的几篇推文,我们不难发现,DorisDB 开始频频将其性能与 Apache Doris 作对比。

对此我们采访了 Apache 软件基金会董事、Apache 孵化器导师吴晟,他表示:我从来不觉得一个商业公司,如果立足点仅仅是性能,能够有多么强大的生命力。我们曾经见证过无数家公司基于 Kafka 去做了所谓的性能优化,但是最后我们都知道 Kafka 背后唯一的一家上市公司其实并不是从性能角度去完成商业化的。

吴晟老师在 COSCon'19 中国开源年会的演讲上曾经说过:如果在竞争中,性能是你唯一的杀手锏,最终你一定会被对方干掉,因为所有的性能、指标都是对方可以通过更好的创新去超越的,它并不会带来碾压级的优势。

九问:to VC?什么样的商业软件公司值得被看好?

基础软件浪潮,带来了国内开源热,开源商业公司的巨额融资屡屡登上头条,慢慢开始有一些“假开源、蹭热点、刷数据、To VC”的公司出现在资本市场,我们不禁发问 —— 什么才是一家值得被看好的商业软件公司?

吴晟老师给出了他的答案 —— 合法合规、知识产权清晰、有客户愿意买单。至于开源还是闭源,其实并不重要。

总结
特别感谢吴晟老师在假期第一时间接受我们的采访,感谢开源之商小组对这一事件的客观探讨。

我们希望以上只是我们对 StarRocks 的揣测,而非全部事实,期待听到来自 StarRocks 的回音。

我们批判的不是闭源软件,也不是商业化本身,而是对开源文化的亵渎,不实事求是的精神。

我们呼吁鼎石公司可以正视其长期侵权行为,并对 Apache 软件基金会、Apache Doris 及原 DorisDB 的用户、客户、开发者和公众做出公开解释和道歉。

我们期待看到 Apache Doris 团队可以更好地迭代产品、繁荣社区、保持优势,SegmentFault 思否愿意长期义务支持开源项目发展。

我们依旧相信开源文化和知识产权意识在国内的觉醒,也祝福 StarRocks 无论是开源还是闭源发展,都可以走出一条有特色、合法合规的阳光大道,基业长青。

相关阅读:
就在刚刚,Apache Doris 发声明了《你们想知道的一切,都在这里了》https://mp.weixin.qq.com/s/Qn...
StarRocks 开源 —— 携手未来,星辰大海 https://mp.weixin.qq.com/s/3z...


Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK