云栖12年:阿里云“长征”的7次非常关键抉择

  • 时间:
  • 浏览:43
  • 来源:申博体育注册

欢迎关注《创世纪》微信订阅号:思那创世纪

正文/贾

来源:科技星球(ID: tech 618)

阿里巴巴云穿越“无人区”。

2019年的云起会议仍然留在许多人的记忆中。无论是主持人文化衬衫上的第一行代码,还是天妃2.0的推出,阿里巴巴云都悄然打开了物联网世界的大门;在“世界最强AI芯片”平头哥半导体诞生一周年之际,发光800出现,在去年的科技界留下了一个精彩的印记。

刹那间,2020年,大起大落已经过去,新的云起会议即将到来。

今年很不平凡。疫情之下,云上经济发展迅速,数字经济使用的云数量翻了一番;智能产业进入深水区,云智能成为新的商业高地。备受瞩目的2020年云起会议将为业界给出答案,无疑值得期待。

据悉,2020年9月17日云起发布会将以“云分布式”的形式推出,可惜无法线下见面。但如果主持人再穿一件白色的文化t恤,也有值得镌刻的新代码。这一行代码也具有深刻的历史意义。是阿里巴巴云开发的国家健康码引擎的第一线。

2020年2月13日,阿里巴巴云数据智能团队写下这段代码。仅仅三天后,卫生法典就出台了,随后传播到全国200多个城市。“数字抗疫”为我国尽早控制疫情做出了巨大贡献,这是阿里技术团队的亮点之一。

阿里类似的去科技“无人区”的案例不胜枚举。“电商公司”曾经对阿里巴巴有过片面的认识,但在过去十年的历程中,阿里成功地站在了“科技公司”的立场上,没有人对此有任何怀疑。

现在,阿里巴巴云在2020财年的营收已经率先突破400亿元,DT纪元、吴昕、都市大脑、达摩学院、平头阁等新科技术语曾经是云起大会上的明星项目。阿里已经从商业公司转型为数据技术公司。

就像阿里第20届年会一样,马云说:“我们明明有很好的路要走,但是我们选择了没有人走过的路,但是我们一定要走。”回顾过去,历史的图景是混乱的,《科技星球》梳理了阿里科技长征路上的八个关键时刻,从中可以窥见阿里科技的演变。

吵起来的「宁波会议」

吵,吵。

2007年9月28日到30日,马云想换个套路,找个能看海的见面地点,开阔一下思路。然而,因为他订错了地方,他终于走进了一个封闭的会议室,在那里他甚至不知道大海在哪里。大家关上门吵了两天两夜。

当时,阿里的市值约为100亿美元,不到今天的七十分之一。迅速扩张的淘宝一口气推出了六位副总裁。每个人心里都有一个淘宝未来发展的愿景,也有一个是否独立拆分支付宝的争论。阿里也是优柔寡断。

高管们闭门讨论的话题是,阿里未来十年将何去何从?应该有什么样的策略?最终达成的共识是,阿里巴巴应该建立一个“开放、协作、繁荣的电子商务生态系统”。这个策略会持续使用十几年,技术是这个生态系统的核心。

宁波会议第二天晚上,折腾到半夜十一点,更具体的图显示——阿里打中了“千亿美元的希望”。

这张图透露的信息是,阿里希望开放各个业务部门的数据流动,让信息流、资金流、物流形成统一的数据智能,从数据中需求生产力。在宁波会议上,也首次提出“阿里巴巴是数据公司”。

回顾过去,“宁波会议”是阿里从技术上要求生产力的开端,阿里称之为“登月计划”。在那次会议上,决策者做出的另一个决定是在一年内为登月计划找到一名领先的“宇航员”。

第二年,微软亚洲研究院前副院长王健加盟阿里巴巴。

“登月”首先需要解决计算能力的问题。当时在阿里的传统IT架构中,大容量并发往往会导致服务器崩溃。阿里自主研发云计算,王健传奇的“造云”故事在这里奠定了基础。

被称为阿里“幕僚长”的曾鸣后来回忆说,这可能是阿里巴巴历史上最重要的战略会议。如果没有这次战略会议,阿里今天肯定不会在这里。

草蛇灰线「五彩石」

不熟悉阿里历史的人可能不知道“彩石”,但今天天猫和淘宝分享的数据是一样的,和这个项目息息相关。

简单来说,这个重要时刻就是淘宝和淘宝商城(后改名天猫)的数据和业务共享。擅长命名的阿里公司给这个项目起了个代号“彩石”。传说女娲用彩石填天。对于阿里来说,彩石也是阿里填补空白的好手段。

要知道,根据2008年的数据,当当网的销售额刚刚超过15亿,京东。COM的销售额只有14亿,而淘宝的销售额达到了999.6亿。像亚马逊这样的电商平台,淘宝的底层技术基础会在高交易并发期进行测试。当时的淘宝已经以“此处改,彼处错”而闻名。

更重要的是,当时的淘宝商城和淘宝就像两个独立的“烟囱”,各有各的IT系统,数据和业务互不互通。随着淘宝业务的快速增长,小烟囱将无法支持高流量、大并发的场景。“彩石”项目始于2008年10月,其诉求直指“拆烟囱”。

雇了200多人,花了半年时间才宣布彩石项目完工,淘宝和淘宝商城完全对接。这也是今天天猫卖家和淘宝用户能够实现交易的重要原因。

工程师从交易、支付、会员等业务中提取常用功能,打包成产品基本模块,将两个平台的数据存入统一的池中,为数据智能的研发奠定了基础。开发新服务时,可以直接调用公共模块和数据,大大提高了开发效率。

阿里第一次将中间层引入架构,这种“中间件技术”有阿里中间平台的影子。这也是为阿里未来的中台体系奠定的“草蛇灰线”。

就像后来一篇叫《你刚才在淘宝上买了一件东西》的文章“哪怕你只访问淘宝首页一次,所涉及的技术和系统规模都是完全不可想象的。是淘宝2000多名工程师的心血结晶,甚至包括长江学者、国家科技奖获得者等很多牛人。”

「去IOE」自主研发系统

“上IOE”是阿里在技术发展史上留下的辉煌一笔。

“IOE”是指三种标准的信息技术系统:IBM小型机、Oracle数据库和EMC集中式存储设备。

当时阿里和很多企业一样,靠IOE,比如氧气。加入阿里后,王健博士专门开会,提出了“去IOE”做云计算的想法,很多人觉得不现实。

当时参加会议的有马云、彭磊、卫哲、曾鸣、蔡崇信等。为了说服大家,王健从财务角度给大家算了个账。2007年,淘宝交易额600亿。他问大家淘宝几年后能不能达到1万亿GMV。

大家异口同声的说了信,并预测这个目标将在2012年实现(淘宝天猫GMV将在2012年底突破万亿)。然后王健问大家到时候客户的单价会不会变。大家都认为电商的红利期,客户会增加但客户单价不会有太大变化,预计到时候还是100元左右。

然后王健问大家,用户要求的搜索次数,每个产品要求的图片数会不会有变化。大家都觉得改变不大。然后王建做了一个算法,震惊了所有人。

一万亿除以100需要100亿次交易,100亿次交易需要数倍的搜索和图像存储。转换完这些数据后,王健计算出当时需要购买多少EMC存储,多少Oracle数据库,多少IBM小型机阿里,购买这些产品需要200亿元。

当时还是免费的淘宝,面对未来天价的设备采购成本,忍不住同意全面发展云计算。

王健还告诉与会者,发展云计算是符合未来发展趋势的:亚马逊在达到这个业务之前就发展了云计算。不仅仅是从成本方面,没有人能保证“IOE”是否能保证业务达到这个水平后业务的稳定运行。

此后,阿里巴巴云自主开发了分布式存储系统、天妃5K计算平台等硬核技术,并从零开始一步步成长。

这个变化并不容易,直到5年后的2013年5月17日,阿里集团的最后一台IBM小型机在支付宝下线,才正式宣告“去IOE”运动的结束。

「飞天」技术就是业务

用于替代IOE的云计算系统于2008年10月24日正式命名为“天妃”。

回顾阿里成立的前十年,一直是“技术追随商业”,技术永远是商业驱动,变化很多。

直到2009年9月10日,阿里巴巴第十届年会,阿里巴巴云子公司的成立,这条船的航向才发生了变化。这支400多人的团队开始了中国最早的云计算研发。

阿里巴巴云前总裁、蚂蚁集团首席执行官胡小明表示:“吸纳主义不能覆盖高层建筑,自主开发的云可以走得更远。”。

2009年初春,一群人聚集在北京钟会大厦203室,第一个代号“##由阿普萨拉在2009-02-19创造”诞生了。到2019年的十年间,阿里巴巴云的工程师至少换了五代,早期核心团队成员只剩下20%。

但是早期大家都是摸着石头过河。在第一届云起会议上,没有人能清楚地谈论云计算,许多人称之为“疯狂”和“大傻瓜”。但马云和阿里都坚信云计算是未来。

项目持续亏损,bug频发,团队跑路。在公司有很多问题的时候,Arine甚至在网上质疑王建是骗子,告诉马云不要相信他的话。但是马云直接说:“我会在十年内每年投资100亿元在阿里巴巴云上,但是我不能再做了。”。

当时,云计算在中国是“技术的无人区”。2012年BAT谈云计算。李彦宏仍然提到云计算是一瓶新的陈年老酒。马花藤认为,云计算只有在阿凡达时代才能实现。只有马云说:“不做云计算我们会死。”

关于“阿里巴巴云将被移除”的谣言直到2013年才彻底消失。那一年,天妃的单个集群容量达到5000台,使其成为世界上第一家向外部世界提供这种能力的公司,计算能力基础也宣布完成。

没有飞行,阿里就不是今天的阿里。正是从天妃开始,技术在阿里的功能角色发生了突变,技术与业务的关系从“技术服务业务”转变为“技术就是业务”。

DT时代的中台战略

2015年底,阿里巴巴集团宣布启动中台战略,目标是打造符合DT时代的“大中小前台”组织机制和业务机制。

前台作为一线业务,更快适应瞬息万变的市场,而中间台整合全集团的数字化运营能力和产品技术能力,形成对业务前台的强大支撑。

有一个流行的关于中国和台湾的类比:美军的作战策略是基于二战中的团,越南战争中的营,以及中东战争中的一线作战部队。敢把这么小的单位放在一线,是因为美军有强大的作战指挥系统,强大的中后台能力可以支持小分队快速判断。互联网时代的商业策略是一样的。

阿里巴巴以数字化的形式将核心竞争力沉淀为业务和数据两个中间站,“所有数据都以业务为导向,所有业务都以数据为导向”,用数字资产打造核心竞争力。

在中台架构中,“数据油”的力量出现,钉钉、飞猪、口碑等创新业务成功孵化。在一个半月的时间里,只花了七个人就开发出了这个性价比高的业务。外部企业需要几十个人来做生意

通过阿里巴巴云,阿里巴巴将支撑商业基础设施的技术和架构“雾化”,让客户企业快速复制中台架构。2018年,阿里宣布机构重组,阿里巴巴云升级为阿里巴巴云智能,中台能力与云全面融合,继续“科技创造新业务”之旅。

达摩院「活得要比阿里巴巴长」

马云对达摩院的要求之一就是要比阿里巴巴活得久。

继云计算、飞行系统、中台战略之后,阿里科技的吸引力越来越大,技术为这家公司提供了核心支撑。

阿里巴巴一直想建立自己的研究所。在通往科技长征的路上,它几次试图解开这个任务,但几次停下来琢磨,改变方向。它在等待合适的时机。

2017年10月,时间终于到了。阿里在当年的云起会议上宣布成立达摩研究所,探索未知的科技,发展以人类视觉为动力的基础科学、创新技术和应用技术。为此,阿里将在3年内向达摩院投资1000多亿元。

马云对达摩院还有另外两个要求:服务全球至少20亿人;我们必须面向未来,用科学技术解决未来的问题。

所以,从一般的角度来看,达摩研究所与一般研究所最大的区别在于解决社会问题的取向,其目的是“以利带乐为解决问题而研究”。

研究人员自称达摩院“扫地僧”,试图“扫除”现有和未知的技术问题。

达摩研究所下设4个X实验室,分别是机器智能、数据计算、机器人学、金融技术、X实验室。现在,一个完整的机器智能算法系统已经建成,涵盖了语音智能、语言技术、机器视觉和决策智能等技术方向。

来自iDST的达摩学院,保留了iDST的人才团队,继承了“技术驱动业务”的实践路径。

平头哥出道一周年

2019年9月15日,凌晨5: 20。

这是被誉为“世界最强AI芯片”的夜光800验证成功的日子,也是达摩研究所最后一批科学家走出办公室的日子。达摩研究所芯片技术部部长焦阳就是其中之一。

“直到几天前,我们还不知道自己能否成功。我们连续工作了7天,直到每天至少12点,”焦瑶回忆道。阿里的技术“疯子”再一次“化不可能为可能”。

阿里首席技术官、达摩院院长张剑锋打了个比方:淘宝拍立涛商品数据库,每天会增加10亿张商品图片。使用传统处理器计算能力识别需要1小时,但使用“夜光800”的时间可以减少到5分钟。在这个项目中,节省了90%以上的时间。

这是阿里平投歌芯片公司成立一年后,在2019年云起会议上交出的成绩单。

早在2018年4月,被阿里收购的中天微系统有限公司和达摩研究所自主开发的芯片业务整合为独立的芯片公司,在云中推动了集成芯片布局。

2019年,阿里核心的布局中,前面有“暗铁”和“无剑”,还有“含光”,也是以法宝命名的。在一些生态产品和企业成立动物园后,阿里在芯片领建立了自己的“军火库”。

如今,“平头哥”已经成为技术界提及最多的动物。

2019年,彭蕾在湖滨大学演讲时,她说,你做商业决策的时候,一旦看清了目标,就要不顾一切的往前冲,比如进入无人之地。

这些年来,这些技术上的“疯子”一再推进无人区。

现在,第十二届云起会议即将召开。据悉,会议将覆盖云计算、人工智能、机器学习、量子计算、芯片、AIoT等35大技术领域,共发布数百项新技术产品。

2020年3月,阿里董事长张勇曾说:“这场疫情让我们看到了数字化的巨大价值。我们预计,这次疫情过后,将掀起新一轮对数字经济基础设施的投资。”新的云起会议将与未来的数字时代齐头并进。