亲,双击屏幕即可自动滚动
第五百二十四章 大数据布局
    西湖一号国粹餐厅。“我正在城楼观山景,耳听得城外乱纷纷,旌旗招展空翻影,却原来是司马发来的兵...”浙江京剧团的老生在包房一角唱着马总喜爱的《空城计》,端得是胸有成竹,闲庭信步。阿里巴巴高管俱在,听到尾段的气息绵长后,掌声轻启。马云也才依依不舍收回目光,端起酒杯。“陈总,今天你可是喧宾夺主了。”陈学兵笑了笑没说话,和他碰了一杯,算是致歉。旁边的蔡崇信也举杯:“我倒觉得陈总说得好,只是今天正好遇上国美质疑,这样的机会,陈总应该多在互联网消费上回应几句。”淘宝商城马上要上线,做的是B2C,从品牌方直达消费者,服装、美妆、家居、运动,都是淘宝的目标,抢的是一切线下店的生意,而且要以支付宝为配合,猛攻手机端。今天若陈学兵表达昆仑对淘宝的支持,便正是宣传的良机,双方获益。陈学兵又是一笑,不客气起来:“机会倒是好,可是你们没准备好,得罪国美还是苏宁我都不在意,但人家讲的话有道理,你们比起线下消费体验还差了一大截。”马云眼睛一瞪:“怎么没有消费体验了?这可跟C2C集市不一样!大型商场有的优质服务我们全有,百分百品质保证,除了数码家电等特殊品类,都能七天无理由退货,有正规发票、购物积分!”“审核确定能严格吗?不会有C店卖家混入?全场包邮吗?加邮费能保证比线下便宜吗?几天能送达?”陈学兵一连反问五个问题。别说淘宝商城了,后来改版成天猫什么样子,他也不是没见过。马云蔡崇信面面相觑。这些问题其实是一串连带问题。全部上B端的货,厂家无法保证售价低于线下,因为线下经销商有供销协议,且物流既差又贵,若想让消费者感受到明显实惠,就不得不混入部分C端卖家。说白了,低级仿品不卖了,卖高仿。陈学兵见俩人哑口无言,靠在椅背上笑道:“要走通B2C,还得学京东,把物流和厂家都控制起来,搞自家的货仓,再通过庞大的进货量去压厂家价格,才能做好真正的正品。”马云逐渐凝眉。“不行不行,自营自建是悲剧,重资产走不远。”陈学兵差点就笑了。这话可真香啊。阿里以后做菜鸟,天猫自营,资产越搞越重,连线下无人超市都做起来了,疯狂补线下课,搞了个过犹不及。他现在是阿里的大股东,很想提醒两句,不过想想阿里靠着C2C廉价模式发展得顺风顺水,线下发展晚点就晚点,也无所谓。“你想推B2C,我给你出个主意。”“什么?”“你有没有想过,弄个购物节?”“什么购物节?促销?”马云瞬间明白过来。“对,一年一度的大促销,超级折扣,商家冲销量,用户疯抢那种,只要铺垫到位,就有足够的理由说服商家降价,给你最大折扣。”其实双11怎么搞他也不太明白,他尽量用简短的语言描述,让马云自己去想。一阵沉默。“我们确实想过,用超市那种促销方式,周四折扣,周五折扣什么的。”马云沉了口气,说道:“但是服务器吃不开,去年搞了一次电子大促销活动,订单卡了三个小时,投诉电话都被打爆了。陈学兵笑了。他想说的其实就是这个问题。既然马总主动提到了,他就顺着说下去:“我也注意到了,你们近期晚上8点钟左右网站都会卡,尤其是交易的时候,我看你们数据库交换有点顶不住。“对。”马云深以为然:“我们流量涨得太快,mySQL已经死了,我们现在靠IBm小型机,可是原来的那台小型机也顶不住了,最近正想换更强的。”mySQL是专门用于存储、读取和修改数据的软件工具,是入门数据库的首选。但这就是个小水管,早就顶不住淘宝的流量。真正的大水管是oracle,这是银行、证券、电信的标配数据库,必须在IBm小型机上才跑得动。这种IBm小型机非常贵,几百万一台,非常稳定,却是垂直扩容,如果要更换,只能让原来的下岗,换成一台更强的机器,四核换八核,32G内存换512G,普通硬盘换顶级EmC存储,越换越贵。IBm小型机,oracle数据库,EmC存储,这就是IoE。当然,IBm小型机也不是没有并行的办法,oracle推出了一种叫“RAC”的小型机集群方案,能加几台小型机进去一起跑,但是授权非常贵,一套下来几千万,而且非常复杂,出了问题就得去西方请佛祖来修。请佛祖,那势必是非常贵了。所以阿里很早想去“IoE”,引入雅虎,也有借助其搜索引擎技术团队的想法。只是后来发现并不如愿,雅虎拿着39%的股权日后还有夺权的可能,马云才想引入陈学兵,在上市之前把雅虎这个隐患剔除。“你们想跑起一个购物节,必须要有RAC集群,或者...找我,给你们搞备用机柜,甚至是分布式数据库。”陈总一步步端出了他真正想聊的话题。马云兀地清醒,犹疑道:“就是你那个...大数据中心?”“对。”陈学兵笑道:“我们很快会在前海建造大数据中心,第一批项目只要上马,起码能帮你扛起静态流量,订单、支付、库存暂时靠你们的oracle和IBm自己扛,等你把数据交给我们,我们以后就可以研发分布式数据库,解决高并发处理问题。”oracle+IBm,初建的数据中心肯定替代不了,但是专业服务器群比阿里的普通电信机房可强很多,只要服务器内存够大,性能够强,就可以把经常查的数据放内存里,从以前的用户点一下→查一次数据库,变成用户点一下→服务器自己内存里就有,从而不用查数据库,通过这种方式帮他把商品图片、页面、搜索、列表,缓存这些问题扛了。这样阿里自己的oracle+IBm压力就会小很多。马云是不可能为了一天购物节就去买一大堆专业服务器的,跟他合作,是最好的方案。但马云一听这个话题,顿时有点警惕了:“你要我们的数据?怎么可能给你?”“我要的只是你们的历史日志,研究规律而已,你把用户数据脱敏了再交给我们不就行了。”这个问题,陈学兵早就找自家的工程师请教明白了。其实也不复杂。大数据中心的发展,必须有海量的数据支撑才能模拟各种场景,研究出对应的服务器分配、分层算法,最好要有平台支撑,才能验证出真正好用的引擎,乃至高效的存储系统,高可用,容灾方案等等。他已经有微博这个平台。但是微博是轻社交,短文本,低频次的,数据还太单薄了,有一定社交系统的验证能力,但还撑不起分布式存储、高并发、实时计算、推荐算法、用户画像、风控这些真正值钱的大数据能力。而阿里的数据,是目前中国互联网唯一的全量商业数据。淘宝加支付宝,加上B2B板块的1688,那就太全面了,商品,广告,支付,信用,一应俱全。但阿里的数据不可能轻易交给别人,做互联网的都有这个意识。他今天把双11这个话题提出来,就是想一次性打破阿里“温水煮青蛙”,慢慢研究分布式引擎以缓解压力的想法,必须让马云看到利益就在眼前,才有足够的动力和他全面合作。其实他还准备了一些关于购物节的说辞,但马云既然已经提出“借用超市购物日”的精准说法,就说明对方不是没有产生过这种想法,只是没能力做。只需加强对方信念即可。“我给你们挑了一天,11月11日,网上有种说法,叫光棍节,现在在校园里传播非常广,而且11月是零售行业淡季,在这种没有节日竞争的月份做促销,非常容易集中引爆流量...双11购物节,你觉得响不响亮?”陈总眼神带着诱惑。马云吞了口口水。双11,听着真不错啊。“这...下个月就双11,来不及了吧?"搞这种促销活动,也得有货啊。到时候货不够,服务器准备也不足,玩什么?“你B2C商城都没上线,我说的当然是明年了,花一年的时间去准备,才有可能一炮打响。”陈学兵说完,重提自己的方案:“年底之前我就开始建大数据中心,第一批服务器明年秋季之前就可以上柜,明年秋季,我来尝试给你们服务器减负,同步帮你研究分布式引擎,11月之前帮你缓解数据库压力60%以上,三年之内,我帮你搞定分布式数据库方案。”“至于数据脱敏的问题...”他朝着对面的吴炯昂了昂下巴,“我咨询过了,挺简单的,你问问你们吴总就知道。”话到这里,其实房间里的人都在关注二人的对话了。马云抬眼看过去,首席技术官吴炯轻微点了下头。脫敏就是删掉用户标识,然后替换成随机数,一个普通工程师写个小脚本,几分钟就能跑完,挺简单的。脱敏以后看不到用户是谁,某用户买了啥,也看不到电话、地址、账户,但流量规律、压力波形、卡顿点全部保留。马云皱了皱眉:“你们上个月不是说这种大数据中心模式不可行吗?”这一下露了底,原来阿里内部早就讨论过。“是不行,陈总,你们这样的商业模式怎么坚持下来呢?”吴炯立马又开口,一一列举缺点:“一台服务器只能跑一个系统,服务一个网站,虚拟化技术目前很差,性能消耗巨大,怎么可能把同一台机器切给很多家公司共用?“而且安全是死穴,数据放你的机房等于把命给你,即使用户数据脱敏,通过我们的网络日志,你很容易复制一个和我们网站策略相同的公司。”“第三,成本算不过来,我们看不见机器,只能看到账单一直扣钱,根本没法做预算。”“我相信所有的企业都愿意用自己可控的服务器,即使服务器不够,大不了扩容就行了,没有多少人会真的把数据交给你,我们都觉得你这样的服务模式长久不了,不过我们是听马总说你要做深圳到香港的洗数据服务才勉强理解你的模式,有官方认证嘛,大家都会放心一点,你这样的快捷数据通道也不可替代,但没想到你是真的要做企业服务器支持。”他说着缓缓摇头,叹了一声。“乌托邦,这样的想法,真的是乌托邦。”陈学兵却是缓缓点头,脸带着淡笑。奇点的工程师们也是这么说,只是口吻委婉一些。不过他已经说服过自家的工程师了,并且捋顺了思路,自然不怕再来一次辩论。“虚拟机技术差,可以提升。“安全问题,我们是国家级试点,要建的是南方数字经济基础设施,国家数据底座,背后是国债的扶持,安全自然是第一考量,正如你所说,我们是强背书。“你说服务器不够,大不了扩容?这话你扪心自问,能解决阿里的问题吗?如果需要做双11这样的购物节,你去哪里拆借服务器?“未来的互联网流量是爆炸式增长,移动互联网时代要来了,以后大家兜里揣着的是一台能随时上网的机器,不仅能看网页,还能看电影,看直播,赛道也会不断增加,小企业发展到头部企业只需要一两年的时间,自己买服务器根本跟不上流量增长,而我们提供的云数据是弹性扩容,那是真正救命的东西。“是购买我们的服务划算,还是自己扩容服务器划算,到时候大家自然会算清这一笔长期账。”“最关键的是...我们以后提供的不仅是单纯的服务器,还有我们要研究的数据库技术,甚至有数据分析技术,直接帮你们提取用户行为数据,这一点我已经跟马总说过。“这些,是高价值数据服务,提供的价值高,收费自然也高。”“所以,我今天来找阿里合作,服务器方面我可以给你们优惠价,七折。“我帮你们研发的分布式引擎、缓存调度,优先在淘宝的图片、页面、搜索、静态流量上验证,不碰你们订单、支付、库存,并且这部分免费给你们落地,因为我也需要真实流量打磨系统,未来我的分布式数据库、底层调度技术成熟了,也优先给你们技术授权。”包房里话声朗朗,对面的阿里高管们脸色渐渐变化。今天的内容,其实大家都无比熟悉。因为上个月,他们才在宁波开了一场技术战略会。支付宝要独立,雅虎技术支持没有起色,大家对未来的技术方向都很迷茫。马云在会上拍了桌子,拿出陈学兵的大数据中心构想说事,提出以后十年,每年投入十亿搞数据和服务器方向的研发。大家都在激烈反对。理由便如吴炯刚才说的那些,还有西方数据库技术短期不可超越,极其不划算等等。可现在,陈学兵开口,简单三言两语便让阿里一众高管哑口无言,不复当日之勇。没办法。人家陈总有自己的独门底气。陈总有国家背书,手里掌握着众多移动通信技术方,以及渠道,研发出来的东西能让别人用,能分担成本。正如现在的阿里,乃至独立的支付宝,人家就是大股东了,开口提要求,大家还能干脆拒绝,不认真思量?更关键的是,人家在自己的公司是一言堂,金口一开要研发,内部谁敢提意见?底气太甚,底气太甚。要搞数据技术,这位就是天选之子。马云也意识到了这一点,想起当日自己在宁波提出“十年投百亿”,群臣激愤的样子,不禁有些丧气。还是独揽大权好啊。可谁又能学得了陈总?