2020-09-03

滴滴云平台事业群——就是稳!

桔妹导读:八月是云平台事业群分享月,这个月,我们看到了该团队众多优秀技术文章,云平台事业群看似默默无闻,但却支撑着整个滴滴的运作,发挥着至关重要的作用。本篇压轴更是云平台事业群的重磅特辑,想要了解更多或加入这个团队?快来看看我们的专访特辑,一起来了解这个又稳又深的事业群吧!

在今年滴滴内部的吐槽大会上,来自云平台事业群一位同学的吐槽让大家笑疯:"像我们这种基础部门,连工位都安排在地下,这说明我们公司的云平台事业群非常稳!就是人家问你base在哪儿,别人都是base在北京、杭州,我啊,base在basement!


▲ 点击播放专访视频

玩笑归玩笑,但是也说出了团队的两大特点:基础,稳。也因为这个稳定,一度让这个部门的"存在感"有点弱——大家开玩笑说,不故意整出点稳定性事故大家都看不到我们了。滴滴高级副总裁、云平台事业群负责人章文嵩曾说,他心中优秀的人才需要具备三个特点:聪明的头脑,对自己研究领域的热爱,以及沉下心来追求极致的做事风格。在采访了团队的三个风格迥异的小哥哥之后,发现他们果然是这种风格,而且真的在稳稳地成长。这个稳,不是慢、保守,而是扎实、稳健,并用稳定的表现创造了更大的价值。

江海挺:成长的"速度与激情"

2016年,滴滴合并了Uber中国,前期的激烈竞争和快速发展给系统留下很多坑,需要一一填平。云平台事业群应运而生,正处在"百废待兴"的状态。北大计算机系毕业的江海挺手握N个offer,但是他最后选择了滴滴。"当时公司发展势头非常猛,也充分展示了对于人才的渴求。这对刚出校园的我非常有吸引力。"海挺加入基础架构部,和部门一起,不断地挖掘需求,攻克技术难题,从零到一建立消息队列服务,为公司搭建起坚实可靠的基础架构。

海挺非常有自己的想法。有一次,他为了一个技术解决方案,和时任leader直接在会上争执起来。现任leader齐楠说:"看到海挺坚持发表自己的技术见解,很欣赏他,虽然新人考虑没那么全面,但是勇于表达见解是很可贵的。自己的独立思考,加上开放坦诚的环境,让他成长很快。"

这种执拗也让他能够沉得下心来钻研问题。"比起做业务,我喜欢现在这种追求极致的状态。把每一个问题都研究透彻。如果你喜欢做技术,这里有充足的发挥空间,不断把系统优化到自己认为比较好的状态,在一个小小点上做到极致。"几年的快速成长,现在的海挺已经带着一个8人的小团队了,他说自己是程序员背后的男人,基础架构的价值普通用户很难感知,但是程序员们却是心知肚明。

工作之外,海挺还是个机车boy,每天都骑着他心爱的机车上班,周末还会约着公司的机车爱好者一起出去兜风。成长的"速度与激情"让年轻的他动力满满,如何又快又稳,既兼顾速度又要扎实,是他这一路一直在思考和实践的。

蔡金平:想要把电路搞通,需要有全局思维

蔡金平目前在云平台事业群基础平台部负责机器学习异构计算和AI 的优化部署。他上学时学的是通信工程,平时最大的兴趣爱好就是自己动手弄电路板。在职业生涯的前几年,他和江海挺一样,执着于某一个领域的持续优化和突破。"之前,我在单点技术上不断突破时心里非常满足。但是几年后,我开始担心这也下去会不会路越来越窄?当我自己对这个技术的认知越来越深,怎么去让其他业务团队有这些认知,扩大我的技术影响力呢?如果不跟业务团队说明我的价值,那会不会变成一种自嗨?"

带着这些焦虑,他开始尝试跟业务部门推广自己的技术,可却屡屡碰壁,业务方那儿要么说优先级上不来,要么说系统改造难度大。金平觉得很沮丧和不解,"明明我这个技术很牛,优化效果就是很好,为什么你们不用呢?"

他后来才明白,不是技术不好,而是因为他只站在技术的角度思考,而忽略了业务部门的需求。电路板要想搞通,只从一边努力是不够的,需要有全局思维。"做技术的同学都有一个追求,就是想让更多的人来用自己的技术。但是慢慢我发现,技术本身有一个纵向发展的过程,而业务的需求则处在技术的不同阶段。你让一个发展初期的业务,去使用最前沿的技术,那不现实,更不合适。

所以,我们技术人不仅要能把自己的价值讲明白,还得懂业务,真正地深入到业务的链条中去帮它解决问题,看看技术到底在什么环节发挥作用,甚至还要想到业务方没有想到的,提前为他们布局。"金平的一番话,既是他这两年不断和业务磨合出来的经验,更是他所理解的"价值牵引,技术驱动"。

从一个深入的技术点跳出来,去看业务,看全局,有些人甚至为金平不值:有这个去看业务的时间,你多敲点代码,让自己的技术更牛不好吗?可金平有自己的选择:再牛的技术也不能自说自话,真正为业务方、为用户创造出更多的价值,才是技术最大的落地价值。就像完美的电路还是要看灯亮了多少,而不是电路有多复杂。

梁李印:厚积薄发,成长拼的是耐力

与江海挺这个年纪追求"速度与激情"不同,如今的梁李印喜欢的运动是长跑、徒步和爬山这样更考验耐力的项目。他长跑,一年跑了600公里,参加了8个马拉松;他爬山,就爬遍杭州附近所有的山。这些运动就像他的工作一样:需要沉下心来长久坚持,日积跬步,才能有质的飞跃。

梁李印目前在云平台事业群基础平台部负责大数据架构,滴滴的实时计算也是在他手中一点点从无到有。入职这几年,他完成了从一个核心骨干到一线管理者,再到二线管理者的华丽转身,如今已经是业界数一数二的大牛。他现在不仅要像蔡金平那样,把技术的价值给业务方讲得明明白白,更需要对整个团队讲得明明白白,给大家描绘一个清晰的愿景,以及制定好短中长期的里程碑目标。"不光是我能看到,更要让团队清晰地看到这些技术的价值,才能让团队更加凝聚,走得更远。"

作为技术专家,梁李印也总结了自己的成长之路的关键词。"第一,就是要'把事情做干净',追求极致。什么叫做干净?比如从a系统迁到b系统,大部分人都完成了80%的工作其实就拿到了结果,因为看上去b系统已经可以承接大部分工作了。可对我来说,A系统下线、服务停掉、机器关机,能做到这一步才算干净。只要a系统还活着,就是不干净。那么剩余的20%的问题就总是会出故障。第二,主动打开视野,不能只看自己的一亩三分地,而是多关注上游、下游、合作方做的事情,理解他们在做什么。还要多关注前沿技术,成为更全面的技术人。第三,要乐于当'客服'。好多技术不喜欢答疑,觉得浪费时间。其实,我们了解系统问题有两个来源,一种是服务本身出故障了,就有宝贵的机会去理解系统。另一种就是别人用出来问题。通过答疑,我不仅能看出代码中看不到的问题,还可以就此跟用户建立联系。知道他到底用你的服务在干什么,进一步挖掘出来技术的真正价值,逐渐对公司的整个业务状况就会非常了解。"

看完这三个云平台事业群的小哥哥,你是不是对这个隐藏很深的部门有了些新的认识?他们在自己的技术领域潜心钻研,不断追求极致,同时还有"功成不必在我"的胸怀,"业务的成功就是我们的成功"是他们的信条。他们一路走来稳而扎实,造就了今天滴滴坚实的数据基础,成为一支能抗压、能钻研的队伍,支撑更多新业务突飞猛进。加入这样快速成长的团队,真的稳了!

云平台事业群简介

云平台事业群成立以来,作为公司业务发展的底层基石,肩负「技术赋能让企业服务更美好」的使命,我们精益求精,追求卓越,致力于打造一个稳定、高效、创新的云计算服务平台,建成世界一流的大数据体系,为滴滴全平台业务的稳定和高效运行保驾护航。

基础平台部和滴滴云两大事业部构成了我们的云平台事业群。

基础平台部、下设8个独立的技术领域团队,我们有:提供一站式大数据解决方案的数据平台;提供数据工程建设和数据资产沉淀的数据治理团队;提供大规模离线计算和实时计算的大数据架构团队;加速人工智能发展、促进智慧出行的机器学习平台;提供大规模在线高可用中间件和基础服务及操作系统能力的基础架构团队;支撑滴滴所有业务的多地数据中心集群和骨干网络的系统团队;保障全球领先出行平台稳定高效运行的运维团队;提升滴滴运营效率和决策水平的IT团队。

滴滴云基于滴滴出行的业务技术和经验积累,采用领先的云计算架构、高规格服务器集群搭建、高性能资源配置机制、精细化运营模式,致力于为开发者提供简单快捷、高效稳定、高性价比、安全可靠的IT基础设施云服务。

我们是一支使命驱动、善打攻坚战、敢打硬仗,能打胜仗的队伍!我们崇尚价值牵引,技术驱动,如果你热爱技术,期待通过技术赋能让企业服务更美好!欢迎加入我们!

所有热招岗位

资深数据平台开发工程师/专家(北京/杭州)

岗位职责:

  1. 负责数据平台相关的开发和建设;

  2. 构建海量数据存储、离线/实时计算、实时查询的平台,以及监控、调度、BI分析报表平台。

任职要求:

1. 熟悉互联网产品和服务的开发过程,熟悉后端技术架构,具备良好的系统设计能力

2.掌握主流的互联网平台开发技术,如spring boot、中间件、k8s,对前端技术有所掌握和了解;

3. 8年以上大数据系统相关经验,熟悉以下多项,有相关的应用和优化经验e.g. Hadoop, Mapreduce, Hive, Druid,flink,Spark, kylin,kafka etc;

4. 强悍的编码及架构设计能力,生产环境快速 trouble-shooting能力,对新技术有强烈的学习热情;

5. 有良好的产品和服务意识,有相关数据平台开发经验者优先。

资深数据仓库开发工程师/专家 (北京)

岗位职责:

1. 参与滴滴国内出行数据体系建设工作;

2. 负责数据仓库ETL流程的优化及解决相关技术问题;

3. 参与数据产品设计和评审,保障数据平台架构稳定。

任职要求:

1. 三年及以上ETL开发经验,深入理解常用的数据建模理论,可独立把控数据仓库各层级的设计;

2. 熟悉Hadoop生态,精通HDFS、Hive、MR开发,熟悉Spark、Presto,有任务调优经验;

3. 了解数据治理,理解数据治理的重要性并从事过治理相关工作;

4. 具备较强的编程能力和编程经验,至少熟悉Java/Python一门编程语言,熟悉linux系统,熟练使用Shell;

5. 具备一定的数据分析能力,具备数据敏感性和探知欲,专注数据的价值发现和转化;

6. 具备快速学习能力、沟通协调能力及团队精神,有较强的责任心和学习积极性。

资深数据库开发工程师/专家(北京)

工作职责:

1.负责整个公司级分布式关系型数据库MySQL/MyRocks内核的设计、研发和优化工作;

2. 负责公司文档型数据库存储服务MongoDB的研发工作;

3. 设计、研发高可用、高性能、低成本的存储架构,应对弹性扩缩容,秒级故障自动切换,异地多活,分布式事务等极具挑战性的工作内容和方向,保障数万台规模集群的高效稳定运行。

任职要求:

1. 计算机或相关专业本科以上学历(5年以上工作经验);

2. 精通C/C++/golang程序开发(至少一种),熟悉Linux/Unix开发环境;

3. 熟悉常用开源分布式系统,熟悉MySQL、 MongoDB 、MyRocks、Rocksdb等任意开源产品源代码 者优先;

4. 熟悉TCP/IP网络协议;

5. 有较强的问题分析和定位能力;

6. 有大规模分布式系统开发、维护经验,有故障处理能力,源码级开发能力;

7. 具有良好的沟通协作能力,具有较强的分享精神。

资深Spark工程师/专家(北京/杭州)

岗位职责:

1. 管理、优化并维护集群Spark引擎,深入Spark源码研究和二次开发,解决各种线上问题,参与到开源社区建设和代码贡献;

2. 打造业界领先的大数据计算平台,为海量数据及其上的大规模数据挖掘、数据分析、机器学习业务系统提供可靠、高效的支持;

3. 研究业界最新的大数据技术,参与滴滴大数据平台的设计与开发,提供有前瞻性的大数据基础架构解决方案;

4. 乐于挑战没有明显答案的问题,快速理解业务场景,从具体问题中抽象出通用的解决方案。

任职要求:

1. 计算机或相关专业本科以上,5年以上工作经验,不少于2年大数据架构经验;

2. 具备扎实的Scala语言编程基础,具备良好的编程习惯,较强独立解决问题的能力;

3. 精通Spark源码,对社区有贡献者加分;

4. 参与过大型复杂分布式系统的设计、架构者优先;

5. 做事严谨踏实,责任心强,具有良好的沟通能力和团队意识。

资深运维开发工程师/专家 (北京/杭州)

岗位职责:

1. 负责滴滴线上业务的日常运维、优化、容量管理等工作,7x24小时保障线上业务的稳定运行;

2. 负责维护公司运维基础设施的正常运行;

3. 负责公司运维基础设施产品设计及需求跟进,包括监控系统,运维平台,自动化部署系统,虚拟化平台等;

4. 研究运维新技术和方向,持续提高生产力。

任职要求:

1. 计算机相关专业本科以上学历,基础知识扎实,有较大规模在线业务运维、优化等工作经验;

2. 熟悉Linux操作系统,熟练使用C、golang或Python、Ruby、Shell等脚本语言开发;

3. 热爱技术,能保持对新技术的探索与应用学习能力强,认真踏实肯钻研,重度github用户优先;

4. 具备良好的系统分析能力,良好的抽象思维和逻辑思维能力,对运维体系有深入的研究和理解;

5. 强烈责任感,有良好的时间观念,能很好的沟通交流,乐于分享。

资深内核开发工程师/专家(北京)

工作职责:

1. 基于开源软件搭建和开发支撑公司业务发展的底层基础架构平台;

2. 通过各种创新技术提高底层基础架构平台的使用效率;

3. 优化公司业务在底层基础架构平台的性能表现。

任职要求:

1. 计算机相关专业本科及以上学历,深入理解操作系统原理及Linux内核;

2. 熟悉Docker及container技术或底层资源隔离者优先、熟悉Linux内核存储,内存管理,或网络stack者优先、熟悉虚拟化技术及KVM者优先;

3. 具有系统性能分析及优化经验者优先;

4. 具备良好的语言表达、沟通能力和团队合作精神。

简历投递邮箱:IPDHRBP@didiglobal.com

欢迎持续关注云平台事业群招聘信息

留言互动 拿定制好礼

作为一名追求极致的工程师(程序员) ,工作中你都有哪些可爱的强迫症?或你对滴滴云平台事业群,有什么走心的话想说?请在本文末留言参与,**截止9月2日21:00,前往微信公众号平台"滴滴技术"本篇文章留言点赞前3的同学,将获得云平台定制T恤1件+水杯1个+200元打车卡1张。留言点赞第4-10位同学,获得云平台定制T恤1件。

阅读更多团队技术文章

1. 滴滴ElasticSearch平台跨版本升级与重构之路

2. 滴滴ElasticSearch千万级TPS写入性能翻倍技术剖析

3. 滴滴推理引擎IFX:千万规模设备下AI部署实践

4. GPU虚拟机创建时间深度优化

5. 可编程网卡芯片在滴滴云网络的应用实践

6. 滴滴数据通道服务演进之路

7. 实时数仓在滴滴的实践和落地

8. 滴滴数据仓库指标体系建设实践

9. 滴滴Ceph分布式存储系统优化之锁优化

10. 滴滴七层接入平台实践和探索

… …

内容团队

出品 | 科技生态与发展部

特别鸣谢 | 云平台事业群 企业文化部 公众沟通部

文案策划 | 毛赫男 翦单艾

视频制作 | 沈淑贤

内容编辑 | 周浩瀚

延伸阅读


滴滴技术 出品

滴滴云平台事业群——就是稳!小白必学的亚马逊平台基础运营推荐课程站外推广尼日利亚一个中骗子横行的国度,适合电商生长吗?亚马逊旺季来临,哪些该做哪些不该做?Entriwise2019亚马逊黑科技合辑目前跨境电商的前景怎么样?速卖通、亚马逊、shopee等跨境平台哪个更适合创业呢?

No comments:

Post a Comment