返回顶部
分享到

【转载】上云最佳实践——电商行业(下)

资讯 2017-3-1 12:00 679人浏览 0人回复
原作者: 青叶竹 来自: CSDN 收藏 分享 邀请
摘要

随着云计算的到来,传统IT已经向大数据(DT)时代变革。云计算低成本、高效率、灵活扩展等诸多优点,已经在逐渐淘汰传统IDC的IT模式。


  • 上云实践6lvm在磁盘管理方面的应用  在云端迁移方案中,我们购买了四块1T数据盘(每台ECS最多只能挂四块数据盘),通过LVM逻辑卷虚拟成一块4T磁盘,这样我们在云端保障了大于2T存储数据量的冗余空间。官方是不推荐使用LVM。因为阿里云的快照主要针对的单块磁盘,不能针对几块磁盘同时快照。而LVM主要针对的多块磁盘(物理卷)的基础之上,抽象成为逻辑卷。LVM的读写针对的是逻辑卷,数据被分散存在至底层的物理卷(磁盘)上。如果某块磁盘数据损坏,如果通过快照恢复这块磁盘的数据,我们无法保障LVM逻辑卷整体数据的完整性。通过LVM主要是能够提升磁盘IO,比如需要购买100G的数据盘。常规配置,买一块100G的数据盘即可。但是我们也可以购买425G的数据盘,通过LVM虚拟化成为一块100G的磁盘。在功能性上面都能满足需求,但在磁盘IO性能上面,LVM至少能提升20%-40%IO性能。
  • 上云实践7rsync在云端应用  怎么样将线下数据不停机实时的迁移到云端,rsync是文件增量同步迁移最优方案。只不过在此项目中,一方面数据传输要走公网,另外一方面数据量较大。所以我们初步统计下来,完成数据增量迁移至少需要一周多。所以这方面的数据迁移由于时间周期较长,为了避免影响整体迁移进度,我们需要提前进行。

5.4、迁移实施:201616—201617

二十多台云主机牵扯nginxphptomcatredisvarnish等环境部署,我们通过自动化的部署手段来保障部署的最大效率。线上23台服务器环境的部署,我们半个小时内搞定。

  • 上云实践8:域名备案要先行  上云的最后一步,是需要将域名的ip解析到SLB公网IP(或ECS公网IP)上。但前提是域名备案需要在阿里云上,不要到最后域名解析到阿里云上后发现域名被拉黑,业务访问被拒绝,才发现未备案到阿里云,这将会变得非常麻烦。所以我们需要提前通过阿里云进行域名备案,或者已经在其他供应商备案过,需要将域名备案转接入阿里云。
  • 上云实践9:通过镜像提升云端部署效率  刚开始我们开了一台ECS,针对这台ECS我们做了运维规范方面的系统调优、安全加固等。然后我们把这台ECS做成了一个基础镜像,批量开通了22台同样环境服务器,在部署效率上面大大提升。
  • 上云实践10:自动化运维工具的应用  对应软件的安装脚本,我们内部团队都统一存在在内部的gitlab中。我们通过ansible工具,定制对应playbook,推送对应的安装脚本到目标机器上。5分钟内搞定了对应Javaphppython等环境的安装。

至此,我们引来了迁移最为痛苦的时期。由于运维配置手册、运维文档的缺失,所以我们将应用代码部署到我们已经搭建好的环境中后,我们需要对每一项参数、每一个配置都要仔细调试。我们三名运维同学拉着客户运维人员、研发团队不眠不休整整一天一夜,完成了所有代码的调试、对应配置的文件的调试。至此,我们迁移工作完成了大半。后续核心工作主要集中在功能测试、性能测试及上线割接了。

5.5、迁移测试:201619—2016111

此阶段主要为功能测试、性能测试,主要集中在客户的测试团队。

5.6、上线割接:2016113—2016115

上线割接前,需要做好客户及公司内部的维护通告。正式迁移的时候,由于系统、代码、文件都已迁移过去。加上客户数据库较多,无法做到实时迁移,所以我们采用了保守做法,停机迁移。迁移的最后一步是将域名解析至阿里云,这里在前面也提过,域名需要提前备案的。

到此是不是完成了最终迁移呢?其实还是没有的,虽然域名已经解析到最新的ip,当前万网的刷新最新的解析记录的时间周期最短也仅仅10分钟。但是我们没法把控的客户端本地的DNS缓存,即还会有部分客户还是访问到老的站点。所以完成最后迁移,我们还差最后一步:

  • 上云实践10nginx反向代理将老用户请求引流至阿里云  还依旧访问IDC机房应用的客户,我们在IDC机房前端nginx上做302重定向跳转,将依旧还访问IDC的客户引流到阿里云。值得注意的是,由于nginx是七层负载均衡,需要匹配域名。这里nginxserver_name和跳转的链接配置的域名都是同一个,为了确保跳转的域名解析的地址为阿里云,我们可以在nginx所在服务器的hosts配置中强制将域名的解析ip设置为阿里云对应的IP

5.7、项目交付及后期监控运维

后续便是项目交付,主要为文档的编写总结。此项目我们总共汇总了三十余个文档,主要包含系统软件架构、系统架构、迁移方案、运维实施配置文档、运维维护手册、故障处理文档、资源清单等等。

文档交付后,进入后续7*24日常监控及运维阶段,这里不再过多概述。

六、上云前后的对比

写这篇文章的时候,我一直在脑海中搜索有没有一个上云的实践对得起“最佳”二字。对我本身而言,在面对成百上千的客户实践案例中。这个项目无非是我体会最深刻,总感觉千言万语总嫌少。一切尽在以下对比图中:

 

IDC

阿里云

配置

3个机柜 
15台硬件服务器(包含两台96G内存配置)

23台ECS(4核8G、2核4G)
1台按量SLB
2台RDS(6000M/200G、2400M/200G)

带宽

200Mbps/电信独享

1Gbps/BGP网络

成本

 

人员成本:15w/人 *4人= 60w
资源成本:8w/年*3个机柜=24w
     100元/Mbps*1个月*12个月* 200 = 24w
                                        
合计:100w/年

资源成本:15000元/月*10= 15w
第三方运维服务费用:12w
                             
合计:27w/年

  • 上云实践11IT正在向DT变革随着云计算的到来,传统IT已经向大数据(DT)时代变革。云计算低成本、高效率、灵活扩展等诸多优点,已经在逐渐淘汰传统IDCIT模式。正如上面迁云的对比表格中,可以看到在成本里面。迁云前,是有四个运维人员的。迁云后,客户是没有运维人员的。在上云的第一年,客户仅保留了一名运维来处理日常琐事。在第二年中,客户公司已经将剩下的一名运维人员也裁掉。从某方面来讲,云时代对运维行业是冲击,很多运维人员面临失业。因为传统中小型互联网公司不再需要运维人员来做一些琐事,这些问题在云平台中都得以解决。从另外一方面来讲,这也将跟我们带来新的机遇及挑战,要求技术人员的技术更加全面。这也是为什么很多人说devops是未来之路的根本原因!
推广广告
星点云香港服务器,CN2高速连接,ping值低可免费换IP,安全稳定,技术团队24小时在线稳定无忧
本文暂无评论,快来抢沙发!

热门问答
云萌主 云萌主-BIGSAAS旗下,由北京合智互联信息技术有限公司在2018年创立,为广大云应用技术爱好者的平台。在云萌主论坛可以查看云应用技术文章、云产品产品最新资讯、技术问答、技术视频。在畅游云上技术的同时,学到最新的云应用产品和技术。
  • 微信公众号

  • Powered by Discuz! X3.4 | Licensed | Copyright © 2001-2022, Aliyun Cloud. | 星点互联设计
  • 京ICP备18052714号 | 营业执照 | |合智互联| QQ