victory
一、项目概述
整体项目介绍:
Victory是一家面向海外市场的中小型游戏制作公司,已与全球多个发行商和合作伙伴建立了稳固的合作关系,致力于将其游戏推向更广泛的受众。尽管Victory的游戏已在多个国家和地区成功上线,但现有架构遇到了瓶颈,难以实现更快的迭代和更高效的资源利用,以满足不断增长的用户需求和多样化的市场要求。此外,公司的技术人员和运维经验也有限。
在这种情况下,Victory借助AWS及其合作伙伴神灏云的帮助,顺利实现了云端转型。通过采用EC2(包括EKS和ECS节点)、AutoScaling Group、CloudFront全球加速、ElastiCache与Aurora数据层,以及WAF安全防护等服务,并结合多AZ部署和CloudWatch实时监测,Victory实现了全球用户对游戏平台的加速访问和高可用性。此外,通过对容器编排平台和应用程序的调优,Victory显著提升了整体性能和用户体验。
项目上线后,Victory的整体成本降低了37%,部署效率提升了30%,平台可用性达到了99.9%,并为公司带来了长期的成本效益。
客户问题:
现有技术架构难以满足不断增长的业务需求,同时公司的技术人员和运维经验也有限。为了降低IT成本并提高运营效率,公司决定寻求云服务解决方案。
作为一家中小企业,Victory需要一个能提供专业技术支持、同时确保成本可控的云服务方案,以支持业务稳定发展。具体要求包括:
1.降低IT基础设施和运维成本
2.提高系统弹性和可扩展性,满足游戏业务高并发需求
3.获得专业的云架构设计和迁移服务支持
4.提供持续的技术培训,帮助内部团队掌握云运维能力
5.整体解决方案成本在公司可承受范围内
Victory期望通过合适的云服务转型,实现IT降本增效,为业务发展提供有力支撑。
神灏云作为AWS的高级咨询合作伙伴,拥有丰富的POC测试、上云、云管理和云运维经验。为AWS用户提供一站式解决方案和全面服务支持。通过AWS云托管解决方案,Victory将获得灵活且可扩展的云服务,满足高并发游戏业务需求。AWS的按需付费模式和多种优惠计划将帮助Victory有效控制IT成本。神灏云提供专业的云架构设计和上云服务,确保转型顺利进行。此外,还提供持续的技术培训,帮助Victory内部团队掌握云运维能力。会为Victory创建详细的转型路线图,确保在每个阶段都能充分利用AWS资产,实现IT降本增效,为业务发展提供强大支撑。
项目成功标准
在本项目初期,由于客户云上经验不足,因此投入大量精力以对客户的运维人员做云上环境基础培训,客户要求无业务中断迁移,因此采用分段上云策略,上云完成后数据完整一致性检查通过。在系统性能方面,通过负载均衡实现流量的分配和平衡,及EC2 AutoScaling Groups实现集群节点级的横向扩缩容,自动的根据部署的应用所请求的资源量来动态的伸缩,因此响应时间降低50%,并发处理能力提升3倍,页面加载速度提升40%。同时实现了系统高可用性,故障恢复时间缩短80%,并建立了跨区域容灾能力。在运维效率方面,资源部署时间缩短90%,问题定位时间减少70%,运维人力成本降低50%。此外,项目还实现了显著的成本优化,IT基础设施成本降低30%,资源利用率提升60%,运营成本总体节省40%。通过弹性计算、负载均衡、CDN加速和跨区域容灾等基础架构,结合云数据库的读写分离、安全防护机制以及自动化运维体系,打造高可用且易于复制部署的完整解决方案。
二、解决方案架构/架构图

该架构主要目的是通过对后端应用功能模块的拆分,分别部署到AWS EC2上;通过前端NLB来解决用户访问压力;
整个架构说明如下:
1.业务主要使用的资源有Amazon EC2、Amazon Redis、Amazon RDS、CloudFront、Amazon S3、NLB、AWS GA等;
2.Amazon EC2配置部署AutoScaling Group,以此自动的根据部署的应用所请求的资源量来动态的伸缩;
3.采用S3来存储静态资源,并提使用CloudFront对外提供访问;
4.将原有的阿里云RDS替换为AWS RDS,配合多AZ部署,实现高可用,简化在云中设置、运营和扩展数据库的过程;
5.使用CloudWatch,设置适当的监控和日志记录机制,实时监测应用程序的运行状态和性能;对容器编排平台和应用程序进行调优,以提高性能和可靠性;
6.使用AWS Backup,做RDS数据的备份,容灾,还原等操作;
7.使用ElastiCache作为用户登录信息,游戏状态的缓存,提供高速访问;
8.使用AWS GA为全球用户提供游戏的加速访问;
9.使用Route 53托管客户的域名;
10.使用WAF保证应用层流量的安全;
整个架构中,通过负载均衡实现流量的分配和平衡,使用EC2 AutoScaling Groups实现集群节点级的横向扩缩容。通过神灏云托管服务以及AWS解决方案实现了更高的资源利用率,成功构建了高可用、低延迟、安全合规的游戏平台,提升系统性能和运维效率的同时实现了成本优化。通过此次上云项目,Victory实现了业务的高可用性、成本优化、合规性提升、运维压力减小以及更高的容灾要求,从而全面提升客户业务竞争力和运营效率。
三、商业价值分析
核心需求分析
收集业务资料:收集各个业务相关的所有资料,包括应用程序、数据库及类型(自建、RDS等)、计算需求、网络架构、存储需求(块存储、对象存储、文件存储等)、性能指标和用户需求等。了解业务的目标、范围和关键业务流程(以提高性能、降低成本、提升可用性或实现新功能为主)。
识别多个业务项目之间的依赖关系:确定应用程序、数据库和其他组件之间的依赖关系。了解数据流、接口、集成点和相互作用。为后续决策和规划迁移策略提供基础。
分析资源使用情况:审查当前在阿里云上使用的资源的使用情况。包括计算实例、存储容量、网络带宽、安全等其他云服务。分析资源的利用率、性能指标和成本,以确定是否需要进行优化或调整。
评估应用程序适应性:评估应用程序的可迁移性和适应性。考虑应用程序的架构、编程语言、工具和框架等因素,以确定是否需要做出修改或重新设计。
分析数据迁移需求:了解要迁移的数据量、类型和敏感性。确定如何迁移数据,包括数据库迁移、文件迁移和实时数据同步。考虑数据一致性、完整性和安全性的要求。
评估安全和合规性:审查业务的安全和合规性要求,包括数据隐私、合规标准和法律要求等。了解阿里云和AWS之间的差异,并确保在迁移过程中满足适用的安全和合规性要求。
分析性能需求:根据业务需求和用户体验要求,确定AWS提供的计算、存储和网络服务是否能够满足这些需求。考虑扩展性和弹性的要求。
识别风险和挑战:分析迁移到AWS可能面临的风险和挑战。考虑阿里云与云平台的技术差异、网络连接、数据迁移中断和业务连续性等问题,并制定相应的风险管理策略。
进行成本分析和人员及项目的规划安排:分析迁移到AWS的成本,并与当前阿里云服务进行比较。规划和安排所需的人员和项目资源。
解决方案
为客户AWS上云设计中,AWS云架构设计包含许多应用服务与各种用例的设计模式和体系结构选型。AWS的一些关键设计原则包括可扩展性,可利用资源,自动化,松耦合管理服务,以及灵活的数据存储选型等。
根据客户的应用业务特点、以及目前面临的实际问题与挑战,从以下几个维度进行裁剪规划:
生产环境规划多可用区,四层子网架构规划设计(包括:Public、Web、Service、DB)。在公有子网部署NAT网关,将业务服务层、数据库、缓存等部署在多可用区的私有子网中,实现系统的安全和高可用。
客户所有业务组件部署在一个VPC中的多个可用区. 以实现业务高可用。其中平台服务前端服务部署在Web subnet 私有子网中, 平台的逻辑处理服务器部署在Service subnet 这个私有子网中, 数据库以及Redis缓存服务部署在DB subnet 这个私有子网中, 所有服务/组件均在私有子网中, 确保各服务和组件的安全, 私有子网通过部署在公共子网的NAT Gateway 来访问公共资源, 添加严格的安全组控制, 方便管理人员管理服务器资源。
1)使用Amazon ALB 来对网络请求进行负载均衡, 确保网络流量均衡分配。
2)客户VPC之间的系统需要互通访问,使用VPC peering可以连接VPC访问,所有访问将不走公网。
3)客户VPC中系统访问S3,使用网关终端节点通过私有网络通道访问S3桶,提高了效率、实现了高可靠。
4)客户系统有可能需要高性能的磁盘IOPS,为了避免因为磁盘的性能(IOPS、吞吐量)导致服务的性能收到影响,推荐客户服务器存储EBS卷采用gp3类型,运行后再基于IOPS和吞吐量的监控进行调整。
5)所有部署在AWS环境中的EC2均采用多可用区部署,当一个可用区发生故障时,其它可用区可以提供服务,使用 AutoReboot 功能实现应用实例自动恢复。通过AuroScaling组实现自动伸缩
6)使用AWS CloudTrail跟踪用户活动和API使用情况,以便进行审计和遵从性报告。
7)使用AWS Cost Explorer来监控和控制AWS的使用成本。使用预留实例来减少长期使用的成本。
项目效益
将系统上云到AWS云平台可以带来以下几个优势:
1.弹性和可扩展性:AWS提供强大的弹性计算功能,例如Amazon EC2和Auto Scaling。这意味着您可以根据需求快速调整计算资源,以适应流量峰值和业务增长,而无需事先规划和投资昂贵的硬件设备。
2.高可用性和容错性:AWS在全球范围内构建了高度可靠的基础设施,提供多个可用区域和数据中心。通过将系统迁移到AWS,您可以利用这些分布式的资源来实现高可用性和容错性,确保系统在面对故障或灾难时仍然可用。
3.全球覆盖和低延迟:AWS有多个区域和边缘位置,使您能够接近用户并降低访问延迟。这对于提供全球化的系统或面向特定地理区域的内容分发非常重要,可以提升用户体验和响应速度。
4.安全性和合规性:AWS具备世界级的安全性和合规性标准。通过使用AWS提供的安全服务和功能(如IAM、VPC、WAF等),可以加强系统的安全性,并满足行业和法规要求。
5.多样化的服务和工具:AWS提供了广泛的云服务和工具,以支持构建、部署和管理CMS系统。您可以根据需求选择适合的服务,如Amazon RDS进行数据库管理、Amazon S3进行存储、Amazon CloudFront进行内容分发等。
6.成本效益:通过将系统迁移到AWS,您可以避免购买昂贵的硬件设备和维护费用。AWS采用按需付费模型,您只需要支付实际使用的资源,同时可以根据需求灵活调整,从而实现更好的成本控制和优化。
综上所述,迁移到AWS可以带来弹性和可扩展性、高可用性和容错性、全球覆盖和低延迟、安全性和合规性、多样化的服务和工具以及成本效益等优势。这些优势将为系统提供更好的性能、可靠性和安全性,并支持您的业务增长和创新。
价值收益
采用 亚马逊云科技的大数据解决方案计算成本降低23%;
采用AWS 托管服务后专注于创新,而不是维护,并快速自动扩展以响应动态工作负载,减轻耗时的维护任务;
开发时间从两周缩短,减少开发开销;
促进产品快速迭代,改进用户交互,提高了用户粘性。
四、成本优化
神灏云基于多年的云运维经验,通过多种技术方法帮助用户节约AWS上的成本。主要包括以下几种方法:
全生命周期的管理
IAM最小权限管理:使用IAM角色进行最小资源权限管理与授权。
Tag标签管理:全面对AWS资源进行Tag标签管理,便于在账单中分类和显示每个资源的信息。
资源隔离:配置预生产域和生产域,实现资源隔离。
定期回收空闲资源
Tag标签规范:通过Tag标签规范,追踪IAM用户使用资源情况。
成本优化检查:根据Amazon Trusted Advisor成本优化检查,识别和回收空闲资源。
自动扩展:当负载降低时,Auto Scaling 自动释放因达到阈值所新增资源。
低频存储优化管理
账单分析:定时对账单进行分析,预期花费进行对比,确保资源没有浪费并被合理使用。
实例类型优化:按需实例使用超期,可考虑提升为预留实例。
S3存储优化:对于访问率低的S3存储,可降为低频访问标准。
定期评估资源成本
成本估算:设计架构时利用AWS Cost Explorer估算成本。
区域选择:对比不同Region价格差异,选择合适的区域。
计费资源选择:根据环境(生产、准生产)购买不同计费资源(预留、按需)。
五、Vistory客户收益
可用性提高
使用AWS并利用多区域(Region)和可用区(Availability Zone),使整体架构更为稳定,保证了客户业务高可用性。
成本优化
此项目是一个整体技术架构的优化改造过程,通过本次上云,客户整个业务无单点,无耦合,花更少的钱,性能提高。
合规性提高
利用VPC、安全组服务,提高业务系统安全可靠;利用AWS S3,灵活应用存储服务,归档成本低,用户长期保存数据,符合国际监管要求。
减小运维压力
客户使用了EC2、RDS成熟产品,减少数据库上的运维压力,将重心放在业务创新上。
满足更高容灾要求
用户主要业务运行在全球Region,通过北美多Region部署异地灾备中心,从而满足业务系统运营持续性要求
六、经验教训
通过本次上云项目,我们深刻认识到前期与客户沟通需求、评估客户原有用量并在此基础上进行架构调整的重要性。这为项目的顺利展开奠定了坚实的基础。在实施过程中,神灏云为客户提供了全方位支持,快速响应并解决问题。通过自动化部署基础服务,减少了人为错误,缩短了运维部署时间,显著提升了效率,为项目的稳定运行提供了有力保障。
在后续阶段,神灏云将建议客户利用AWS AI相关产品,为游戏平台打造专属智能机器人系统,并构建专业知识库系统,以实现用户和游戏平台的高度粘合性。通过这些技术创新,神灏云将为客户提供更智能、更个性化的解决方案,持续助力企业的数字化转型。