Wuyou
一、项目概述
整体项目介绍:
吾游互动是一家经验丰富、技术先进、资源丰富的小规模移动广告公司,专注于技术创新和数据积累。公司拥有多个全球移动广告平台,通过多维度分析和精准投放,提升广告效果。然而,随着业务的快速发展,现有IT架构已无法满足需求。公司面临显著的业务波动:高峰期服务器资源严重不足,影响客户访问体验;而在低谷期,服务器资源闲置,造成严重浪费。由于行业特性,整体流量占比成本极高,同时公司还面临人力成本高、缺乏上云经验和技术支持等挑战。
作为一家中小型企业,吾游互动希望在有限的预算内完成IT基础设施升级,实现资源弹性伸缩和运营效率提升。通过与神灏的深入沟通,选择AWS云托管解决方案,为用户创新提供了灵活性和可扩展性,并为客户制定了明确的转型路线图。在成本方面,采用按需付费模式并利用预留实例等优惠方案,有效控制支出。此外,神灏将提供成熟的架构方案、部署指南和自动化运维工具,以及完善的监控告警体系,帮助吾游互动平稳完成云端转型,实现高可用性和成本优化的双重目标。
客户问题
吾游互动是一家小规模移动广告公司,随着业务发展,现有IT架构已无法满足需求。公司面临显著的业务波动特征:高峰期服务器资源严重不足,影响大量客户访问体验;而在低谷期,污油互动。由于行业特性,整体的流量占比成本很高,同时,公司还面临人力成本高、缺乏上云经验和技术支持等挑战。作为中小型企业,希望在有限的预算内完成IT基础设施升级,实现资源弹性伸缩,提升运营效率。
神灏云作为AWS的高级咨询合作伙伴,拥有丰富的POC测试、上云、云管理和云运维经验。为AWS用户提供一站式解决方案和全面服务支持。通过AWS云托管解决方案,客户将获得灵活且可扩展的云服务,满足高并发业务需求。AWS的按需付费模式和多种优惠计划将帮助客户有效控制IT成本。神灏云提供专业的云架构设计和上云服务,确保转型顺利进行。此外,还提供持续的技术培训,帮助客户内部团队掌握云运维能力。会为客户创建详细的转型路线图,确保在每个阶段都能充分利用AWS资产,实现IT降本增效,为业务发展提供强大支撑。
项目成功标准
在项目调研阶段,我们发现客户现有的IT架构已无法满足不断增长的业务需求。公司面临显著的业务波动,高峰期服务器资源严重不足,导致大量客户访问体验受损;而在低谷期,服务器资源闲置,造成严重浪费。此外,由于行业特性,整体的流量占比成本极高,公司还面临人力成本高、缺乏上云经验和技术支持等挑战。
神灏云通过弹性伸缩和多可用区(AZ)部署等解决方案,帮助客户顺利实现系统上云。上云后,客户系统的可用性从原有的95%提升至99.95%,显著改善了系统稳定性。通过弹性伸缩方案,系统响应时间降低了40%,峰值承载能力提升了3倍,有效解决了性能瓶颈问题。跨可用区部署实现了系统的高可用性,消除了单点故障风险。运维效率提升了60%,人工成本降低了50%。同时,采用按需付费模式,整体IT支出相较于传统架构节省了30%,充分满足了客户在系统稳定性、性能表现和成本效益等方面的预期目标。
二、解决方案架构/架构图
架构描述:
1、在AWS云上部署生产环境VPC,在多个可用区中部署公有子网、私有子网;在公有子网中部署NAT Gateway、IGW、JumpServer、ELB;
2、在EKS控制台创建EKS集群控制节点,在私有子网中部署EKS集群计算节点,计算节点通过NAT Gateway访问公网,安装应用程序依赖程序
3、Amazon RDS数据库、ElastiCache部署在私有子网中,不对公网开放访问权限,使用安全组控制数据库的访问来源
4、使用AWS Code系列产品实现CICD功能,快速迭代上线
5、使用prometheus+SNS等组件实现业务监控告警
6、使用AWS ELB、CloudFront实现业务的对外发布和全球加速
7、使用Route 53托管和解析客户应用的域名
8、使用WAF过滤互联网进入的流量,实现应用层的安全防护
9、整个架构中,通过ELB实现流量的分配和平衡,使用AutoScaler实现集群节点级的横向扩缩容,当流量增加时,AutoScaler通过检测CPU等指标自动增加节点的方式来扩展资源;当流量下降时,AutoScaler会以优雅的方式缩容集群节点
10、集群和数据库均使用多可用区部署,当有节点故障或可用区故障发生时,另一个可用区扔可持续提供服务,保证业务可用性,防止业务中断
为吾游客户的AWS云架构设计中AWS,设计原则遵循可扩展性,高可用性,可靠性,自动化,松耦合管理服务,以及灵活的数据存储选型等。
根据吾游客户的应用业务特点、以及目前面临的实际问题与挑战,从以下几个维度进行裁剪规划:
生产环境规划多可用区,三层网架构规划设计(包括:Public、Service、DB)。在公有子网部署NAT网关,将业务服务层、数据库、缓存等部署在多可用区的私有子网中,实现系统的安全和高可用。
客户所有业务组件部署在一个VPC中的多个可用区. 以实现业务网络上的低延迟。其中广告平台服务前端服务部署在私有子网中, 平台的逻辑处理服务器部署在私有子网中, 数据库以及Redis缓存服务部署在DB subnet 私有子网中, 所有服务/组件均在私有子网中, 确保各服务和组件的安全, 私有子网通过部署在公共子网的NAT Gateway 来访问公共资源, 添加严格的安全组控制, 方便管理人员管理服务器资源。
三、商业价值分析
核心需求分析
•收集业务资料:收集与要上云的广告业务相关的所有资料,包括应用程序(DS-DDJ、DS-dq、ADX/DSP等)、数据库及类型(自建、RDS等)、计算需求、网络架构、存储需求(块存储、对象存储、文件存储等)、性能指标和用户需求等。了解业务的目标、范围和关键业务流程(以提高性能、降低成本、提升可用性或实现新功能为主)。
•识别多个广告业务项目之间的依赖关系:确定应用程序、数据库和其他组件之间的依赖关系。了解数据流、接口、集成点和相互作用。为后续决策和规划上云策略提供基础。
•分析资源使用情况:审查当前使用的资源的使用情况。包括计算实例、存储容量、网络带宽、安全等其他云服务。分析资源的利用率、性能指标和成本,以确定是否需要进行优化或调整。
•评估应用程序适应性:评估应用程序的可上云性和适应性。考虑应用程序的架构、编程语言、工具和框架等因素,以确定是否需要做出修改或重新设计。
•分析数据上云需求:了解要上云的数据量、类型和敏感性。确定如何上云数据,包括数据库上云、文件上云和实时数据同步。考虑数据一致性、完整性和安全性的要求。
•评估安全和合规性:审查业务的安全和合规性要求,包括数据隐私、合规标准和法律要求等。了解友商和AWS之间的差异,并确保在上云过程中满足适用的安全和合规性要求。
•分析性能需求:根据业务需求和用户体验要求,确定AWS提供的计算、存储和网络服务是否能够满足这些需求。考虑扩展性和弹性的要求。
•识别风险和挑战:分析上云到AWS可能面临的风险和挑战。考虑友商与云平台的技术差异、网络连接、数据上云中断和业务连续性等问题,并制定相应的风险管理策略。
•进行成本分析和人员及项目的规划安排:分析上云到AWS的成本,并与当前友商服务进行比较。规划和安排所需的人员和项目资源。
解决方案
在设计吾游客户的AWS云架构时,我们根据其业务特点和实际需求,从以下几个方面进行了优化和规划:
1.多可用区架构:为确保业务的高可用性,所有服务均部署在多个可用区中。架构包括四层子网:Public、Web、Application、和Database。
2.子网结构:
oPublic子网:用于部署NAT网关,允许私有子网访问互联网资源。
oWeb子网(私有):部署广告平台的前端服务。
oApplication子网(私有):部署平台的业务逻辑处理服务器。
oDatabase子网(私有):部署数据库和Redis缓存服务。
所有服务和组件均在私有子网中运行,通过NAT网关访问公共资源,并使用严格的安全组规则确保安全。
3.流量管理:使用Amazon ALB进行负载均衡,确保网络流量均匀分布。
4.VPC互联:通过VPC peering实现客户VPC之间的ADX系统互通访问,所有通信不经过公网。
5.S3访问优化:在客户VPC中访问S3时,使用VPC终端节点,通过私有网络通道访问S3桶,提高访问效率和可靠性。
6.存储性能:为了满足广告系统对高性能磁盘IOPS的需求,建议使用gp3类型的EBS卷。在实际运行中,根据IOPS和吞吐量的监控数据进行调整。
7.故障恢复与自动伸缩:所有EC2实例均部署在多个可用区中。使用Auto Reboot功能实现应用实例的自动恢复,并通过Auto Scaling组实现按需扩展。
8.审计与合规:使用AWS CloudTrail跟踪用户活动和API调用,以确保审计和合规性。
9.成本控制:使用AWS Cost Explorer监控和管理AWS使用成本。采用预留实例以降低长期使用成本。
通过上述优化设计,我们为吾游客户提供了一个安全、高可用、可扩展且具有成本效益的AWS云架构。
项目效益
将系统上云到AWS云平台可以带来以下几个优势:
1.弹性和可扩展性:AWS提供强大的弹性计算功能,例如Amazon EC2和Auto Scaling。这意味着您可以根据需求快速调整计算资源,以适应流量峰值和业务增长,而无需事先规划和投资昂贵的硬件设备。
2.高可用性和容错性:AWS在全球范围内构建了高度可靠的基础设施,提供多个可用区域和数据中心。通过将系统上云到AWS,您可以利用这些分布式的资源来实现高可用性和容错性,确保系统在面对故障或灾难时仍然可用。
3.全球覆盖和低延迟:AWS有多个区域和边缘位置,使您能够接近用户并降低访问延迟。这对于提供全球化的系统或面向特定地理区域的内容分发非常重要,可以提升用户体验和响应速度。
4.安全性和合规性:AWS具备世界级的安全性和合规性标准。通过使用AWS提供的安全服务和功能(如IAM、VPC、WAF等),可以加强系统的安全性,并满足行业和法规要求。
5.多样化的服务和工具:AWS提供了广泛的云服务和工具,以支持构建、部署和管理CMS系统。您可以根据需求选择适合的服务,如Amazon RDS进行数据库管理、Amazon S3进行存储、Amazon CloudFront进行内容分发等。
6.成本效益:通过将系统上云到AWS,您可以避免购买昂贵的硬件设备和维护费用。AWS采用按需付费模型,您只需要支付实际使用的资源,同时可以根据需求灵活调整,从而实现更好的成本控制和优化。
综上所述,上云到AWS可以带来弹性和可扩展性、高可用性和容错性、全球覆盖和低延迟、安全性和合规性、多样化的服务和工具以及成本效益等优势。这些优势将为系统提供更好的性能、可靠性和安全性,并支持您的业务增长和创新。
价值收益
采用 亚马逊云科技的大数据解决方案计算成本有效降低;
采用AWS 托管服务后专注于创新,而不是维护,并快速自动扩展以响应动态工作负载,减轻耗时的维护任务;
开发时间从两周缩短,减少开发开销;
促进产品快速迭代,改进用户交互,提高了用户粘性。
四、成本优化
AWS成本优化旨在通过一系列策略和措施,帮助用户在AWS云平台上实现更有效的资源利用和费用降低。关键措施包括:
优化弹性计算实例配置:根据负载需求选择适当的实例类型和数量,确保资源利用最大化。
优化存储策略:使用数据生命周期管理功能,将不经常访问的数据迁移到低成本存储层级,降低存储成本。
优化数据库配置:根据应用程序需求调整数据库实例规模和引擎选型,提升性能并节约成本。
自动化扩展和节省成本:通过Auto Scaling和Spot Instances实现弹性扩展,获得更低折扣价格。
内容分发网络(CDN):将静态内容缓存到就近的边缘节点,提高用户访问速度并减少数据传输成本。
执行上述方案预期带来的效益包括显著的成本节约、资源利用率的提升以及应用性能的优化。通过使用AWS管理工具和设置监控指标和警报,用户可以实现对成本和资源的持续管理和优化,从而获得更高的成本效益和更灵活的资源配置,推动业务的可持续增长。
五、经验教训
在此次上云项目中,我们深刻体会到了前期与客户深入交流、明确需求以及评估客户现有资源使用情况的重要性,并在此基础上进行架构优化的必要性。这一系列准备工作为项目的顺利进行奠定了坚实的基础。在项目实施过程中,神灏云全程为客户提供了无缝支持,迅速响应并解决了各种技术问题。通过引入自动化部署基础服务,我们有效减少了人为操作失误,大大缩短了部署时间,显著提升了整体效率,确保了项目的稳定运行。
展望未来,神灏云将建议客户利用AWS的大数据解决方案,为其广告平台量身定制一个专属的大数据平台,从而实现用户与客户平台的深度融合。借助这些技术创新,神灏云将继续为客户提供更加智能化、个性化的服务方案,持续推动企业的数字化转型进程。