欢迎user
· 建设背景
中国太平洋保险(集团)股份有限公司(以下称“太平洋保险”)是在1991年5月13日成立的中国太平洋保险公司基础上组建而成的保险集团公司,总部设在上海,是国内优秀的综合性保险集团,并是首家在上海、香港、伦敦三地上市的保险公司。
在数字金融时代,中国太平洋保险公司以“转型2.0”战略为指引,高效开展中国太保云建设,与新华三集团在金融云、基础设施规划等领域展开深入合作。借助新华三提供的云服务器、存储、网络等创新基石,中国太保云能为用户提供一体化、自助式、全栈式云服务,提供弹性的资源管理和高可靠的性能保证。太保云首期建设成都M3/上海罗泾D3两个数据中心,其中ONEStor分布式存储节点180个,截止2022年已扩容至494个。太保业务规模大、应用种类繁多,对存储的可扩展性、可靠性和技术优秀性提出了更高的标准。
· 客户业务挑战
- 云业务系统复杂,从保险生产系统到开发运维、网站APP等不同的业务系统对存储的要求千差万别,规模庞大,随时考验着存储的承载能力。
- 存储业务的连续性也是客户的关注焦点,存储系统必须具备企业级高可用架构。
- 软硬解耦,能够适配客户统一采购的多品牌标准服务器。
· 解决方案
为保证性能较大化,太保云ONEStor以每15个节点作为一个集群使用,15个节点以5*3的方式落位于三个机柜,以机柜为故障域,服务器的分布如下:
角色划分:所有节点分为三种角色Handy(管理)*2、MON(监控)*7、OSD(存储)*15,为了使各个节点高可靠性得到保障,所有节点落位在不同的机柜,具体分布情况如下:
统一运维:ONEStor存储接入太保运维平台,实现统一运维、秒级监控、系统异常实时上报。
· 客户价值
- 自研SCache缓存加速算法,满足多业务存储的性能需求:
ONEStor高效的自研SCache缓存加速算法,提供高并发、高性能的存储服务,满足车险、财险等生产业务的存储需求。
如何更好的发挥SSD缓存盘的性能,缓存算法是至关重要的。SCache算法会结合缓存使用率与前台IO负载,动态调整水位线与刷盘速率。同时拥有更加智能的冷热数据分离机制,提升缓存命中率。
- 集群亚健康管理机制,提前识别与隔离硬件风险:
当存储集群的规模变大之后,硬件故障发生的频率也随之增大。如何有效的处理硬件故障,实现自动化容错,成为了太保云存储建设的重中之重。
ONEStor提供了硬盘亚健康检测(慢盘、坏盘、坏道),网络亚健康检测(时延过高、震荡/丢包错包等),以及节点CPU、内存占用率过高等智能管理机制,提前感知硬件故障,并主动采取修复或隔离措施,保障存储服务的高可用性。
- 软硬件解耦,避免硬件绑定:
ONEStor分布式存储软件适配了业内主流的服务器品牌。在后续的扩容中,太保可灵活地进行硬件选型,在保证存储性能与可靠性的同时,避免了单一硬件厂商绑定的问题。
- 在线升级,业务不中断:
存储系统作为太保云的数据底座,牵一发而动全身。存储若停机升级,涉及到多部门协调,耗时耗力。
ONEStor提供了在线升级功能,并支持节点并行升级,缩短了集群升级时间,减轻了IT运维人员的工作量。