PG电子(中国)官方网站用技术人的“脊梁”与“初心”突破不可能的极限!自1946年,冯诺依曼计算机体系提出以来,作为计算机系统五大组成之一的“存储”,便不断拓展其容量以及读写速率,如今承载了整个社会的信息记忆。
从70多年前只能存储4096bit信息的“选数管”,到如今上PB级的分布式存储器集群,成千上万工程师、产品人为突破原有“存储”极限不断努力着。
中科曙光ParaStor是不可或缺的组成,从2012年开始,一直保持国内市场占有率的前两位PG电子(中国)官方网站。
在这背后是存储团队近百名研发、产品、运维工程师,日以继夜对技术的不断探索、对产品性能的极致追求,以及为客户负责的不懈努力。
曙光存储事业部总经理惠润海介绍,“ParaStor产品历经十年发展,过程特别不易,测试、产品、售前到售后支持都非常不容易,但是所有人都全身心地投入其中,就像呵护自家宝贝一样陪伴她成长。”正因为此,才使得ParaStor走在行业前列。
在存储市场PG电子(中国)官方网站,超大规模部署一直是行业挑战。而曙光存储团队凭借ParaStor领先的性能和技术积累,多次突破大规模部署的极限。接到某大项目部署任务的时,曙光存储研发技术经理方海鸥觉得这是个不可能完成的任务。
首先一大挑战是时间紧,升级任务重。由于前期场地限制,存储进场部署只剩一周时间。而用户的支撑前端应用节点从3000台直接升级为12000台,远远超出实验室测试环境覆盖的上限。于是,一边,现场实施人员抱着显示器和键盘,挨个给机器配置IP地址、设DNS和主机名;另一边,研发团队成立专项支持小组,北京和天津两队人马24小时待命,随时协助前端做技术支持。
另一大挑战是突发难题多。比如,上万节点的大规模环境部署,怎样减少集群网络压力?如何从部署开始解决集群可靠性问题?每一个难题都在等待解决……
为快速高效解决各种难题,方海鸥召集相关模块的负责人和技术经理,及时沟通解决方案,制定实施计划PG电子(中国)官方网站,并将分工任务随时上传到研发管理平台,由专人跟踪落实。为能及时响应,项目成员保持着24小时可随时沟通的状态。
多年的研发与技术积累,让曙光存储团队拥有了存储定制化设计、开发与落地的能力,能够满足甚至超出用户预期需求,ParaStor在生命科学、交通、监控等领域脱颖而出。
回顾年初曙光参与某基因测试项目,ParaStor研发工程师郭照斌和产品经理王灯殿感慨颇多。“我们实施过很多基因测序的项目,应该说积累了足够的行业技术经验。可这次不一样,这次测的是CANU三代基因组装,对性能要求极高。”
此次测试,用户要求曙光ParaStor的性能必须超越某厂商宣称的“代表业界最高性能”的国外同类产品,才考虑把其业务迁移到曙光。“这是给存储团队下的挑战书,而我们偏要迎难而上。”郭照斌笑着说。
对CANU三代基因组装不了解,就没办法做针对性的优化。为了找到CANU三代的IO特点,王经理在电脑前一坐就是一周,最长一天甚至将近24小时!“要做就做到极致!”看着这个数据,郭照斌认为还有提升的空间。时间再紧,困难再多,品质二字早就刻在曙光人的心里。对于每一处细节,他们都不会妥协。在大家的共同努力下,一周时间里,计算用时从9.2h降低到7.3h。实测性能超过友商20%以上。
ParaStor再次以极致性能赢得了用户的青睐,不仅让用户放心地把关键业务迁移到曙光,也让用户认可了国内厂商专业的技术和实力,为后续更加紧密的战略合作打下坚实的基础。
存储作为数据中心的核心之一,涉及IT资源的多个方面。任何架构、系统、应用甚至简单存取方面需求的变化,都有可能导致性能失衡、数据读取错误甚至系统崩溃。因此,需要运维人员具有强烈的责任心和使命感,为客户提供专业的技术支持。
去年12月份,山东招远的用户一大早打来电话,说监控系统异常。用户内网不能远程支持,必须马上赶赴现场。
李震当即定了最早一趟从北京到烟台的火车,再转长途客车赶往招远。一路上山丘连绵,沟壑纵横,加上下雪,走了12个小时才到现场。到了用户单位,李震马上进入机房,了解情况、查看系统底层日志、找问题所在。发现是由于用户业务发展需要增加了监控设备,但是存储空间的配置没有进行相应的调配与优化,导致问题发生。
将近凌晨,业务终于恢复了。虽然24小时没有合眼,但是李震仍然不放心,坚持在现场协助排查网络问题。就这样,他又在机房驻守了一个白天。“网络调整会影响业务,一定记得协调好时间,再让网络工程师进行现场排查。”回程前,李震还不忘叮嘱用户。
如果写技术团队一千零一夜的故事,肯定90%都是枯燥的日常。在不善言辞的个体和“枯燥”日常的背后,有一种共识或者说共同的价值观,形成这个团队的行事准则和文化风格。初见平淡,走近之后便会很快被感染。我想这大概就是ParaStor走在行业前列的一种基因吧。