首页 > 健康 >正文

以用户需求为锚点,守护系统的安全与稳定

2023-02-17 10:56:11 来源:- 作者:-

如果说良好的用户体验是计算机软件用户数量增长的条件之一,那么软件与云端的稳定与安全就是所有计算机软件保持最基本用户体验的基石。从来没有人能保证软件百分百的安全性,保持软件的稳定与安全是一个与软件自身、云端、外部服务甚至是用户长期博弈的过程。张天翔,微软(中国)苏州分公司的高级软件开发师就是长期投身系统稳定性与安全性研究与开发工作的专家。在工作中,张天翔主要负责设计开发微软的M365 的安全验证和services通信安全,并负责领导开发AI相关工具和AI监测系统。

微软(Microsoft)公司由比尔·盖茨与保罗·艾伦创始于1975年,是全球最大的电脑软件提供商,以研发、制造、授权和提供广泛的电脑软件服务业务为主。2021财年微软营收为1681亿美元,净利润为613亿美元。微软(中国)1992年进入国内,2013年在苏州设立分公司。微软在苏州有多个研发部门,其中包括M365, Bing, Xbox, Azure等。M 365 是微软基于Microsoft Office 办公室套件开发的云端办公室方案,M365主要面向企业用户,其主要的卖点是针对商用的兼具智能与安全性的办公编辑软件及服务,同时为企业内的多个用户提供方便快捷的团队协作工具,保证个人及企业文件的安全性和私密性。因此,该系列软件的稳定性和安全性是所有企业用户看重的基础特性。

张天翔,作为高级软件开发师领导团队在冗余(resiliency)系统包括L1,L2和DTC cache、验证系统等环节为公司提供了大量的技术支持。其中在冗余系统的开发中,张天翔发现多数服务器崩溃的问题出现在缓存(cache)的运行方面,现有的缓存命中率不尽如人意,大量的未命中数据需要调取服务器内存来处理,这大大减缓了服务器整体的处理速度。于是他带领公司团队针对缓存的运行问题进行了设计与升级改进,使得cache的命中率提升到了95%(大多数CPU的命中率约为90%),命中率的提升可以有效减少服务器压力和减少处理请求(request)的时间和对外部服务(service)的请求,并且在外部服务出现问题时后缓存还可以帮忙处理绝大多数的请求。这一举措能够防止因服务器压力过大导致的崩溃与未响应问题;有效地减少了因服务器问题导致的用户数据丢失,巩固了安全性;大大减少系统对外部服务的依赖,从而减少因为外部服务带来的故障。张天翔通过带领团队研究出正确的方向,用最短的时间为公司减轻服务器压力,极大地提高了软件的稳定性,预防因为服务器问题导致的客户信息丢失。张天翔还成功地将处理请求的P99延迟(latency)从400ms降到30ms左右,这意味着服务器处理客户请求的时间被大大缩短,用户的实际体验显著提升,“如丝般顺滑”。

张天翔还领导了验证组的AI Projects的开发与升级。张天翔发现验证系统的身份验证策略(Auth Policies)存在大量无用的条目,并且因为一些安全性的问题导致验证系统存在纰漏,这些问题会大大减缓验证系统的运行效率,降低验证系统的正确率与安全性。于是,张天翔组织成员开发AI监测系统用于监测身份验证策略的有效性,并且自动禁用无用的身份验证策略;监测其他项目组的情况,及时发现验证方面的安全问题。事实证明,这些有针对性的调查与举措是有效的,张天翔禁用了200多条无用的身份验证策略,帮助整个验证系统实现精简化;同时,由于张天翔组织的监测活动,使得许多其他项目组内的安全问题能及时被发现,使他们能够成功地在被攻击之前修补漏洞。

目前张天翔在软件稳定与安全方面的研发不仅为微软客户的体验优化作出了重大提升,还推动了微软公司的健康发展。同时他还发现AI在行业中的应用还不够深入,并且用户使用过程中,他也看到了一些潜在的风险。在这样的背景下,他认为 AI将会在软件开发中起到重要作用。张天翔表示未来会利用AI技术在软件开发方面进行深入探究,致力于为微软用户提供更加人性化的交互模式。

“以用户需求为锚点,守护系统的安全与稳定”,这不仅是高级软件开发师张天翔的事业追求,也是微软公司的行业追求。在未来,让我们对更健全的软件安全体系拭目以待。(文/刘文)

 

 

 

责任编辑:小艳