数以千计的服务器如何在Times Internet上利用混合IT

数以千计的服务器如何在Times Internet上利用混合IT

Times Internet Limited(TIL)是印度最大的数字产品公司,拥有每月超过5.5亿活跃用户,38个品牌(TOI,ET,CricBuzz,Gaana,MX Player,Magicbricks,Dineout等),拥有5,500名员工。。

Times Internet数据中心和基础架构遍及多个地区,是市场上最复杂的架构之一,Times Internet的CIO Sumit Malhotra正在采用一种混合方法来有效地管理和改善公司的基础架构。

为了管理工作负载,已部署了具有80,000个CPU内核的自愈式混合云服务器,运行了12,000多个实例,使该集团的任何业务都可以根据需要扩展和缩减。该公司还与其他云合作伙伴(例如AWS,Google Cloud和Azure)合作提供不同的服务。

使用ML来管理工作负载

对于数据中心,已经开发了一种由机器学习支持的监视系统,该系统能够每秒监视100万个度量标准。

“我们有将近1.5万台服务器,每台服务器都受到70种不同指标的监控,具体取决于它所扮演的角色。例如,我们将监视CPU,延迟,网络带宽等。然后我们有特定于服务的指标。收集,分析所有这些指标,并在此基础上进行实时预测。” Malhotra告诉ETCIO。

鉴于公司提供的产品范围广泛且客户群体多样化,因此网络基础架构有望实现一致性和可靠性。为了获得有效的性能,还部署了一种用于实时识别中断的解决方案。

Malhotra解释说:“鉴于涉及的复杂性,对特定网站本身进行简单检查是一个漫长的过程。位于CDN上的网站(Content Delivery Network)先映射到负载均衡器,然后再映射到应用程序服务器。每个应用程序服务器本身都连接到不同的数据库和缓存服务器-这是一个很大的网格。考虑到我们之间存在许多相互依存关系,我们希望确保我们希望很快找到问题所在。”

在汇总了来自不同来源(来自监视系统,CDN和日志记录引擎)的数据之后,进行了预测分析,以找出可能的中断原因。Malhotra补充说:“它可以帮助我们从2分钟到60分钟到10秒之间减少并确定中断的原因”。

该公司还具有一个集中式系统,可向与IT基础架构相关的每个业务负责人发送账单消耗和需求。通过这种方式,公司内的各个部门可以分析不同IT资源的利用率以及他们在哪些资源上花费了多少,从而帮助他们优化了成本。

展望未来,Malhotra希望将该系统提升到另一个层次,在该层次上,各个业务主管也将获得见解,说:“如果遵循此建议,您将节省X笔钱。”

安全性高居榜首。今年,我们的更多投资将投入到SoC中。我们的大多数数据中心都是可扩展的,我们正在从传输链接转移到对等链接,这将帮助我们降低成本。他补充说:“我们也在关注优化,这将使我们能够获得更多现有硬件。”

用于IT支持的Chatbot

TIL两年前开始使用名为Toby的chatbot,并且已与各种系统广泛集成。它以一个小的功能开始,该功能会在访问者来访时自动通知用户(TIL员工),并要求其批准。然后,聊天机器人将其扩展到其他各种事物,例如请求IT资产,出租车或其他服务。

“这样做的想法是给人们一个窗口,让他们可以在更短的时间内完成更多的工作,从而使手动请求真正减少。如今,超过80%的工作流程是通过聊天机器人完成的。”

Malhotra的团队创建了自动程序,并与各种系统集成,例如票务,我们所有资产的CMDB(配置管理数据库),运输预订,数字管理资产。我们创建了与所有这些系统集成并与G-Suite(供所有TIL员工使用)集成的API。

Malhotra还计划将Toby与HR工具集成;员工将能够通过聊天机器人询问诸如离开的消息等。

“我们还将将聊天机器人与我们的SOC运营集成在一起。例如,我们收到了防病毒警报,并且发现了异常。因此,将实时通知用户问题已经发生并且请求已得到处理。想法是从不同的系统中获取反馈,并通过一个窗口将其传达给人们。”Malhotra说。

本文为作者 已诺 独立观点,并不代表 我是CIO 立场。

发表评论

登录后才能评论