南邮—勤源AI智能运维研发中心:智能运维是业务稳定运行的关键力量
在数字化转型的大背景下,智能运维市场正以前所未有的速度蓬勃发展。随着企业对信息技术依赖程度的加深,以及云原生架构、微服务的广泛应用,智能运维已成为保障企业业务稳定运行的关键力量。在这片充满机遇与挑战的市场中,勤源(江苏)科技有限公司凭借卓越的技术实力和创新精神,成为了智能运维领域的领航者。
如今,南京邮电大学与勤源科技深度携手,共探云网智能运维领域。南邮凭借深厚科研实力与人才培养体系,为合作输送智力;勤源科技则以丰富实践经验和产业化能力,推动成果落地。
双方合作全面深入。基础理论研究上,南邮借助勤源数据开展针对性研究,助力理论发展。关键技术突破时,结合南邮人工智能、大数据成果与勤源工程实践能力,精准快速诊断云网故障。还构建智能决策系统,提升运维效率和质量。成果转化方面,勤源将南邮科研成果转化为产品和服务推向市场,为行业带来创新思路,引领行业迈向新高度。
勤源智能运维管理平台功能丰富且强大,其中全链路根因透析功能尤为突出。它集成了OPM监控告警、APM/NPM、运维流程以及CMDB等多个关键部分,能够实现对多种监控系统的整合。通过以网络流量为导向展现物理链路运行状态,以CMDB为导向展示应用拓扑关系,该平台可以同步系统性能与资源状态,精准实现故障时间段的数据定位和链路告警溯源,为企业快速解决运维难题提供了有力支持。
在网络、应用、云资源和服务的可观测性方面,勤源科技展现出了显著的技术优势。其智能探针网络能实时感知系统状态,收集基础监控、应用链路监控、流量监控和日志采集等关键数据。在网络可观测性上,可自动生成基础网络拓扑链路图,实时监测链路健康状态和设备健康状态,通过建立健康模型,能及时发现响应异常、吞吐量异常等问题并发出告警。在应用可观测性方面,生成的应用程序拓扑图可以清晰呈现应用组件间的关系,通过监测组件间性能指标,快速发现异常和故障。针对云资源,勤源科技实现了与云管平台的集成,自动发现资源并纳入实时监控,提供多种指标模型,实现资源监控自动化。在服务可观测性上,追踪分布式应用端到端服务调用链信息,能回溯用户故障请求,溯源链路异常和根因。
勤源科技的定制化服务能力也十分出色。在金融行业,某银行面临业务复杂、风险高的运维挑战,勤源科技为其定制的智能运维方案,有效保障了交易系统的稳定运行,降低了运维成本。在电信行业,为某电信运营商定制的方案,大幅缩短了网络故障处理时间,提升了用户满意度。
与主流智能运维厂商相比,勤源科技有着明显的差异化优势。云厂商虽然云原生集成和资源扩展能力强,但存在跨云能力弱、数据隐私风险等问题;垂直厂商领域技术深度高,但多工具集成成本高、扩展性受限;水平厂商虽能避免厂商锁定,但需自行整合数据源。勤源科技则集合了多种优势,既支持多云/混合云环境,避免厂商锁定,又具备较高的标准化程度。其产品架构实现了全栈可观测,且在功能上不断创新,深度融合各产线功能,为用户提供更全面、高效的服务。
勤源科技有着清晰且宏伟的未来愿景规划。在技术突破方面,将采用图神经网络(GNN)构建跨日志、指标、追踪、事件的多维度关联分析,基于Transformer架构的时序数据编码器实现秒级数据采样下的长周期模式捕捉,通过事件知识图谱的动态更新机制支持实时拓扑关系映射。同时,引入运维大语言模型(LLM-Ops),使其在工单处理场景达到人类专家水平,实现自然语言工单到运维操作的端到端转换,减少人工干预,提升运维响应速度。
在产品架构升级上,勤源科技将进一步融合产品架构,迭代NPM产品,基于eBPF实现更强大的网络和链路可观测性,取代原有的APM+NPM,更好地支持混合云场景(IaaS、SaaS、Paas)的智能运维。
勤源科技凭借其不断的技术创新和对市场需求的精准把握,基于与南京邮电大学的通力合作,助力智能运维行业朝着更加高效、智能的方向发展。