广东泰迪智能科技股份有限公司依托十余年行业数据挖掘、数据分析服务经验,凝聚近千家高校、近百位全国顶级专家的智慧,历经十余年研究与实践,打造出“面向企业级用户的一体化大数据挖掘建模平台”。旨在为政府、高校、研究院所、企业用户提供大数据环境下,满足不同领域业务需求的数据分析与应用服务。
平台使用JAVA语言开发,采用B/S结构,用户不需要下载客户端,可通过浏览器进行访问。平台提供了基于R、Python、Spark、PaddlePaddle引擎的大数据分析功能。平台支持工作流,用户可在没有编程语言基础的情况下,通过拖拽的方式进行操作,以流程化的方式将数据输入输出、统计分析,数据预处理、分析与建模等环节进行连接,从而达成大数据分析的目的。
企业数据挖掘平台有何价值?
对于最终用户:为用户提供一体化、自助式的大数据挖掘建模平台,降低企业级数据分析门槛,帮助企业充分利用数据价值,促进企业的数据文化建设,推动企业数据驱动转型。同时也为用户提供模型管理、模型共享的完美解决方案。
对于IT解决方案供应商:为IT解决方案供应商提供完善的数据应用开发工具与灵活的集成机制,大幅度降低数据应用开发的难度与复杂度,适应灵活多变的业务需求,降低IT企业的研发成本。
企业数据挖掘平台产品功能
1.模型库
成功登录平台后,进入的第一个页面就是模型库,首页用于展示模型。模型主要用于标准大数据分析案例的快速创建和展示。通过模型,能够建立一个个无需导入数据,设置参数就能够快速运行的工程。同时,每一个模板的创建者都具有模型的所有权,能够对模型进行管理。
2.数据连接
数据连接是维护各个原始数据库的JDBC连接属性,只要支持JDBC连接的都需要在此进行维护,支持的数据库包含DB2、SQL Server、MySQL、Oracle、PostgreSQL、Kingbase、达梦等有关系型数据库,同时还支持clickhouse、hive等分布式数据库。
3.我的数据
我的数据是“数据管理员”用于维护系统分析所用的数据源、构建数据模型、创建视图,并进行数据共享分配与管理的模块。数据源管理支持多种类型数据源添加;数据源模块主要用于数据集的导入与管理,用户可根据数据大小选择来源于文件或者来源于数据库。来源于文件支持从本地导入任意类型的数据;来源于数据库支持从DB2、SQL Server、MySQL、Oracle、PostgreSQL等常用关系型数据库导入数据,同时也支持Hive、HBase、HDFS、ES、kafka等。与此同时,每一份导入的数据都能够进行数据预览,数据删除等操作。我的数据同同时支持数据共享操作,共享后该数据即可被其他人查看和使用。
4.我的工程
我的工程模块主要用于机器学习、AI建模流程化案例的创建与管理。通过工程模块,能够创建空白工程,进行AI项目流程的配置,建模结果可通过可视化报告进行查看。对于完成度优秀的工程,可以将其保存到模型库,让其他使用者学习和借鉴。
整个分析流程设计基于拖拽式节点操作、连线式流程串接、参数配置,用户可以通过简单拖拽、配置的方式快速完成挖掘分析流程构建。大数据挖掘建模平台内置数据处理、数据融合、特征工程、扩展编程等功能,让用户能够灵活的运用多种处理手段对数据进行预处理,同时丰富的算法库为用户建模提供了更多的选择,自动学习功能自动推荐最优的算法和参数配置,帮助用户高效建模,快速挖掘数据隐藏价值。
平台分布式算法主要基于业界主流的Spark分布式内存计算框架开发,并采用Spark语言和Python语言中的Pyspark函数进行算法实现,能够支持海量数据的高效挖掘分析。
企业数据挖掘平台典型合作案例
1、中国电科院:电力大数据分析平台
运用大数据挖掘算法完善数据分析挖掘模块,实现对Mahout、Rhadoop等分析挖掘工具中的算法封装,通过企业数据挖掘应用流程化的模式,使得数据应用开发速度更快,成本更低,让企业的大数据挖掘应用更简单。
2、珠江数码:大数据营销推荐应用平台
构建有线电视用户标签库3000多个,对不同的有户实现多维度画像,通过分类、聚类挖掘等模型,从不同角度实现用户细分。使同一群体用户具备某些共同特征,如“家中有儿童”等,从而为后续的精准推荐提供基础,如付费频道、点播的专区服务或片子、回看与应用。
3、石油勘探开发研究院:油气行业数据挖掘系统
基于石油勘探大数据平台,运用大数据分析挖掘相关技术,构建适合多种业务场景数据特点的挖掘分析模型,提供交互式、可扩展的数据分析算法库,能够面向石油勘探业务,深入发掘隐藏在石油勘探数据中的规律性与关联性,提升数据深度应用的支撑能力。
4、公路院:道路运输安全大数据分析平台
面向道路运输行业和运输企业多层面应用的道路运输安全管理大数据平台,汇聚车辆运行动态监控数据、新车技术参数、运输企业安全生产管理信息、运政管理信息、气象信息等多源数据,形成道路运输过程大数据池,重点针对运营过程中车辆性能的变化规律、不良驾驶行为识别统计分析、驾驶行为对行车安全与节能情况的影响因素、道路客运方式下公众安全出行保障。
5、北京市信访办:智慧信访大数据分析平台
智慧信访,是指整合信访历史积累的大数据资源,通过机器学习、人工智能大数据分析技术,对信访形势进行实时监测与准确预测,既可以随时掌握信访形势发展动态,掌握极端事件出现的苗头,又能从源头上对信访未来发展的可能性做出预判,实现未雨绸缪,将信访矛盾冲突化解在萌芽状态。