当前位置:首页 > 公司动态
大数据应用技术的发展方向分析
  • 发表时间:2020-10-26 点击数:36
  • 来源:未知

   目前,大数据的应用已经对企业公司和个人产生了深远的影响。本文预测了大数据应用技术的发展方向,可以预见数据资产管理、人工智能驱动的数据基础设施、面向人工智能的分布式计算框架和数据安全都将成为大数据应用技术的发展方向。对大数据应用技术感兴趣的小伙伴,可以接着往下看详细分析。 
  1.数据资产管理 
  随着在行业中的大数据应用技术的深入发展,企业公司将逐渐开始重视数据资产管理。建设数据资产管理方法论体系,即从架构、标准、研发、质量、安全、分析到应用的统一,从而实现技术到业务价值的转化和变现。虽然更多的企业早已经尝试采用了大数据应用技术,并且也在业务场景中尝试运用人工智能技术,但行业整体上仍然缺少数据资产管理的方法论体系。
  因此,到目前数据资产管理将仍是企业数据部门面临的挑战。不过现在大型领先的互联网公司和科技型企业,在数据资产管理仍在不断探索新的方法,如全链路智能管理体系、数据资产的贡献度、资产定义与研发管理的有机整合、数据基线度量与质量规范的工具化、可视化等。可以预见,数据资产管理将成为未来大数据应用技术的发展方向之一。
  2.数据资产管理
   增强分析定义为:侧重于增强智能的特定领域,使用机器学习来转换分析内容的开发、消费和共享方式。增强分析功能将迅速推进到主流应用,作为数据准备、数据管理、现代分析、业务流程管理、流程挖掘和数据科学平台的关键特性。
   但在实际行业应用中,增强分析带来的业务价值并不大。其实是因为常规的自助式BI分析和算法平台,仍未脱离工具范畴,离实际的业务场景距离仍然较远。另外从BI到AI仍需要解决数据抽取、数据预处理、数据融合等复杂问题。因此只要解决普通业务用户也能快捷便利的访问数据并进行验证分析,就能实现自动化分析。而增强分析是数据科学的深化应用,也是大数据的发展方向之一。
   3.AI驱动的数据基础设施
   多数企业布局了机器学习、深度学习技术的人力、工具和基础设施,有一些行业解决方案也逐步落地。不过在真实世界中,搭建基于AI的生态系统,重点并非算法本身,“AI驱动业务价值”这一命题意味着高昂的成本和资源投入。在多数领域,AI驱动的生产力仍未实现规模效应,如何解决数据基础设施的自动化仍是难点。
   从今年的大数据平台和工具市场来看,越来越多的构建AI解决方案工具,从AI建模、AI算法框架的工具,逐步演化为面向数据开发、流程调度、A/B实验、数据分析、服务管理等工具,从而实现AI驱动的数据基础设施。这种趋势意味着过去专业的数据科学家、数据工程师与开发人员合作实现AI解决方案,逐渐转变为开发者可以通过AI驱动的数据基础设施(如开发测试工具、建模工具、分析工具等),独立实现AI应用的开发过程;而数据科学家更专注于算法本身的构建及优化。
   4.面向AI的分布式计算框架
   随着人工智能成为科技领域的宠儿,以及机器学习技术的进步,对于面向AI的分布式计算系统的需求,变得更加迫切。Hadoop/Spark阵营的开源分布式社区已成为大数据处理的事实标准,在行业中的应用也在不断深化,各类商业化版本也在为满足更多的行业解决方案而迭代。不过,由于Hadoop/Spark设计的初衷并不是为了构建AI应用,在性能、任务并行、任务状态可变、异构计算(如GPU与CPU)等方面均有一定的问题和瓶颈。
   目前开源社区已经有一些面向AI的分布式计算框架,与MapReduce和Spark这类并行跑批处理架构不同,AI分布式架构要求支持更细细粒度任务依赖,比如小数据量训练、灵活任务依赖、以及异构计算的优化。而大数据商业化公司、Hadoop发行版厂商如Cloudera(现已于Hortonworks合并),也势必在AI和机器学习应用领域进行产品调整和重构,以提供更多的基于云端的AI解决方案。
   5.数据安全
   在大数据时代,服务安全与隐私保护是这两年提及较多的关键词。在未来一到两年,企业将越来越重视数据安全管理的应用,在信息安全上的投资预算增长迅速。事实上在2017-2018年,国内大数据市场已经出现了不少专注于数据安全领域的供应商,提供隐私访问控制、数据加密脱敏、信息风险监测、数据沙箱等产品应用。这一领域的赛道目前规模还不大、市场比较分散,细分领域的厂商多以客户本地化部署为主。未来数据安全即服务的云托管服务,将更为普及,成为大数据应用技术发展方向趋势。
      尽管仍然面临多种障碍(每一种新兴技术在出现后都必须面对挑战),但大数据的早期采纳方已经在相关项目当中积极投资,并将其部署至企业业务系统当中以解决各类关键性难题。