欢迎光临深圳CIO协会网站
当前位置:首页 >> 动态信息 > 方案与案列 > 正文

应该尽力避免的 4 个大数据管理错误

新闻来源:  发布时间:2017-11-13   点击数:1
  •   \

            每个人都有自己的系统
     
      国防合约商 Raytheon 在一次重要的成本削减审核中发现,公司不同的站点和部门使用着十几个不同的产品数据管理系统,这使他们花费了数千万美元的不必要成本。
     
      该问题的解决方案是将所有数据整合到一个系统中并扩展您的数据中心,使数据的管理变得更容易且更经济,同时确保每个人都使用相同的数据来制定决策。
     
      新项目和传统基础架构
     
      由于惰性,企业常常使用传统系统。您已拥有它,而且您的员工知道如何使用它。转移到新的软件和业务流程将会暂时中断运营,而且需要前期成本。一些企业试图通过更高级的数据迁移工具迁移到新数据存储系统来获得大数据的收益,但他们试图在其传统硬件上运行这些系统。这是一种错误做法。支持分布式计算和大型数据存储库的最佳方式是,采用专为新数据架构设计的硬件。尽管您或许能够在旧服务器上运行虚拟服务器,但如果尝试为您的“云”集成新的、改进的服务器时,就会遇到问题。请在迁移数据时升级硬件。
     
      我们需要所有数据
     
      一种错误的假设是,您需要收集尽可能多的数据,才能制定 Peter Drucker 在科学管理诞生之初提倡的数据驱动的决策。最终结果是,尽管一些数据有所帮助,而且越多越好,但您不知道如何处理它。这导致组织收集了一些他们无法预见其用途的数据,既浪费了时间,又浪费了精力;同时,在数据存储和数据管理软件上花费了更多的钱。管理人员想利用这些工具查找正确的数据集来用于分析,从而得到答案,但更复杂的数据挖掘工具会使情况变得更复杂。
     
      结构带来了太大限制
     
      许多企业错误地没有对其数据应用结构。他们没有对文档名称使用严格的格式,并试图确定有哪些对象。他们没有使用描述性元数据来描述各项,所以搜索器就无法使用明显的关键搜索词汇来查找数据对象。另一个问题是未能在导入时对数据进行清理,使标题中的撇号在文档标题中变成了“*&&#@”。这使得搜索器很难按正确名称进行搜索。
     
      在文档创建者或项目以外忽视对数据的分类,这意味着人们必须费时又费力地处理不必要的文件。
     
      结束语
     
      不要再继续收集数据库和数据管理系统了;从长远来讲,将它们结合起来可以更好的提高效率和降低成本。绝不要在传统硬件上安装现代数据库、云服务器,甚至“数据湖”。不要收集您希望能在以后使用的不必要的信息。在上传数据并在系统间迁移数据时,对数据应用结构。