思路、真正把它当成企业使用数据的核心方式。问题在于,其它部门的价值或者战略目标有可能在优先级方面高于大数据,这种冲突往往会令我们有力无处使。
·大数据孤岛。大数据供应商总爱谈论“数据湖”或者“数据中枢”,但事实上很多企业建立起来的只能算是“数据水坑儿”,各个水坑儿之间存在着明显的边界——例如市场营销数据水坑儿与制造数据水坑儿等等。需要强调的是,只有尽量缓和不同部门之间的隔阂并将各方的数据流汇总起来,大数据才能真正发挥自身价值。
·回避问题。有时候我们可以肯定或者怀疑数据会迫使自身做出一些原本希望尽量避免的运营举措,例如制药行业之所以如此排斥情感分析机制、是因为他们不希望将不良副作用报告给美国食品药品管理局并承担随之而来的法律责任。
在这份理由清单中,大家可能已经发现了一个共同的主题:无论我们如何高度关注数据本身,都会有人为因素介入进来。即使我们努力希望获取对数据的全面控制权,大数据处理流程最终还是由人来打理的,其中包括众多初始决策——例如选择哪些数据进行收集与分析、向分析结论提出哪些问题等等。
3、通过迭代实现创新
由于很多企业似乎根本无力建立起自己的大数据项目,再加上大多数大数据项目往往最终遭遇失败,因此将迭代机制引入大数据是非常必要的。这不会迫使企业向咨询企业或者供应商支付大量费用,大家最好能构建起由内部员工参与的免费数据实验方案。
鉴于几乎所有主要大数据技术都属于开源成果,因此建立起一套“初始规模较小、能够快速发现问题”的方案其实完全可行。更重要的是,很多平台都能像云服务那样立即起效且成本低廉,从而进一步降低了进行项目实验与发现错误的资金投入。
解决问题的关键在于使用灵活而开放的数据基础设施,保证其允许企业员工不断调整实际方案、直到他们的努力获得理想的回馈。通过这种方式,企业能够消除恐惧并最终以迭代为武器顺利迈向大数据有效使用的胜利彼岸。大数据的关注重点在于提出正确的问题,这也是让企业内部员工参与项目如此重要的理由。但即使拥有卓越的相关行业知识,如果根本无法开始提出问题的流程、企业仍然无法收集到正确的数据。这类问题也应该被纳入预期并作好相应准备。