知意图:了解大数据的意图

来源:畅享网  作者:蒋居裕
2014/11/24 15:22:01
各位网友大家好,今天我们为大家请到的是来自精诚集团云中心和Big Data事业处的负责人蒋居裕先生,欢迎大家。

这个就提醒我们不要太过技术化,我们应该强调商业价值而不是技术的高超。我觉得对整个大数据的产业来讲,我们这种传统上就是以IT技术为起家为这样的背景做的事情,我们必须要知道怎么跟企业对话,怎么样协助他的营销做的更好,怎么样协助他能够提高。这些事情我们转化成Etu我们知道,因为我们提到这样的事情我们怎么做,所以我们才会很大胆的在第一年,就把商业部分放进来作为我们服务的一块。

也就是说因为一些企业主他已经知道他该去做这些大数据的处理跟分析,可是他却不是那么清清楚楚好在他在企业内部应该把什么东西放进来,数据在哪里,怎么放进来,怎么了解,呈现,最后产生的价值点应该是什么。先透过我们顾问服务去把这些事情理清之后才进行后续的工作。对于他来讲他这过程里面他的KPI,他的投资报酬ROI,我们才跟他定义好,之后才做后续的工作。

主持人:所以我觉得Etu刚开始有这样的工作,可以避免很多弯路。如果我们看去年就会发现我们之前都在谈是一个工具,不是一个技术,我们可以理解为是一个管理工具。所以我觉得像您刚才谈的Etu现在的方式非常好。刚才谈到一个问题,我觉得我还是特别的认同,就是像大数据我们在这个时间段最核心的技术告诉你,它的价值是怎样的。现在围绕大数据有不同的产业,我记得有一篇文章,写的就是大数据,这个写的是两个方面,一个是应用企业来讲,你如果率先使用大数据分析,同时大数据也会挖掘到它的价值,,对于产业的人来讲的话,在这样的状态下获利是比较多的。

所以,这样的话,我觉得,现在我们看的话,大数据产业现在非常好,就像云计算一样,虽然您谈的时候也谈到云计算现在还不能断定未来是什么样子,但已经有一些成功的例子。云计算未来的产业是一个主流的模式。我觉得Etu也是这中间的一环,我们是不是也是,就是从两方面来讲,技术层面和用户来讲,也是他们带给这么高的价值。但从产业来讲我们进入这个产业,是不是这个产业非常好的。

蒋居裕:先回答后面的问题,当然是,不然一群人不用这么辛苦。我们绝对是看到大数据这个产业。像我们刚才分析的,这个产业还处在早期的市场,还没有跨越这个鸿沟。回到第一个问题,我们在企业端,我们怎么让我们的目标客户去知道,这些价值对他们而言是在哪里。然后过程要更加透明化,要他们知道,以便于降低他的不安全感。降低他不安全感还是要给大一个合理的报酬数字说,投入多少会得到多少,所以我们不应该在这个时候就把大数据的价值放到每个产业去。我们必须在里面挑选一些很快能彰显价值的产业。那个价值点会特别的被放大。应该是在这个时间点更强调这些东西,其实刚刚提到的技术产业模型里头,到了后面的时候,你一个技术产品被跨越鸿沟,然后会变成某一个特定行业的某一个特定共同的解决方案。可是这有一个过程就是标准化产品,当你到了一个标准化产品阶段的时候,其实各个行业都会需要它了。就像数据库一样,数据库其实已经部分产业化,只要有IT应用几乎就没有办法。

可是大数据现在的情况还不是这样的,所以你必须择重,去找你的重点行业,重点应用。然后就要尽全力的让这些应用把它的价值点发挥出来,取得第一批企业用户的认同,这个产业才会有未来。

主持人:其实我觉得这个理念真的是相辅相成的,就像您刚刚说的一些企业对大数据不了解,他不知道带给我什么样的东西。其实现在很大一部分企业,他可能有数据,也有产能,但到底是干什么用的没有这个概念。但是我觉得随着我们本身大数据相关的解决方案或者是产品出来,那为什么会有这些东西呢?这个他可能是一个互相促进的过程。其实现在大数据的概念火起来之后,你设想过哪些市场吗?甚至软件厂商数据库的一些厂商,反正都是大数据的解决方案。在企业里放眼一看都是大数据的解决方案,这些大数据的解决方案到底发挥得都是什么样的价值,我们现在也是有数据的产品跟运营,这个到底是什么样的,所以可以把基础性分开讲一下。

蒋居裕:好,我先从一个叫做数据温度的角度来谈这个事情。所谓的数据温度我们可以把企业里面的数据分成三种温度,一个是热数据,热数据就是藏在数据库或者数据仓储里面存放或者处理分析的那些结构化的数据。它的特性就是说它在线调用的频率是相对高的,它随时要在线。它是直接面对很多商务的应用,比如市ERP、CIN、BI这些东西。中间的是温度没有那么高,可是不时要接受一些在线的处理分析,可是它的实时性要求不像热数据这么高,可能是说我一批进来做数据的处理或分析,可能是一两个小时就可以了,我不需要是几秒钟的时间,非得马上把结果呈现出来,这一层就是我们刚才所提到的大数据处理平台所专注要做的事情。这个毕竟还是本身随时要在线查的到。那一些已经过期的,已经不需要在线的,我们就变成冰冷的数据,可能放到一般的储存系统去,那比如有一天我们必须调回来用的时候还可以回传到我们大数据处理平台。有时候我们大数据处理平台处理完的东西,有一些也可以回到数据库或者数据仓库去,就变成一个热数据。

所以这期间在处理这些数据的时候,就必须根据它的时效性、有效性,以及它当时的价值,他必须在里面做数据的企业管理,摆在适当的位置,用适当的处理机制处理掉。所以,从这一点来看的话我们刚刚提到,很多传统数据库,数据仓储,甚至现在很多传统的IT厂商们,他们会去买一些新的技术来补强。他们可能会用一些NPP的DB产品来取代一些数据存储技术。这些都是归类在冰数据。传统上有很多存储设备的厂商,一般来讲他们只做存储不做处理,大家共同针对自己专注而且擅长的部分把价值发挥出来,这整个来,我们用的是说这个不止是大工具,这个叫做完全数据。

主持人:我觉得其实我们分析一些数据,我们把它分为温度的调整,分成三型之后,企业这个感觉就会明晰一些。现在是一个存储的大数据,还是一个软件的大数据。那回到我们刚才说的,其实现在也是在推出我们自己的一个计划,从这一点来讲,这个领域处理得是中间,其实对于这个来讲,我相信其实对于热数据这种处理得价值,现在企业已经到了一定的程度。那对于另外企业用数据处理的话,那个价值在哪里?

蒋居裕:其实冷数据这个是不处理,只存储,把它放进去,等到真正调用的时候再出来。可是问题就是出在这里,当你把数据往这种冷存储设备去放的时候,一旦要回来调用,因为它是大数据。我们刚才讲说大家都说是大数据公司,都有大数据的解决办法跟产品,但就是在这三层里面你都可以放很多数据。可能都不是传统这种数据级别说,几百个一两百,没有问题,大家都是大数据厂商。你在这三个级别里面做你擅长的事情,这个没有问题。所以我也不去否认说大家都是大数据公司,大数据产品。

但是回过头来,我们在中间这一层,它的特性是什么?是第一个,比较偏批次这种数据处理。这个批次的数据处理,他又包含了很多种数据格式,我们一般常常讲的就是说很多所谓的非结构化数据,其实我们非结构化还有两种,一种是半结构化,半结构化是什么?就像是网络预制的,或者点击留下来的记录。很多,甚至有些是从传统的数据库里面扩出来,变成一个数据库中间的空白隔开的,或者是逗点隔开的。虽然很大量,它是半结构化数据。

另外一种是纯粹纯粹的非结构化数据。这种就是各种不同的图形、档案,可能是办公室相关的文档。可能是一个声音的档案,可能是多媒体的视讯。这些东西都有某种处理,分析查询的价值。这些东西格式很多,很多很多的格式,其实都可以在这个团队平台上面获得一种批次处理得效能。

再来的话,在处理得时效性上面因为他是分布式的,你可以想象今天嫌批次处理得速度不够,那你就加一样效果规格的硬件就可以了。就可以把整个处理得速度加快。所以这里面最重要的是在中间这一层有处理得内涵,有处理得能力。再加上有一定的处理数据,可以处理各种不同的格式。这个就是中间这一层的价值所在。

主持人:是,我还有一个问题,这个问题可能比较基础一些。您刚才也说道了冷热数据,这两个处理的话怎么去?对企业应用…,这个中间是不是有不一样?

蒋居裕:都有,这个问题在我们看到的上面来看的话,有些就是两个数据处理同时并存。那个价值对企业主来讲才能呈现出来。我举个例子,在电子商务里头,我们现在很关注的一个是做推荐,这个推荐重点可能是在要让你到这个电子商务网站知道你现在看的东西其他人也再关注,其他人会关注什么另外一个商品。可是这个推荐的清单对使用的人是怎么样产生的,这个其实背后有所有的,就是这个电子商务有两百万个会员,这两百万个会员可能在网站里面十万种产品做了不同程度的浏览行为。这些都是半结构化数据,或者是团队或Etu的平台做处理之后,然后我们把商品这些找出来,那做什么事情呢?我们就把对一个特定的商品关联到了其他50项、100项商品,里面有做重要性的排序,把它放到这个数据库里面,所以当浏览者上到网站的时候,看到这个清单,不管是十项还是一百项都是从这个结构化数据库捞出来的。可是这个清单是谁给他的?是我们Etu给他的。

责编:李玉琴
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918