Teradata大数据淘金术

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:shuilinxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  今年3月IDC发布的“数字宇宙”报告显示,目前的数字宇宙规模已经达到了2.8ZB,预计在2020年达到40ZB。40ZB的数量相当于地球上所有海滩沙粒数量的57倍。
  沙中淘金,并非易事。4月23日~24日,主题为“数据价值,极致演绎”的“2013Teradata大数据峰会”云集了金融、电信、航空、零售、制造等1000多名行业用户,与Teradata一起讨论如何在大数据时代对数据进行高效管理和分析,挖掘数据金矿。
  被忽略的V
  当前,业界普遍认为大数据具有3V属性,即Volume(数据容量大)、Velocity(增长速度快)和Variety(数据类型繁多)。然而,Teradata天睿公司大中华区首席执行官辛儿伦表示:“我们往往忽略了大数据的另外一个V,即Value(价值)。但这才是最重要的V。”
  正如辛儿伦所说,如果不能在无穷无尽的数据沙粒中淘出真金,收集、处理再多的沙粒也毫无意义。Teradata天睿公司国际集团总裁Hermann Wimmer介绍,Teradata天睿公司通过大数据分析、数据仓库、整合营销等解决方案为各个行业的用户提供价值。
  可以想见,金融、电信、零售等行业对大数据分析与管理存在着旺盛的需求,他们更为迫切地希望大数据为他们的运营、营销与服务带来价值。“2012年上半年中国工商银行手机银行新增客户动户率提升至18%,交易额同比增长300%,已经有75%的业务通过柜台以外的方式办理。”中国工商银行信息科技部副总经理张颖在峰会的主题演讲中表示,业务的快速发展带来了大量的客户数据,只有对这些数据进行充分的挖掘和分析才能持续提升服务水平,形成良性循环。
  张颖介绍,中国工商银行通过客户特征分析提炼客户消费特征,从而可以定制针对个人的营销方案;基于数据仓库的数据挖掘,2012年12家分行展开了15项精准营销活动,综合成功率超过20%;当个人客户申请贷款时,信贷系统将根据数据仓库中的信息进行客户评级,并根据评级完成信贷流程。
  统一数据架构
  提到大数据就不能不提Hadoop。作为大数据分析提供商,Teradata天睿公司如何看待Hadoop呢?
  Teradata天睿公司首席技术官宝立明认为,Hadoop具有良好的扩展性和高吞吐量负载率,存储成本低并且没有软件许可成本,对工程师而言高效且灵活,开源等诸多优势,但同样存在着在复杂查询和批量作业性能欠佳,开发部署成本高,难以被全企业广泛采纳,不成熟、发布周期长等挑战。
  峰会上,Teradata天睿公司重点演示了新一代数据分析解决方案——Teradata统一数据架构(Teradata Unified Data Architecture,简称UDA)。该架构在集成平台上整合了Teradata整合数据仓库、Aster大数据探索平台以及基于Hadoop的数据存储预处理,使用SQL-MapReduce专利技术以及SQL-H等功能强大的连接器,无需分析人员掌握复杂耗时的编程语言。
  “通过UDA,用户可以实现从原生矿到金矿粉再到提炼金子的完整过程。”辛儿伦说。在宝立明看来,UDA是一个极佳的解决方案,它突破了现有的单点数据分析技术的局限,Teradata数据仓库、Aster大数据探索平台与Hadoop形成互补,让企业用户根据业务需求选择合适的大数据架构,同时通过UDA将这些数据进行有效的整合。
  “过去,企业在数据仓库中要求高效、精准的数据分析,例如经营分析等场景。现在,新的业务场景可能要求企业整合各个方面的数据,如果只用传统的结构化数据分析模式,已经不见得是最经济有效的办法了。所以,企业必须将数据集中起来,通过一个强大的探索整合平台,才有可能真正得到大数据中的某些重要价值。”辛儿伦认为。
  从1星期到1小时
  要实现大数据最重要的一个V(价值),就需要处理好其他三个V。数据容量(Volume)不必多说,数据类型的多样性(Variety)完全可以通过UDA来解决,而快速增长(Velocity)就要求大数据平台必须进行快速的分析和响应。
  LinkedIn是全球最大的职业社交网络媒体。LinkedIn商业分析部总监张梦溪在接受本报记者专访时介绍,数据分析传统的金字塔模型从下到上包括技术层和分析层两个层面,依次为:技术层的数据采集和质量管理、商业智能和报表,分析层的专业分析、深度分析、商业洞察和决策,技术层往往占用了近90%的资源。“我们希望让技术层的工作变得高效,在实施数据标记并保证数据质量的前提下,将员工的精力集中到核心分析工作上。金字塔模型则随着底层的精简变成一个菱形。”
  分析模型的简化,离不开高效解决方案的支持。“我们选择了Aster data,是因为它的数据分析速度非常快。”张梦溪介绍,Aster data能够对结构化数据和非结构化数据进行更深入的关联分析,帮助LinkedIn分析师很快发现大数据的大价值。自2008年开发了‘你可能认识的人’功能之后,LinkedIn相继推出了‘你感兴趣的人’、‘你想雇佣的人’等功能,这些都是基于Aster data做的研发。
  “在全部数据转移到新平台后,尽管LinkedIn的数据量以几何倍数的速度疯涨,但是相关数据分析时间却从1星期缩至1个小时以内。同时,由于快速的响应和丰富的功能,LinkedIn的用户黏性提高了30%到40%。”张梦溪说。
  用IDA拥抱大数据
  峰会云集了诸多行业用户现身说法,他们是大数据应用的先行者,当他们已经将美味的蟹肉含在口中的时候,也会让那些跃跃欲试的人们更为心动。
  Hermann Wimmer指出,无论传统企业还是新兴企业,都会出现越来越多的大数据需求。“数据的来源将越来越丰富,获取也越来越容易。但如何整合营销、销售、研发、财务、人力资源等各个部门的数据,并对这些数据进行精准分析,才是对于企业来说最为重要的。”
  “例如在物流行业,在我们内部有一个利润分界点的概念。我们希望帮助企业充分的利用数据分析降低成本,最大程度地提升收益,从而实现他们的利润最大化。”Teradata天睿公司全球运输物流业总监Shaun Connolly对记者说,“好比一个人坐在火炉旁,但手里拿着一块冰,手会感觉冷,但是不是这个人面对的整体坏境都很冷,只有通过数据分析才能知道。通过数据分析,企业才能知道哪些业务和客户是利润来源的关键,哪些业务和客户对利润的贡献有限,这样才能真正降低成本,把主要精力放在能够提升企业效益的重要业务和重要客户上。”
  “Teradata天睿公司认为,企业要从大数据中获取最大价值,应遵循IDA(Integrate、Discover、Act)方法论。首先进行信息的整合(Integrate),然后在此基础上进行大数据的探索(Discover),通过探索与洞察的结果来付诸行动(Act),而行动翻过来还可以形成对信息整合的反馈。”辛儿伦告诉记者。
其他文献
43%的IT人士经历过由于员工蓄意或偶然的行为导致企业数据泄漏;32%的员工曾经连接受感染的存储设备;约40%的智能手机用户没有安装反病毒软件;71%的IT人士称企业更关注员工上网行为……黑客攻击让企业IT人员神经紧绷,但上述这些来自研究机构和安全厂商的调查数据表明,企业面临的最主要威胁仍然来自企业内部。  此外,瑞星在2012年7月发布的信息安全报告显示,感染型病毒仍普遍存在于国内企业网络中,严
欧特克中国研究院正式员工年龄通常大于30岁,而且一般是硕士、博士,而23岁、只有专科学历的李泽成为欧特克中国研究院的一名新正式员工。是什么让李泽如此幸运?除了因为他对三维设计的刻苦钻研以及扎实的基本功之外,全国三维数字化创新设计大赛(下文简称全国3D大赛)为他提供了叩开欧特克大门的敲门砖。“在面试官问我有没有什么设计的实战经验时,我信心倍增。我将自己参加全国3D大赛的作品创意到建模、渲染的过程一一
面对互联网对传统企业的冲击一浪高过一浪,传统企业该如何完成互联网化的转型,浪潮集团执行总裁王兴山明确提出了企业互联网化的三部曲:“内部精细、外部互联、数聚智慧”。  2014年10月24日,在浪潮Inspur World 2014大会的分论坛上,浪潮集团执行总裁王兴山在题为《从精细到互联——数聚企业智慧》的演讲报告中提出企业互联网化三部曲“内部精细、外部互联、数聚智慧”,并明确指出互联网时代仍然需
作为客户关系管理的前沿阵地,联络中心正在加速走入云端。Aspect为此已经提供了成熟的解决方案,云计算联络中心量身打造的托管型产品Aspect on Demand以及支持云计算环境的劳动力优化解决方案Workforce Management,让云计算技术通过联络中心来达到快速发挥实际效益的目的。  据Gartner数据显示,托管呼叫中心服务在北美已经发展比较成熟,2011年北美托管呼叫中心服务市场
2013年3月19日, Vision Solutions在北京宣布推出最新云保护与恢复解决方案。这种新型解决方案可帮助云服务提供商为客户提供“恢复即服务”的云应用,以加快云业务的速度,同时充分利用“按使用付费”机制的便捷特性。  性价比高 风险低  Vision公司的“云保护与恢复”解决方案为IT专业人员提供了一个通往云计算的高性价比、低风险的选择。创新云保护与恢复解决方案为云服务提供商带来价格适
在移动互联网生态系统中,有大批的移动应用、游戏、硬件的开发者正致力于寻求产品优化、人脉扩张、人才招募、品牌提升、资金链供应等问题的解决之道。而在这一过程中所表现出的创新性和活力,使他们成为整个生态系统中当之无愧的“主角”。  在去年的MDCC移动开发者大会上,有嘉宾对彼时移动互联网开发者所遇到的困难进行过总结,包括移动应用缺少商业化模式、移动互联网开发环境复杂、可拓展终端缺乏等。而在2014年MD
在我国多方通信市场,有这样一支独特的团队,2006年呱呱坠地,发展初期低调成长,2011年异军突起,一举超越同类厂商,成为国内领先的多方通信会议服务供应商,业务增长率超市场平均水平一倍,并稳居领导者地位,它就是上海会畅通讯股份有限公司(以下简称“会畅通讯”)。  相比国外,我国的多方通信虽然起步较晚,但在十几年的发展中也经历了三个阶段:多方通信1.0时代——销售设备、多方通信2.0时代——提供服务
用户评价直接转化为供应商评级指标  对供应商的考核依据直接来自终端用户的评价,终端用户的维修需求可以直接反映到供应链上转化为采购需求……仅仅经过一年多时间的建设,山东常林机械集团(简称常林机械)的集团管控系统就帮助其实现了从内到外的高度业务协同。  究其原因,常林机械信息管理部总监刘小钢认为,这是因为常林机械的所有管理信息化系统都是基于浪潮GS来建设的,形成了一个信息可以无缝集成的整合的一体化系统
在纳斯达克上市后,全新的战略、全新的布局为世纪互联带来了一系列变化。特别是在云服务市场,世纪互联的角色正由“微软云”的中国载体向中国云的“使能者”转变。  国际水平的本土云服务  上市之后,世纪互联在传统业务之外展开的积极尝试有目共睹。一方面是其通过虚拟运营商牌照、移动手机运营许可在电信领域开疆拓土,一方面则是其在中国云服务市场的积极布局。  今年,世纪互联紧锣密鼓的云布局颇为引人注目:收购中国第
当你走进4S店,用手机扫描厅内摆置的一块形状类似茶几的平板设备上的二维码,这样手机就和该设备建立了联系:手机中存放的您感兴趣车型的图片,你只需手指轻轻一滑,就能将图片拖到设备上,进而了解该款车的翔实信息;如果你喜欢设备旁边车模型的款式,只需要把模型放到该设备上,屏幕立刻会出现更多该款式的详细参数、用户评价等……  这是基于新一代Windows 8操作系统的平板设备在假想的4S店完全互联的真实应用。