开源的Hadoop框架非常适合跨大量服务器对大型数据集进行分布式处理 。
它不擅长的是速度 。Actian Corp.生产了许多专门的数据管理系统 , 包括基于sql的Vectorwise分析数据库 , 该公司一直在观察其客户试图通过建立自己的连接来弥补与Hadoop的差距 。
最新版本的Vectorwise将为他们节省大量工作:3.0版本带有高级Hadoop集成 , 允许客户以Actian所说的相对适中的价格快速查询非结构化数据 。
Vectorwise总经理弗雷德?加拉格尔(Fred Gallagher)表示 , Hadoop有很多优势 。Hadoop的HDFS文件系统提供了几乎无限的存储空间 , Hadoop本身就是一个很好的并行处理 。但是 , 他补充说 , 由于它是一个批处理处理器 , 所以执行特别查询或向下钻取数据发现非常麻烦 。
【分析数据库现在已经集成了Hadoop】“因此 , 通过将Hadoop的大数据集功能与Vectorwise集成 , 人们可以得到他们想要的响应 。”
其他变化包括更高效的存储引擎、对更多数据类型和分析SQL函数的支持以及增强的DDL(数据描述语言)特性 。
加拉格尔表示 , 使用Hadoop连接器 , 在一台拥有12个核心的戴尔服务器上使用Vectorwise , 可以在90%的查询中胜过半机架的数据设备 , 成本不到10万美元(包括服务器) 。
“我们可以在一小时内在一组普通的服务器上转移tb 。”
他表示 , 使用Vectorwise和Hadoop的客户包括许多社交媒体公司 , 这些公司需要处理大量用户数据 。其中一个Hadoop custer有超过250 TB的数据 , 一次需要分析20 TB的数据 。另一个存储Web日志 , 并将1000亿条记录以向量方式进行处理 。
Vectorwise运行在Windows服务器和Linux上 。起价6万美元左右 。
Vectorwise直接出售给拥有自己的数据库和商业智能应用程序的大型帐户;否则 , 它将由解决方案提供商与这些应用程序一起出售 。
魁北克市的Korem Inc.是加拿大的合作伙伴之一 , 它销售地理空间测绘解决方案 , 其中一些方案利用了谷歌地球或邮政编码
Gallagher表示 , Actian正在寻找更多在大数据和数据仓库方面有专长的解决方案提供商 。合作伙伴将获得培训和产品销售折扣 。
推荐阅读
- 上海最值得去的艺术馆 上海邮政博物馆
- 知识科普:经常做噩梦怎么办
- 松鸦不孵蛋的原因
- 坐月子要多少天 2021年坐月子多少天
- 三宝鸟不孵蛋的原因
- 三星一定很生气 以至于这张Galaxy Z Fold 2照片泄露了
- 零食铺子进货渠道? 开个零食铺,怎么进货?
- 小米cc9e字体发虚要怎么弄
- 比特与兆的换算关系 1兆等于多少千比特