Exadata – Channel [K]

Compare SAP HANA with Oracle Exadata

Post author:Kamus
Post published:October 21, 2012
Post category:Misc Oracle Database
Post comments:6 Comments

【前言】本文的最终观点：如果不是拿全公司的产品线来混合搭配，如果仅就一款产品而言，无论其它厂商如何宣传，目前整个IT业界还没有任何一款一体机产品能跟Oracle Exadata同场较量，TeraData不能，IBM PureSystem不能，SAP HANA也同样不能。而SAP HANA可能更应该拿自己去跟Exalytics作比较，而不是Exadata。本文对于SAP HANA的认知来自于“SAP HANA Essentials eBook”以及Experience SAP HANA站点，完全属于纸上谈兵，如果有更熟悉SAP HANA技术的技术人员认为本文有失偏颇，欢迎指正。【正文】需要承认SAP HANA的出现，在理念上与Oracle Exadata几乎是完全一致的，SAP也意识到大量的数据要从缓慢的磁盘子系统中读取到计算资源中，这部分读取操作成为了最大的性能瓶颈，解决方法就是在计算时减少不必要的IO。对此，SAP HANA的解决方案是跳过磁盘层，通过压缩，将大量数据完全放到内存中，当然于此相配套的还有一些对于数据持久化的技术解决方案，但是无论如何，HANA作到的只是内存间计算而已，能够做到这一点，几乎完全得益于硬件的发展，如果不是当前内存容量剧增而成本却持续下降的话，几乎无法想象HANA能够成为普遍的企业级解决方案。而与HANA相比，很明显Oracle Exadata在磁盘层读取技术上进行了大量创新，Smart Scan以及Storage Index等技术，都是更有意思的创造，从这一点而言，Oracle的创新更大，作为内存数据库＋内存分析解决方案的Exalytics提供了跟Exadata的完美连接，如果需要分析的数据过于庞大而无法完全放置在Exalytics的内存中，那么仍然可以通过Exadata中的压缩，并行，智能扫描等创新技术来加速存储在磁盘中的数据的计算。这是一套更完善的解决方案，也更适合企业IT架构更平滑的过渡。我们可以简单地认为SAP HANA是一个内存数据库解决方案（这可以与Oracle TimesTen相比较），或者称为内存计算解决方案（这可以与整合了Oracle BI，Oracle TimesTen以及Essbase的Exalytics相比较），这与Exadata的定位以及地位完全不一样。说的更直白一些，凭着内存足够大，将数据都放到内存中，来获得计算速度的提升，这算什么创新的本事？内存大了，哪家数据库厂家花点儿心思在持久化保存上，都能这么干，这样并无核心竞争力。以下列出一些分散的并不成体系的关于SAP…

Expert Oracle Exadata译者序

Post author:Kamus
Post published:April 11, 2012
Post category:Oracle Database
Post comments:5 Comments

从去年8月份到现在，我跟Kaya，Jacky合译的《Expert Oracle Exadata》，如果不出意外，应该可以在5月底出版。在出版以后，计划以ACOUG的名义和博文视点联合举办一些现场的发布活动，目前还在筹划中。我个人从这本书的翻译中获益良多，甚至在最近的这次大数据量、短停机时间的数据库迁移项目中就开始使用书中介绍的Exadata迁移方法，虽然我的这个项目并没有Exadata，但是仍然可以从书中描述的通用的迁移解决方案和优化手段中得到启发。所以，我想无论是不是在使用Exadata，这本书都值得期待。下面是为我的译者序。译者序－Kamus 这本书的翻译计划是从2011年8月份开始的，据我所知，最早是博文视点的编辑“侠少”找到阿里巴巴的张瑞（Jacky）和甲骨文的黄凯耀（Kaya），然后Jacky再找到我。实际上，我个人开始想要翻译这本Exadata技术书籍倒是从更早的时候就开始了，这本书在Amazon上的发行日期是2011年8月9日，其实早在2011年2月份已经有另外一本关于Exadata性能的书籍（Achieving Extreme Performance with Oracle Exadata，作者全部是Oracle公司员工），但是论作者的知名度，仍然是本书更受人关注。最早知道这本书是从本书联合作者Tanel Poder的个人技术Blog中，那是2011年3月份，Tanel发文说已经可以Apress网站上购买新书的Alpha版本，Tanel是全球最受人尊重的Oracle技术专家之一，而一本技术书籍可以预先购买Alpha版本也是很稀奇的事情，再加上Exadata正是当今IT界的当红炸子鸡，理所当然这本书非常值得期待。在2011年4月份，我个人跟某出版社联系过，表达了如果该书可以引进中国，那么我很愿意组织人手进行翻译的工作，对方的回复是正在谈版权，之后没有消息。然后，Tanel在6月份发文说，本书已经即将定稿，再之后，就是8月份，该书正式发售。而在正式发售的当月，博文视点就开始寻找中文版本的译者，可以说是非常迅速。而版权的猜测，那一定是博文视点拿到了版权，而某出版社失利了。:-D 以上的情况，让我收到Jacky的邀请以后，毫不犹豫地接受了工作，无论工作如何繁忙，我都愿意这本书的中文翻译者里有我的名字，这对于我而言可以说是一种荣幸。2011年8月17日收到这本书的PDF电子版（当然后来又收到纸质版），从8月份开始，Kaya，Jacky和我都迅速地投入了翻译的工作，在整个过程中，通过不断地沟通，我们按照每个人的经验和对各个章节的熟悉程度以及感兴趣程度，大致是均分了各个章节。我负责翻译的章节是一、二、四、六、十三、十六章，原本我给自己定下的计划是每两周翻译一章，那么最快可以在2个月内完成翻译，再加上校稿，本来计划在3个月内可以完成所有的翻译，也就是如果一切顺利，这本书的中文译本应该在2011年年底的时候就跟大家见面了。但是，计划永远是赶不上变化的，除了工作的繁忙和个人的懒惰，我们几个译者还都在其它方面出现了这样那样的意外情况，导致整个翻译工作整体滞后。所幸，还不算太迟，我想在你们看到本书的时候，这个世界上应该还没有更新的Exadata书籍可以参考。所以，这本书仍然是迄今为止想要了解Exadata，想要使用Exadata，想要监控调整Exadata的最佳参考书籍。 Oracle Exadata的举世独步，对整个数据库硬件/软件市场的震撼，在全球或者仅仅是中国国内的引人瞩目，乃至热销，这已经无需赘言。作为数据库从业者，也许你没有听过Netezza，也许你没有听过Twinfin，也许你没有听过Hana，但是你一定听过Exadata，这绝不仅仅是由于Oracle公司一贯的好战、勇于进攻、大力宣传的风格，而是Exadata确实具有独步天下的功能。也许我们不能说在经过最精细地调整以后，Exadata在数据仓库领域与其它竞争对手相比一定具有绝对的优势，但是，不要忘记，在现在这个世界里，又有多少是纯粹的数据仓库系统呢？又有多少用户愿意OLTP用一套系统而数据仓库又用另外一套系统呢？这其中的数据传输开销和系统设计复杂性的开销，如果能够消减甚至是避免，那么又何乐而不为呢？Exadata正是这样的一套软硬件一体的平台，同时支持OLTP类型负载和数据仓库类型负载，通过Oracle Database 11gR2中的资源管理器来更加精细地调控硬件资源，让两种类型的负载都能获得各自需要的资源，并顺畅执行。如果我们抛却Exadata在存储节点中的软件特性，它使用的各个硬件组件并不是划时代的，无论是Infiniband还是Flashcache/SSD，都已经出现了很久，在企业级市场中也被很多用户在使用了，但是将这些组件放在一起，并且预先调整为一个平衡的系统（没有任何一处明显的性能瓶颈），这是划时代的。Oracle将软硬一体机的概念推广到了开放性平台上，极大地挑战了Teradata的市场，用开放性的硬件＋开放性的操作系统＋开放性的数据库软件，构造出了一个平衡的，性能超强的平台，这同样是划时代的。好吧，前面我们提到了“抛却Exadata在存储节点中的软件特性”是吗？这就好比我们说，把皇冠上最闪亮的那颗宝石先摘下来，别闪花了我们的眼睛。现在，我们要把这颗宝石放回去了，智能扫描（Smart Scan），存储索引（Storage Index），混合列压缩（Hybrid Columnar Compression），无论哪一项软件特性都足以震撼数据处理市场，而当他们结合在一起，配合上Oracle Database原本就具有的高性能，再配合前面说的这个平衡的硬件架构，我们就得到了足以颠覆一切固有理念的惊人性能。在Exadata的POC现场，有客户因为实在无法接受Exadata展示出来的飞一般的速度而怀疑Oracle的技术人员在造假。这在无奈的同时无疑也是一种自豪吧。 Exadata的出现，颠覆了一些我们既有的数据库管理理念，但是无论如何，Exadata中运行的是Oracle Enterprise Linux（当然也有Solaris，不过是x86-64版本，至少到目前为止，Oracle还没有计划显示会出现SPARC平台上的Exadata），Linux上运行的是Oracle Database 11gR2，对于所有数据库技术从业者来说，之前积累的操作系统管理知识，Oracle数据库/RAC管理知识都仍然适用。我们需要的只是与时俱进，将Exadata的特有知识点加入我们以前的知识体系中。本书是最佳的入手点，因为本书中不但有Exadata的特性阐述，也同样有使用经验和最佳实践。要知道本书的作者都是真正的Exadata使用者，而本书的Review者（Kevin）更是Exadata的性能架构师（不过，Kevin现在已经离开Oracle公司，加盟EMC，去玩Greenplum了）。…