Channel [K]

Oracle 12.2 Sharded Database Management – Series I

##什么是Sharding > Sharding is a data tier architecture in which data is horizontally partitioned across independent databases. Each database in such configuration is called a shard. All of the shards together make up a single logical database which is referred to as a sharded database or SDB. Sharding是指数据层的水平分区，实际上在之前的Oracle版本中，分区已经是数据仓库系统非常常用的技术手段，但是在12.2之前，一个分区表的所有分区只能存储在一个数据库中，而在12.2之后，一个分区表的多个分区可以存储在不同的数据库里，这就被称为Sharding。为什么Sharding这么被大家期待？因为可能很多人都在说，Oracle的水平扩展能力不够强，虽然有RAC，但是集群节点越多内耗就越多，这样的水平扩展能力跟Hadoop之类的方案相比是不足的。我们先不评判这样的看法是不是正确，Oracle 12.2要告诉大家的是，要Sharding？要分库分表？要线性水平扩展？没问题，给你。假设这样的分库分表一共跨了10个Oracle数据库，那么这10个Oracle数据库对于前端应用来说是透明的，是一个统一的逻辑数据库，称为一个sharded数据库，或者简称为一个SDB，而在这个SDB中每个数据库被称为一个shard。一张大表可以根据规则被分割到每个shard中，在每个shard里拥有相同的字段结构，但是却拥有不同的数据，这样的一张表被称为sharded table。 ##Sharding适合所有的数据库应用吗？既然Sharding听上去很厉害，那么是不是现在只要遇到有性能问题的数据库，一律都可以使用Sharding技术来解决呢？当然不，Sharding不会也不可能是FAST=TRUE这样的参数。一个适合Sharding技术的应用，必须有非常好的数据模型，和清晰的数据分布策略（比如是一致性哈希，范围或者列表分区），并且访问这些数据也是总要通过shard key来过滤的，只有这样，才能在整个Sharded数据库架构中很好地将请求路由到合适的数据库上。这样的shard…

PostgreSQL 9.5 new feature highlight: BRIN indexes

前几天PostgreSQL 9.5 Alpha 1版本刚刚发布，在新版本中吸引我注意的是BRIN index。为什么引人注意？因为这就是活脱脱的Oracle Exadata中的Storage Index和Oracle Database 12.1.0.2中的新功能Zone Maps。 Exadata的Storage Index不说了，因为那并非数据库范畴的解决方案，而Oracle数据库12.1.0.2中的新功能Zone Maps曾让我非常激动，但是最终发现该功能也只能在运行于Exadata上的Oracle中才能启用，略失望。 Zone Maps的解释如下： Zone maps in an Oracle Database store minimum and maximum values of columns for a range of blocks (known as a zone). In addition to performing I/O pruning based on predicates of clustered fact tables, zone maps prune on predicates…

Compare PostgreSQL Standard Statistics Views with Oracle Dynamic Performance (V$) Views

Oracle数据库的性能视图几乎可以说是最引以为骄傲的功能，在那样细粒度的采样统计强度下，依然保持卓越的性能，基于这些性能数据采样之后形成的AWR，更是Oracle DBA分析数据库性能问题的最重要手段之一。那么在誉为最接近Oracle的开源数据库PostgreSQL中，如果要诊断性能问题，又有哪些视图可以使用呢？作为Oracle DBA，在学习PostgreSQL的时候，不可避免地会将PostgreSQL和Oracle进行比较。以下SQL命令，在mydb=#提示符下的均为在PostgreSQL中执行的，在SQL>提示符下的均为在Oracle中执行的。先看一下在PostgreSQL中存在那些统计信息视图。PostgreSQL中数据字典的命名还是很规范的，所有统计信息基本上都以pg_stat_开头。 mydb=# select relname from pg_class where relname like ‘pg_stat_%’; relname ———————————- pg_statistic pg_stats pg_stat_all_tables pg_stat_xact_all_tables pg_stat_sys_tables pg_stat_xact_sys_tables pg_stat_user_tables pg_stat_xact_user_tables pg_statio_all_tables pg_statio_sys_tables pg_statio_user_tables pg_statio_all_indexes pg_statio_sys_indexes pg_statio_user_indexes pg_statio_all_sequences pg_statio_sys_sequences pg_statio_user_sequences pg_stat_activity pg_stat_replication pg_stat_database pg_stat_database_conflicts pg_stat_user_functions pg_stat_xact_user_functions pg_stat_archiver pg_stat_bgwriter pg_stat_all_indexes pg_stat_sys_indexes pg_stat_user_indexes pg_statistic_relid_att_inh_index (29 rows) pg_stat_activity 该视图显示了连接入一个Cluster下所有数据库的会话的统计信息，每个会话一行记录，类似于Oracle中的VSESSION视图。 pg_stat_activity.query字段直接显示了该会话正在执行的SQL或者上次执行的SQL语句文本。在Oracle中检查一个会话正在执行的SQL语句文本，则需要通过VSESSION和VSQL视图Join才可以。 pg_stat_activity.pid字段直接显示了该会话在操作系统上的进程ID，这样通过top命令看到的繁忙操作系统进程，可以很简单地通过该字段定位，来作进一步的诊断。在Oracle中则需要通过VSESSION和V$PROCESS视图Join才可以。 pg_stat_archiver 该视图始终只有一条记录，显示了负责一个cluster下所有数据库的重做日志（PostgreSQL中称为WAL file）归档进程的统计信息，记录项比较简单。last_archived_wal和last_archived_time分别显示了最近一次归档的文件名和最近一次归档时间。…

面朝大海，春暖花开