V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jahan
V2EX  ›  程序员

请教 pgsql 建数据库问题, encoding, collation, character type 有何种区别呢?

  •  
  •   jahan · 2018-04-01 17:23:24 +08:00 · 2532 次点击
    这是一个创建于 2427 天前的主题,其中的信息可能已经有所发展或是发生改变。

    http://public.dhe.ibm.com/software/dw/data/dm-1002postresqltodb2/PostgreSQL_to_DB2_Porting_Guide.pdf 粗略看了一下 pgsql 和 db2 的对比。 差别还不少。想请教一下,encoding 是不是应该对应 db2 建库的代码页?如果导入的数据是 utf8 是不是 encoding 就应该设成 utf8,collation 是将的系统代码吗 zh.cn 这种?有些文档里说默认就好,不需要设置。character type 这个会影响代码不?简单来说,数据怎么设置,才能让一个 utf8 的文本 load 之后不乱码?

    还有 db2 里面 bufferpool 的概念是不是在 pgsql 里面并没有呢?如果有应该怎么写呢? 比如

       CREATE BUFFERPOOL "MYDBRUN32K" SIZE AUTOMATIC PAGESIZE 32768;
    

    在 pgsql 里面建一个大表,应该怎么从 db2 翻译到 pgsql 呢,貌似这篇表空间讲的很粗略,不知道哪里有更详细的对照。DB2 表空间的关键字如何对照 pgsql 呢?

     CREATE LARGE TABLESPACE "MYDBSS1" IN DATABASE PARTITION GROUP IBMDEFAULTGROUP 
          PAGESIZE 32768 MANAGED BY AUTOMATIC STORAGE 
          AUTORESIZE YES 
          INITIALSIZE 1 G 
          MAXSIZE NONE 
          EXTENTSIZE 32
          PREFETCHSIZE AUTOMATIC
          BUFFERPOOL MYDBRUN32K
          OVERHEAD 7.500000
          TRANSFERRATE 0.060000 
          NO FILE SYSTEM CACHING  
          DROPPED TABLE RECOVERY ON;
    

    建表语句数据类型,倒是差不多,不过是不是如果使用 pg 的 text 或者 character varing ()或者 varchar ()会不会失去了原来表格中潜在的检查功能,比如原来 varchar ( 30 )只允许 30,而 varchar ()就放开了这个限制。建 partition 貌似 pgsql 很繁琐啊,又是继承又是触发器的。有简洁的写法吗?

    CREATE TABLE "DETAIL" (
    	"PRODUCT"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(60),
    	"SERIAL"	INTEGER/INTEGER,
    	"APPLICATION"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(300),
    	"LOCATION"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(60),
    	"COMPANY"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(300),
    	"CODE"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(300),
    	"AMOUNT"	DECIMAL(20,2)/NUMERIC(20,2)/DECIMAL(20,2),
    	"JYRQ"	CHAR(8)
    )
    COMPRESS YES /*这个在 pgsql 如何翻译?*/
    =====pgsql 写法=====
    CREATE TABLE DETAIL_2016M1 ( CHECK
       ( JYRQ >='20160101' AND JYRQ <  '20160201' )
             ) INHERITS (DETAIL);
    CREATE TABLE DETAIL_2016M2 ( CHECK
       ( JYRQ >='20160201' AND JYRQ <  '20160301' ) /*闰年怎么办,而且日期这样划分貌似有重复啊*/
             ) INHERITS (DETAIL);
    ===pgsql partition 触发器======
    CREATE OR REPLACE FUNCTION DETAIL_insert_trigger()
    RETURNS TRIGGER AS $$
    BEGIN
    IF ( NEW.created_at >= ‘ 20160101'AND
         NEW.created_at < ‘ 2016-0201') THEN
        INSERT INTO DETAIL_2016M1 VALUES (NEW.*);
    ELSIF ( NEW.created_at >= ‘ 20160201'AND
         NEW.created_at < ‘ 20160301' ) THEN
        INSERT INTO DETAIL_2016M2 VALUES (NEW.*);
    ELSE
        RAISE EXCEPTION 'Date out of range.  Fix the DETAIL_insert_trigger() function!';
    END IF;
    RETURN NULL;
    END;
    $$
    LANGUAGE plpgsql;
    
    CREATE TRIGGER DETAIL_event_trigger
    BEFORE INSERT ON event
    FOR EACH ROW EXECUTE PROCEDURE DETAIL_insert_trigger();
    
    
    ====db2 写法==
    PARTITION BY RANGE("DATE") (
    	 PART "2016_M1" STARTING('20160101') ENDING('20160201') EXCLUSIVE IN "XXDETAIL", 
    	 PART "2016_M2" STARTING('20160201') ENDING('20160301') EXCLUSIVE IN "XXDETAIL" 
    );
    
    CREATE INDEX "IDX_DETAIL_1" ON "DETAIL" 
    	("CODE" ASC,
    	 "DATE" ASC)
    	PCTFREE 10   /*没找到对应的关键字*/
    	ALLOW REVERSE SCANS; /*没找到对应的关键字*/
    

    感觉 db2 语法还是特别精简啊,转换起来还是有点麻烦,不知道能不能所有的特性都移植到 pgsql。尤其对于一个分区表来说,貌似 pgsql 处理复杂了些。。一个 e3 处理器,8g 内存,pgsql 能不能 300 亿数据的大表呢,如何联合查询会不会要等待半天?

    1 条回复    2018-04-01 17:44:51 +08:00
    jahan
        1
    jahan  
    OP
       2018-04-01 17:44:51 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   914 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 21:42 · PVG 05:42 · LAX 13:42 · JFK 16:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.