解决postgresql表中的字段名称包含特殊符号的问题

2022-07-25,,,,

在创建postgresql表的时候,由于字段包含了"()"这种特殊字符,导致创建表的时候报错。

解决方法:

给包含特殊字符的字段加上双引号"",再进行创建表即可

例如:

create table freighttransport_tab (
 id serial,
 日期 text,
 "重量(公斤)" text
 )

此时"重量(公斤)"字段包含特殊符号(),创建表时,在sql语句中对该字段添加双引号即可。

补充:postgresql 去除字符串中的不可见字符 终极方法

测试表中数据如下:

postgres=# select * from test;
 street 
----------
 澄江街道
 澄江街道
(2 行记录)

然后我们执行如下sql:

postgres=# select * from test where street='澄江街道';
 street 
----------
 澄江街道
(1 行记录)

问题已经暴露,明明两条‘澄江街道'的记录啊!咋查出来就一条了??

接下来进行如下检查:

postgres=# select street, length(street) from test;
 street | length 
----------+--------
 澄江街道 |  5
 澄江街道 |  4
(2 行记录)

遇到这种情况就问你懵不懵逼??一样的字符串长度一个5一个4啊!!日狗,混入不可见字符了。

可能这时已经有人想出了办法,这种办法如下:

update test set street='澄江街道' where street like '%澄江街道%';
postgres=# start transaction;
start transaction
postgres=# update test set street='澄江街道' where street like '%澄江街道%';
update 2
postgres=# select * from test where street='澄江街道';
 street 
----------
 澄江街道
 澄江街道
(2 行记录)
 
postgres=# rollback;
rollback

哈哈,皆大欢喜,问题解决了。

但是,如果这种数据很多呢???

你是要一条一条的update咯??

不幸的是,本人遇到的这种数据就很多(因为数据是从excel中导入进来的)。

然后我就找到了如下这种终极方案:

先确定这种不可见字符到底是哪个字符(一般情况一个csv文件的中如果有不可见字符应该也都是同一个不可见字符)

postgres=# select encode(street::bytea,'escape') from test;
       encode       
--------------------------------------------------------------
 \357\273\277\346\276\204\346\261\237\350\241\227\351\201\223
 \346\276\204\346\261\237\350\241\227\351\201\223
(2 行记录)

那段\357\273\277多刺眼啊。。。。。。

如果你有仇人可以考虑有这种方法报复他了

然后确定是否可以将该不可见字符过滤掉:

postgres=# select encode(street::bytea,'escape') from test where btrim(street::bytea,e'\\357\\273\\277'::bytea) = '澄江街道';
       encode       
--------------------------------------------------------------
 \357\273\277\346\276\204\346\261\237\350\241\227\351\201\223
 \346\276\204\346\261\237\350\241\227\351\201\223
(2 行记录)

查到了两条记录,用这个btrim看来确实是把字符串里的\357\273\277全部去除了。

接下来就要update表啦~

postgres=# update test set street=btrim(street::bytea,e'\\357\\273\\277'::bytea);
update 2

update成功。

查看数据:

postgres=# select * from test;
   street   
----------------------------
 \xe6be84e6b19fe8a197e98193
 \xe6be84e6b19fe8a197e98193
(2 行记录)

哈哈,中文变成16进制的了。

不过不用捉急。

postgres=# select convert_from(street::bytea,'utf8') from test;
 convert_from 
--------------
 澄江街道
 澄江街道
(2 行记录)

再转回utf8编码不就行了?(乱码问题是所有问题中最简单的问题,没有之一)

按照这种方法update一下表:

postgres=# update test set street=convert_from(street::bytea,'utf8');
update 2
postgres=# select * from test;
 street 
----------
 澄江街道
 澄江街道
(2 行记录)

正常的数据又回来啦。

postgres=# select * from test where street='澄江街道';
 street 
----------
 澄江街道
 澄江街道
(2 行记录)
 
postgres=# select street, length(street) from test;
 street | length 
----------+--------
 澄江街道 |  4
 澄江街道 |  4
(2 行记录)

不可见字符的问题也得到了解决。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。

《解决postgresql表中的字段名称包含特殊符号的问题.doc》

下载本文的Word格式文档,以方便收藏与打印。