Percona 連載到 PostgreSQL 存 JSON object 以及增加 Index 的方式了...

先前 Percona 的人在講 MySQL 存 JSON object 的方式，現在開始講在 PostgreSQL 裡存 JSON object，並且增加 index 的方式了：「Storing and Using JSON Within PostgreSQL Part One」。

這基本上就是不想用 MongoDB，但還是有需要極為彈性而選擇用 JSON object 的需求。

首先先先建立一個表格，這邊直接用 JSONB：

alice=# CREATE TABLE table1 (id SERIAL PRIMARY KEY, jb JSONB);

接著拿「A dataset of English plaintext jokes」這邊的 reddit_jokes.json 來玩，我先把 JSON 裡面的內容變成 JSON Lines 格式：

cat reddit_jokes.json | jq -c '.[]' > reddit_jokes.jsonl

然後 COPY 了十次，多一點資料，後面可以看效能：

alice=# COPY table1 (jb) FROM '/tmp/reddit_jokes.jsonl' CSV QUOTE e'\x01' DELIMITER e'\x02';
-- (repeat this command 10 times)

接著跑個 SELECT 看看速度，我跑了幾次大約都在 260ms 上下：

alice=# SELECT COUNT(*) FROM table1 WHERE (jb->>'score')::int = 10;
 count 
-------
 25510
(1 row)

Time: 264.023 ms

然後針對 score 生個數字的 index：

alice=# CREATE INDEX ON table1 (((jb->>'score')::int));
CREATE INDEX
Time: 1218.503 ms (00:01.219)

接著再跑 SELECT 下去，可以看到速度快超多：

alice=# SELECT COUNT(*) FROM table1 WHERE (jb->>'score')::int = 10;
 count 
-------
 25510
(1 row)

Time: 12.735 ms

另外也可以加 column：

alice=# ALTER TABLE table1 ADD COLUMN score INT GENERATED ALWAYS AS ((jb->>'score')::int) STORED;

然後可以看到速度也不快：

alice=# SELECT COUNT(*) FROM table1 WHERE score = 10;
 count 
-------
 25510
(1 row)

Time: 222.163 ms

幫他補 index：

alice=# CREATE INDEX ON table1 (score);

速度有變快，但不知道為什麼沒有 JSONB 的版本快：

alice=# SELECT COUNT(*) FROM table1 WHERE score = 10;
 count 
-------
 25510
(1 row)

Time: 81.346 ms

算是還蠻好用的，不過得學 JSON query 語法... (應該是還好)

2019 年 Percona 對 UUID 當作 Primary Key 的看法

前陣子的「為資料庫提案新的 UUID 格式」這邊提到了有人提案要增加新的 UUID 格式，Percona 的老大 Peter Zaitsev 在 Twitter 上貼了「UUIDs are Popular, but Bad for Performance — Let’s Discuss」這篇在 2019 年時他們家的文章，題到了 MySQL 使用 UUID 當作 Primary Key 的事情： UUIDs are Popular, but Bad for Performance — Let’s Discuss https://t.co/2ulSGPB77L— Peter Zaitsev (@PeterZaitsev) August 21, 2021 要注意的是這篇文章沒有要從頭解釋 UUID 對於 Primary…

August 21, 2021

In "Computer"

MySQL 5.7 的 VIRTUAL column 與 index

看到 Percona 的「Using ProxySQL and VIRTUAL Columns to Solve ORM Issues」這篇後去找 VIRTUAL 的資料，發現其實以前就寫過了，而且是兩年前寫的了：「MySQL 5.7 的 JSON、Virtual Column 以及 Index」。在 2NF 的規範中會禁止資料的重複性以及可推導性。以這樣的資料結構開始： CREATE TABLE t1 ( id INT PRIMARY KEY AUTO_INCREMENT, birth DATE ); 與後者這樣延伸出來的資料結構： CREATE TABLE t2 ( id INT PRIMARY KEY AUTO_INCREMENT, birth DATE, year INT, month INT,…

April 4, 2018

In "Computer"

MySQL 5.7 的 JSON、Virtual Column 以及 Index

Percona 提到了 MySQL 5.7 的 JSON 與 virtual column，再加上 index 後的效能提昇：「JSON document fast lookup with MySQL 5.7」。每一家都把這些功能給做出來了，在 MySQL 5.7 提供了 JSON 格式： CREATE TABLE `test_features` ( `id` int(11) NOT NULL AUTO_INCREMENT, `feature` json NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB; 而你可以對 JSON 欄位運算，拉出資料後產生出 virtual column： ALTER TABLE test_features ADD…

March 9, 2016

In "Computer"

Author Gea-Suan LinPosted on September 4, 2021Categories Computer, Database, Murmuring, PostgreSQL, Programming, SoftwareTags database, db, index, json, jsonb, object, performance, postgresql, rdbms, speed, sql

Percona 連載到 PostgreSQL 存 JSON object 以及增加 Index 的方式了… – Gea-Suan Lin...

Percona 連載到 PostgreSQL 存 JSON object 以及增加 Index 的方式了...

Related

2019 年 Percona 對 UUID 當作 Primary Key 的看法

MySQL 5.7 的 VIRTUAL column 與 index

MySQL 5.7 的 JSON、Virtual Column 以及 Index

Leave a Reply Cancel reply

Post navigation

Recommend

区块链沉思录：为什么说2017年币圈死有余辜

Spain's LaLiga to launch NFT fantasy football cards

Amazon third-party seller Pharmapacks plans to go public via SPAC

Elizabeth Holmes Theranos trial: Defense tries to block testimony on wealth

视频：快递费上涨一毛，快递员能多挣多少钱？

视频：爆发式增长的汉服经济到底是什么？

Should Your Company Implement a Vaccination Mandate?

Let’s Redefine “Productivity” for the Hybrid Era

李松峰内部信宣布永辉架构调整：组织扁平化、提升灵活性、加速年轻化

比特币与传统资产：加密能否复制科技股的成功轨迹?

About Joyk