doris collect_set函数
collect_set函数是一种用于聚合数据的函数,它可以对一个指定的列进行去重操作,并将不同的值汇总为一个集合。这个函数常用于处理分组后的数据,以获取某一列的去重后的所有值。
例如,假设我们有一个名为“orders”的表格,其中包含以下两个列:
order_id product_name 。
1 Apple 。
2 Orange 。
3 Banana 。
1 Orange 。
2 Banana 。
如果我们想要获取每个订单中唯一的产品,我们可以使用以下的SQL语句:
SELECT order_id, collect_set(product_name)。
FROM orders。
GROUP BY order_id;。
doris
该语句将分组每个订单,并在每个订单中创建一个列表,包含该订单中唯一的商品名称。结果会是这样的:
order_id collect_set(product_name) 。
1 ["Apple", "Orange"] 。
2 ["Orange", "Banana"] 。
3 ["Banana"] 。
从结果中可以看出,每个订单中的商品名称都已经去重,且唯一值被汇总到了一个集合中。