pg_rrf

混合检索的倒数排序融合函数

概览

扩展包名版本分类许可证语言
pg_rrf0.0.3RAGMITRust
ID扩展名BinLibLoadCreateTrustReloc模式
1845pg_rrf-

manually upgraded PGRX from 0.16.1 to 0.17.0 by Vonng

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY0.0.31817161514pg_rrf-
RPMPIGSTY0.0.31817161514pg_rrf_$v-
DEBPIGSTY0.0.31817161514postgresql-$v-pg-rrf-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64PIGSTY MISS
el8.aarch64PIGSTY MISS
el9.x86_64PIGSTY MISS
el9.aarch64PIGSTY MISS
el10.x86_64PIGSTY MISS
el10.aarch64PIGSTY MISS
d12.x86_64PIGSTY MISS
d12.aarch64PIGSTY MISS
d13.x86_64PIGSTY MISS
d13.aarch64PIGSTY MISS
u22.x86_64PIGSTY MISS
u22.aarch64PIGSTY MISS
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3
u24.x86_64PIGSTY MISS
u24.aarch64PIGSTY MISS
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3

构建

您可以使用 pig build 命令构建 pg_rrf 扩展的 RPM / DEB 包:

pig build pkg pg_rrf         # 构建 RPM / DEB 包

安装

您可以直接安装 pg_rrf 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install pg_rrf;          # 当前活跃 PG 版本安装
pig ext install -y pg_rrf -v 17  # PG 17
pig ext install -y pg_rrf -v 16  # PG 16
pig ext install -y pg_rrf -v 15  # PG 15
pig ext install -y pg_rrf -v 14  # PG 14
dnf install -y pg_rrf_17       # PG 17
dnf install -y pg_rrf_16       # PG 16
dnf install -y pg_rrf_15       # PG 15
dnf install -y pg_rrf_14       # PG 14
apt install -y postgresql-17-pg-rrf   # PG 17
apt install -y postgresql-16-pg-rrf   # PG 16
apt install -y postgresql-15-pg-rrf   # PG 15
apt install -y postgresql-14-pg-rrf   # PG 14

创建扩展

CREATE EXTENSION pg_rrf;

用法

来源: README项目仓库

pg_rrf 提供互惠排名融合(Reciprocal Rank Fusion,RRF)函数,用于混合检索场景下的分数融合。 它的重点是合并多个有序候选列表,而不需要手写 FULL OUTER JOIN / COALESCE 之类的连接逻辑。

核心函数

  • rrf(rank_a, rank_b, k)
  • rrf3(rank_a, rank_b, rank_c, k)
  • rrf_fuse(ids_a bigint[], ids_b bigint[], k int default 60)
  • rrfn(ranks bigint[], k int)

README 还说明了这些分数辅助函数的行为:

  • 缺失的排名会被忽略
  • <= 0 的排名会被忽略
  • k <= 0 时会报错

示例

CREATE EXTENSION pg_rrf;

SELECT rrf(1, 2, 60) AS rrf_12;
SELECT rrf3(1, 2, 3, 60) AS rrf_123;
SELECT rrfn(ARRAY[1, 2, 3], 60) AS rrfn_123;
SELECT *
FROM rrf_fuse(ARRAY[10, 20, 30], ARRAY[20, 40], 60)
ORDER BY score DESC;

混合检索模式

上游 README 将 rrf_fuse 作为手工融合查询的替代方案:

WITH fused AS (
  SELECT *
  FROM rrf_fuse(
    ARRAY(SELECT id FROM docs ORDER BY bm25_score DESC LIMIT 100),
    ARRAY(SELECT id FROM docs ORDER BY embedding <=> :qvec LIMIT 100),
    60
  )
)
SELECT d.*, fused.score
FROM fused
JOIN docs d USING (id)
ORDER BY fused.score DESC
LIMIT 20;

需求

  • PostgreSQL 14-17
  • Docker 和 Docker Compose v2

README 说明构建与测试流程都在 Docker 中运行,因此该包工作流不依赖本地 PostgreSQL 或 Rust 工具链。


最后修改 2026-04-14: update extension catalog (fa7cf58)