有实际匹配案例吗
实际模糊匹配案例:
数据样例:
- 退款单:2025-03-01 10:05:30,金额99.00,退款单号
R20250301-001 - 订单池:
时间 金额 订单号 10:05:00 99.00 ORD-1001 10:06:00 99.00 ORD-1002
代码执行:
merged = pd.merge_asof(df_refund.sort_values('时间'),
df_orders.sort_values('时间'),
on='时间', by='金额',
tolerance=pd.Timedelta('5min'))
匹配结果:
R20250301-001→ORD-1001(匹配到最近5分钟内的订单)- 但实际应匹配
ORD-1002(因退款申请与订单时序倒挂)
正确做法:
- 增加店铺ID/商品ID二级条件以防误匹配
- 对所有模糊匹配结果标记“需人工核对”