有实际匹配案例吗

实际模糊匹配案例:

数据样例:

  • 退款单:2025-03-01 10:05:30,金额99.00,退款单号R20250301-001
  • 订单池:
    时间 金额 订单号
    10:05:00 99.00 ORD-1001
    10:06:00 99.00 ORD-1002

代码执行:

merged = pd.merge_asof(df_refund.sort_values('时间'), 
                       df_orders.sort_values('时间'),
                       on='时间', by='金额',
                       tolerance=pd.Timedelta('5min'))

匹配结果:

  • R20250301-001ORD-1001(匹配到最近5分钟内的订单)
  • 但实际应匹配 ORD-1002(因退款申请与订单时序倒挂)

正确做法

  • 增加店铺ID/商品ID二级条件以防误匹配
  • 对所有模糊匹配结果标记“需人工核对”