AI算法在双边市场中的价格共谋:机制、风险与监管对策
摘要
本文探讨了人工智能(AI)算法在双边市场中促进算法价格共谋的问题。通过使用Q学习算法,AI代理在双边市场中实现了比伯川德竞争更高的共谋水平。研究发现,网络外部性的增加显著增强了共谋,表明AI算法利用这些外部性来最大化利润。此外,用户异质性和外部选项的效用通常会减少共谋,而更高的折扣率则会增加共谋。即使在低折扣率下,默许共谋仍然是可行的。为了缓解共谋行为并指导潜在的监管措施,本文提出在Q学习算法中加入惩罚项。
原理
本文通过实验研究了AI驱动的平台如何使用Q学习在重复的双边平台竞争游戏中促进共谋。在模型中,多个水平差异化的平台竞争服务于买家和卖家(统称为用户)。这些平台通过Q学习独立选择价格,使用上一期的价格作为状态变量,这意味着平台具有有限的记忆并采用单记忆策略。在每次重复中,用户可以选择加入其中一个平台或选择外部选项。买家加入平台后,会根据平台上的买家和卖家数量获得网络外部性收益。卖家加入市场后也会获得这两种外部性。实验显示,即使在没有网络外部性的情况下,AI驱动的平台也能实现比伯川德竞争更高的共谋水平。这可能是由于更大的行动空间允许更多的信息交换。此外,增加的网络外部性导致显著高的共谋水平,表明AI驱动的平台可以利用这些外部性来提高利润。
流程
在无限重复的游戏中,平台和用户按照基准平台竞争游戏的规则进行交互,并根据观察到的数据更新策略,以优化预期的总折扣未来奖励。每个平台使用策略σ(i) t来确定所收取的价格p(i) t。图1展示了无限重复游戏的不同阶段。例如,在时间0,平台1收取p(1) 0,k,平台2收取p(2) 0,k,用户(k ∈ {b,s})解决x(j) 0,k的问题,平台接收π(j) 0,k。在后续时间步t +τ,用户解决x() +τk的问题,平台1更新策略σ(1) +τ并收取p(1) t+τ,k = σ(1) t (s(1) ),平台2更新策略σ(2) +τ并收取p(2) t+τ,k = σ(2) (s(2) ),平台接收π(j) t+τ,k。
应用
本文的研究结果表明,在具有显著正内部外部性(如在线/云游戏)和正交叉外部性(如视频流媒体、社交媒体)的市场中,算法定价可以增加共谋。这些发现对于监管机构和市场参与者具有重要意义,特别是在理解和应对AI算法在双边市场中共谋行为的潜在风险方面。
