摘要
随着法律AI的快速发展,相似案例检索作为其核心任务之一受到广泛关注。现有研究多基于语言模型,而本文则从排序学习(Learning to Rank)角度改进当前模型的排序性能。具体而言,采用成对排序方法RankSVM作为分类器替代全连接层,结合常用语言模型在LeCaRDv1和LeCaRDv2数据集上进行实验。结果表明:RankSVM通过优化精确排序,能普遍提升两个数据集的检索性能,同时缓解因类别不平衡导致的过拟合问题。代码已开源。
方法
- RankSVM应用:将RankSVM作为分类器集成到现有框架中,替代传统的全连接层结构。
-
- 数据集验证:在LeCaRDv1和LeCaRDv2两个法律案例检索数据集上测试性能。
-
- 性能对比:与原始分类器相比,RankSVM显著提升排序准确性,尤其在处理类别不平衡数据时表现更稳健。
结论
- RankSVM可有效提升相似案例检索的排序质量。
-
- 该方法对缓解过拟合具有实际意义,尤其在数据分布不平衡的场景中。
-
- 开源代码为后续研究提供了可复现的基础。
- 更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)