Secretary Problem -- 最佳停止时间

Posted on 2023-03-07 Edited on 2023-12-18

进行和X君吃饭时他举了苏格拉底稻田里捡麦穗的问题，和我聊到爱情就像捡麦穗，准备给我灌鸡汤。我就想到了此前写过的博文，近期刚好更新一下版本。
"37%法则"的意思是，100个应聘者，先面试前37个，且这37无论多优秀都不取，此后的面试只要遇到一个更优秀的，就立刻录取，停止面试，最后找到最佳候选人的的成功率也为37%。这也可以用作相亲，恋爱等领域…这刚好对应了苏格拉底的麦穗问题，是找到最优解的策略。

¶缘起

我是在读阮一峰的博客^[1]的时候看到的这一问题，但据说毕导^[2]的视频也涉及过这一问题，于是在重写前刷了一下大概视频。这两者均不够深入，主要涉及经典形式的秘书问题，毕导加了一些数值模拟，考虑了拒绝率等等，但是还是差了点意思。我主要扩展几个我认为会有启发的形式，包括最大化期望和最大化前三优，这相较于经典形式和真正的决策场景更贴合。

¶最大化找到最优候选人的概率(秘书问题的经典版本)

这个问题有一些假设：

不能吃回头草，错过了就不重新回去找
面试对象完全随机，且邀约不会被拒绝

这里放一个Raghav Ramesh^[3]的推导，我就不自己打了。这个版本的答案是面试前1/e，也就是约37%，此后一旦更好就接受。

¶最大化候选人的期望

我们其实不那么极端，并不是要一定最好。因为按照寻找最优的策略，第二和最后一名是等权重的，我们很可能为了37%的最优血本无归，找到最坏的结果。一个简单的想法是找到期望最大的策略。这个推导我还是沿用Raghav Ramesh的课件。最佳策略是Sqrt(n)-1，在面试总人数大约大于8.39时，行动应该早于37%。

¶最大化找到前三优的策略

我有赌的成分，所以我还会关注如何寻找前三优的决策。考虑前三优，应该分别在c1 = 33.67%，c2 = 58.68% 和 c3 = 77.46% 接受比样本第1、2、3优的候选人更好的面试者。具体推导可以看 Quine, M. P. and Law的文章^[4]。我从Simon Demers^[5]的综述抄了一段结论。

(https://www.ruanyifeng.com/blog/2023/01/weekly-issue-23 ↩︎
【单身狗速进！如何科学有效地脱单？-哔哩哔哩】 https://www.bilibili.com/video/BV1uJ411D7AW/?share_source=copy_web&vd_source=dda0c9ede99c98f35bd4496be7b4f8b9 ↩︎
https://stanford.edu/~rezab/amdm/notes/lecture8.pdf ↩︎
Quine, M. P. and Law, J. S. (1996). Exact Results for a Secretary Problem. Journal of Applied Probability, 33(3):630–639. DOI: 10.2307/3215345. ↩︎
https://arxiv.org/abs/1810.11557 ↩︎