Left wind Model 21 多臂老虎机问题 第二种启发式称为 〔自适应探测率启发式〕 它的程序是 第 Ⅰ 阶段 先让每种备选方案各完成10次试验 第 Ⅱ 阶段 进行总共20次试验 但是试验次数根据各备选方案在第一阶段的成功率按比例分配