浏览平台 | Notion

执行基准测试

在与其他模型作战之前，你需要一个门柱来衡量你的模型的实力，所以我们启用了对我们基于规则的代理进行测试。我们称它们为基准。

每个基准包括与一个基于规则的代理对战10次 - 每侧开始各5次。

以下是基准测试的评分方法：

const getBenchmarkScore = (yourHealth, opponentHealth, timeRemaining, startingTime) => {
  const relativeHealth = yourHealth - opponentHealth

  var resultMultiple
  if (relativeHealth > 0) resultMultiple = 1
  else if (relativeHealth < 0) resultMultiple = -1
  else resultMultiple = 0

  const timeRemainingScore = timeScoreMultiple * resultMultiple * timeRemaining / startingTime
  const healthRemainingScore = healthScoreMultiple * relativeHealth
  return timeRemainingScore + healthRemainingScore
}

<aside> 🚨 我们在python包中为你提供了基准代理人来进行对战训练。然而，请注意不要过度适应基准，因为当你试图与排行榜上的其他模型对决时，这可能是不利的！

</aside>