首页 » 测试组已满这幅图展示了实验的整体情况

测试组已满这幅图展示了实验的整体情况

每种颜色(标有数字 1-5)代表一种不同的 PageRank 塑造方法。水平方向上的 8 个组代表独立的测试。哪里出了问题?据我所知,实验执行得非常顺利。结果发现,问题不一定出在实验本身,而是出在对结果的解读上。使用了错误的指标来评估结果(每个测试组的平均排名),并且依赖的样本太少了。

新的测试是什么?

我现在要测试 nofollow 方法是否有效,而不是 电话号码收集 测试哪种 PageRank 塑造方法效果最好。我们计算了一下(见下文的数学计算),发现可以用两种方法进行测试。第一种方法只需要 40 个样本,但需要非常高的成功率(nofollow 击败控制)才能证明有效。第二种测试更注重精准度,要求的成功率要低得多,但样本量要大得多。

我计划了这两项测试

希望在运行之前听听您的反馈。下图是 如何制定清晰的营销目标?针对控制(null)情况测试 nofollow 方法的计划图。新的测试隔离此图展示了新版 nofollow 测试中将使用的两个测试页面的极简化版本。实际页面版本更类似于文章开头的“Horsey Cow Tipper”示例。在这个新测试中,两个“普通链接”将指向两个独立的页面,试图对同一个唯一词组进行排名。变量链接“x”将链接到另一个页面。变量链接“y”将被 nofollow,并链接到一个完全独立的页面。对于每个测试组,我们将观察两个竞争页面中哪个排名更高。我们的假设是,

如下图所示,该测试将重复 20 次

新测试已满
图表展示了新 nofollow 测试的简化测试页面
20 个测试(40 个域名)真的够了吗?我们 西班牙比特币数据库 认为足够,但只针对一个非常具体的结果。为了使第二个测试达到 95% 的置信度,20 个测试中需要有 15 个证明 nofollow 是一种有效的 PageRank 提升方法。

如果这种情况没有发生,我们需要进行第三次测试,并且样本量要大得多。如果我们想要 95% 地确定 nofollow 的效果更好,并且显著性达到 95%,即使 nofollow 在特定试验中获胜的概率只有 8 次中的 5 次,我们也需要 168 个测试对。(参见下文的计算)

 

滚动至顶部