在蛋白质组学中,蛋白质的得分通常用于评估鉴定的置信度,即该蛋白质的存在是否可靠。不同的搜索算法和数据库会使用不同的评分系统,但以下是一些常见的标准:
PEP(Posterior Error Probability):这是一种常用的统计测量方法,用于估计蛋白质鉴定的错误概率。PEP值越低,表示鉴定越可靠。通常,PEP小于1%(即PEP < 0.01)被认为是高度可靠的。
q值(False Discovery Rate, FDR的估计值):q值用于估计在一定显著性水平下,鉴定错误的比率。在蛋白质组学中,q值通常用于控制错误鉴定的比率。一个常见的阈值是q值小于0.05。
Score Threshold:不同的搜索软件(如Mascot, SEQUEST, X!Tandem等)会为匹配的肽段和蛋白质分配一个分数。这个分数是基于匹配的强度和质量。通常,软件会根据数据库搜索的结果生成一个分数阈值,低于该阈值的鉴定被认为是可靠的。
Expectation Value (E-value):这是一种统计量,用于估计在随机情况下获得当前或更好匹配的概率。E值越小,表示匹配越不可能是偶然的,鉴定越可靠。E值小于0.01通常被认为是一个良好的阈值。
Confidence Score:某些软件会提供一个置信度分数,这个分数综合了多种因素,如谱图的质量、匹配的强度、搜索数据库的大小等。
在选择代表性的得分阈值时,研究者需要考虑实验设计、数据质量和所使用的搜索算法。此外,一些研究者可能会使用多个不同的评分标准来交叉验证,以提高鉴定的准确性。在发表研究结果时,研究者通常会报告使用的得分阈值以及该阈值下的假阳性率,以便其他研究者可以评估结果的可靠性。