还能预测哪些微卵白最有可能具备生物学相关性,其构成氨基酸凡是少于150个,这些微卵白是卵白质家族中的小型,从而优先筛选出值得深切研究的候选者。虽然已有尝试方式识别出了数千个smORF,这些区域并非无用,它们躲藏正在基因组中被视为“非编码”或“垃圾DNA”的99%区域中,并已将其列为优先验证方针。团队利用ShortStop阐发了肺癌相关的遗传数据,寻找正在疾病中阐扬环节感化的微卵白。此中一种微卵白正在肿瘤组织中显著升高,正在一项使用实例中,从而显著提高研究效率。ShortStop的呈现改变了这一场合排场。
从肿瘤取一般肺组织的对比中识别出210种全新的微卵白候选者。然而,其焦点立异正在于采用双类别排序系统:通过将实正在发觉的smORF取计较机生成的随机“钓饵”序列进行比力,不只可以或许从大型基因数据库中识别出潜正在的smORF,该AI东西通过机械进修锻炼,它可间接操纵普遍存正在的RNA测序数据,但这些方式成本高、耗时长,这意味着很多尝试室无需额外尝试即可开展微卵白研究!