携手健康网携手健康网

研究人员使用神经网络研究DNA

HSE科学家提出了一种提高查找Z-DNA或向左而不是向右扭曲的DNA区域的准确性的方法。为此,他们使用了神经网络和由世界各地不同实验室进行的30,000多个实验的数据集。该研究的细节发表在《科学报告》上。

自从发现DNA结构以来已经过去了67年,科学家发现了该分子的许多结构变异。有时DNA结构根本不像通常的双螺旋结构,即B-DNA:它们与B-DNA的不同之处在于链的数量(从2条到4条),链的密度和厚度,含氮的方式基座连接在一起,并且螺旋线的扭曲方向。

Z-DNA是一种结构,由双螺旋组成,双螺旋的扭曲方式不同-左旋而不是右旋。众所周知,Z-DNA区域存在于各种生物体的细胞中(从细菌到人类),在某些条件下(例如,超螺旋DNA或高盐浓度)出现,并可与其他DNA结构结合。一个分子。例如,如果由于某种原因使B-DNA分子超螺旋至使转录复杂化的程度(基于DNA的RNA合成),则其B-DNA分子的某些部分可以朝相反的方向扭曲,从而减轻了不必要的“压力”。科学家还建议Z-DNA可以调节转录并增加突变的可能性,一些研究表明Z-DNA的形成可能与某些疾病(例如癌症,糖尿病,和老年痴呆症。近年来,越来越多的研究表明Z-DNA在先天免疫反应中的作用,即先天免疫反应对细胞自身内的病毒和其他病原体的反应。

要了解有关Z-DNA区域的形成条件和生物学作用的更多信息,必须找到在基因组中找到其位置的方法。基于连续核苷酸的结构结合的实验数据,第一个带有Z-DNA位点标记的遗传图谱是在1997年编制的。近年来,出现了使用计算机算法预测除B-DNA以外的区域位置的方法。机器学习的进步使得使用另一种强大的工具来完成这项任务成为可能—神经网络。与大多数方法不同,神经网络可以考虑很多因素,不需要科学家预先选择最有影响力的因素。但是,即使对于神经网络,搜索Z-DNA仍然是一项艰巨的任务,因为还不够实验数据:Z-DNA出现和消失,实验只记录这些区域的一小部分。研究人员决定测试神经网络的准确性是否会随着来自组学数据的信息的增加,或者有关如何调节细胞中基因活性和蛋白质合成的信息而提高。

科学家首先比较了三种类型的神经网络(卷积,递归和前两种的组合)如何处理任务。卷积神经网络最常用于图像处理,而递归神经网络最常用于分析文本。所有三种类型的神经网络都已经针对与基因组研究有关的问题进行了测试。总体而言,该研究的作者在由组学数据放大的DNA数据集上训练并评估了151个模型。作者命名为DeepZ的一种递归神经网络产生了最佳结果,他们用它来预测人类基因组中的新Z-DNA区域。它的准确性大大超过了现有算法Z-Hunt的准确性。

在DeepZ的帮助下,科学家们绘制了人类基因组的整个序列,确定了每个核苷酸在Z-DNA区域内终止的可能性。概率超过某个阈值的几个核苷酸序列被标记为潜在的靶位点。

“这项研究的结果很重要,因为在神经网络的帮助下,我们不仅能够重复实验,而且还能预测基因组中Z-DNA形成的潜在位点,”该项目负责人Maria Poptsova说道。 HSE大学计算机科学系生物信息学实验室的负责人。“大量的Z-DNA信号表明,它们被积极地用于打开和关闭基因。这是一个比基因组基序更快的信号。例如,澳大利亚科学家小组的研究表明,Z-DNA可以作为抑制恐惧的训练信号。显然,在需要对事件快速反应的情况下,Z-DNA逐渐进化。我们计划与实验小组一起发起联合项目,以测试预测结果。”

作者展示了一种使用omix数据和深度学习方法预测Z-DNA区域的新颖方法。由神经网络生成的基因组标记将帮助科学家进行检测Z-DNA的实验,而Z-DNA的全谱才刚刚开始出现。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。