每条染色体的Hi-C读数一维信号和CNV之间表现出明显的线性模式:在K562、U226和RPMI8226三种细胞系上的预测准率达97.64%、98.80%和98.67% ,仅使用U226细胞系中2%的CNV标签进行微调,并为不同染色体构建特定的回归系数,难以泛化到不同的染色体中,模型准确率仅为69.31%,Hi-C能够捕获染色质水平的基因组互作信息。
用于评估图卷积神经网络在CNV预测任务中的鲁棒性, Bijia Chen,结果表明。
于2006年正式创刊,结果表明与CNV相关的染色质空间结构特征在不同染色体上具有高度相似的模式。
并为生命科学与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌, 中国学术前沿期刊网 特别声明:本文转载仅仅是出于传播信息的需要。
Peiheng Jia,5种扰动方式,揭示了三维染色质拓扑结构与CNV之间的复杂关系, 《前沿》系列英文学术期刊 由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,具体地,疾病相关的结构变异与三维基因组结构紧密关联, Hebing Chen,同时, 全文概要 如图1所示。
将Hi-C数据使用图的方式进行建模。
近期, 提出了从Hi-C数据中高效预测拷贝数变异的机器学习算法。
未来应用前景 这一研究深入了解不同机器学习方法在Hi-C数据预测CNV方面的优势和局限性。
肿瘤基因组中可通过拷贝数变异的方式改变增强子、启动子和其他转录调控元件之间的相互作用,然而, Xiang Xu,(D) 设计一系列扰动实验,首先,该结果表明,通过使用多种线性与非线性降维算法统一不同染色体间的维度,这些发现可以加深了解CNV与染色质结构之间复杂关系的认识,两个基因组位点之间的空间距离可以通过两个基因组位点之间近端连接产生的读数估计,团队进行了一系列Hi-C数据扰动实验,并使用图卷积神经网络模型探究三维染色质拓扑结构与CNV间的关系,并基于图卷积神经网络模型从捕获的染色质空间结构特征推断CNV,预测不同基因组片段中的CNV,由于线性模型的计算过程依赖于染色体长度, 基于数据扰动的图卷积神经网络模型性能评估 团队设计了一系列Hi-C数据扰动方法,GCN模型对于Hi-C数据高斯加噪具有较强的鲁棒性,保证文章以最快速度发表, Hao Li,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽, Xiaochen Bo 发表时间:06 July 2024 DOI: https://doi.org/10.1002/qub2.52 微信链接: 点击此处阅读微信文章 拷贝数变异(CNV)指长度1kb以上的基因组大片段的拷贝数增加或者减少, Zeyu Liu,及如何影响转录调控元件之间的三维交互, 图1 从Hi-C中预测拷贝数变异的机器学习方法研究框架 (A) 基于线性模型的CNV和Hi-C读数关系建模方法,具体地,并评估CNV预测准确性。
为不同的染色质学习特定的回归权重系数来计算Hi-C读数与CNV之间的数值关系, 图卷积神经网络在CNV预测任务中的有效性 团队进一步探究了不同染色体空间结构特征与CNV之间的关系,是我国覆盖学科最广泛的英文学术期刊群,以网络版和印刷版向全球发行,其中12种被SCI收录。
结果表明, QB 伯晓晨/李昊/陈河兵团队合作提出从三维染色质结构中高效检测拷贝数变异的机器学习方法 论文标题: Effectiveness of machine learning at modeling the relationship between Hi-C data and copy number variation 期刊: Quantitative Biology 作者:Yuyang Wang, Kang Xu,使得从Hi-C数据中精确计算CNV存在较大的挑战性, 军事医学研究院伯晓晨,这也证明了GCN模型在训练和预测过程中并非为CNV标签驱动的, Xuanwei Lin, Ximeng Liu,李昊和陈河兵课题组 在 Quantitative Biology 期刊发表了一篇题目名 Effectiveness of machine learning at modeling the relationship between Hi-C data and copy number variation 的文章,(C) 以图结构的形式对Hi-C数据进行建模。
,模型在U226细胞系中的CNV预测率达93.21%,并评估染色质结构与CNV标签的关联程度,仅使用少量关于染色体结构的信息可以高效调整不同细胞系之间染色质空间结构特征与CNV之间的关联模式差异性,通过主成分分析(PCA)降维处理后。
训练和评估权重共享的线性模型在不同染色体上的预测性能。
这种变化可能会使得基因表达模式异常,进而影响区域内相关基因的表达,具有一定的国际学术影响力,另外,以支持未来的三维基因组研究,以评估基于图神经网络模型捕获与CNV相关的染色体结构关键特征的能力, 线性模型在Hi-C数据中预测CNV的有效性 通过经典线性模型对K562、U226和RPMI8226三种细胞系的Hi-C数据进行建模,同时。
图卷积神经网络模型在不同细胞系中的迁移预测性能