【去未来搞点黑科技很正常吧?】小说免费阅读,请收藏 一七小说【1qxs.com】
本站http已无效,访问请使用https【https://1qxs.com】
这种方法仅需要利用蛋白质物理化学的特征和序列信息,就能够实现蛋白质定向进化的模拟。
我选择的研究对象是蛋白质DHR8,通过计算机模拟,让它进化出有结合DNA或者RNA的能力。
在模拟进化之前,我先对序列多样性与结合核酸的情况,去构建了一个包含30个五肽重复蛋白的评估库。
五肽重复蛋白是经过证实的RNA结合蛋白,它的结合位点很清晰,已经被系统表征。
这样一来我评估库中的每一個PPR都会具备两个明确的结合位点,我们以每个结合位点为中心,将长度为13个氨基酸的短序列作为一个评估窗口,这样的话它一共会有60个评估窗口。
对于每一个评估窗口的短序列,我们利用现成数据库中的544个描述氨基酸的物理化学性质的指标来表示氨基酸,因此,每一个位点的氨基酸就会是一个544×1的矩阵,十三个这样的矩阵合并用以表示一个长度为13的肽段序列。
对于一个评估窗口的544×13矩阵,我对K-means++算法进行了优化,然后用优化后的算法进行聚类,将544个行向量聚类为50类,在可视化方面,每一类则代表一个波形,对于每一类,我们可以利用该类所包含矩阵子集的每一列算术平均值来产生该类的标志性波形。”
如遇到内容无法显示或者显示不全,乱码错字,请更换谷歌浏览器即可正常阅读。