简化分子线性输入
简化分子线性输入系统 (SMILES) 是一种线性符号形式的规范,用于使用短 ASCII 字符串描述化学物质的结构。 大多数分子编辑器可以导入 SMILES 字符串,以转换回分子的二维绘图或三维模型。
通常,可以为一个分子编写多个同样有效的 SMILES 字符串。 例如,CCO、OCC 和 C(O)C 都指定了乙醇的结构。 已经开发了算法来为给定的分子生成相同的 SMILES 字符串; 在许多可能的字符串中,这些算法只选择其中一个。 而 SMILES 对于每个结构都是唯一的,尽管依赖于用于生成它的规范化算法,并且被称为规范 SMILES。 这些算法首先将 SMILES 转换为分子结构的内部表示; 然后算法会检查该结构并生成唯一的 SMILES 字符串。
就基于图的计算过程而言,SMILES 是通过打印在化学图的深度优先树遍历中遇到的符号节点而获得的字符串。 首先修剪化学图以去除氢原子,然后打破循环以将其变成生成树。 在循环被破坏的地方,包含数字后缀标签以指示连接的节点。 括号用于指示树上的分支点。
主成分分析
主成分分析或 PCA 是一种统计过程,它允许您通过更易于可视化和分析的较小“汇总索引”集合来汇总大型数据表中的信息内容。
主成分分析SMILES 列表
确定 SMILES 列表的化学多样性
Python演示
量子化学Python 主成分分析 简化分子线性输入 化学㟼据Python 主成分分析 简化分子线性输入 化学㟼据Python 主成分分析 简化分子线性输入 化学㟼据