携手健康网携手健康网

分子晶体结构将其包装

无论有机化学家是在开发新的分子能量学还是在制药工业中创建新的重磅炸弹药物,每个人都在寻找如何优化分子的化学结构以获得所需的目标特性的方法。

该优化的一部分包括分子晶体的堆积基序,一种在分子中如何相对于晶体结构相互定向的感知模式。由于密集的手动标记过程和不足的标记方案,当前的包装图案数据集仍然很小。

为了帮助解决此问题,劳伦斯·利弗莫尔国家实验室(LLNL)的材料和计算机科学家团队开发了可免费获得的包装Autopack,该包装使包装图案标记过程正式化,并且可以自动处理和标记数千种分子晶体的包装图案。结构。该研究发表在《化学信息与模型杂志》上。

过去30年的小规模晶体工程研究表明,尽管仅靠化学结构来预测实验晶体结构仍然遥不可及,但分子的化学结构与其所采用的晶体结构的特定属性之间可能存在联系。包装图案。

分子晶体的堆积图案是高能和有机电子应用的重要概念,这是由于观察到的分子晶体的堆积图案与感兴趣的性能之间的相关性,包括对分子炸药的不敏感性和对分子半导体的电荷传输。

迄今为止,还没有创建过正式的开放源代码来指定包装图案。取而代之的是,仅通过人类对晶体结构的评估和判断,即可将堆积图案归因于分子晶体,从而导致数据集少而嘈杂。

论文的主要作者LLNL数据科学家唐纳德·洛夫兰德(Donald Loveland)表示:“在机器学习时代,创建大型的,标记的分子晶体堆积图案数据集的能力现在变得尤为重要。” “这些努力可能会产生可以仅根据分子的化学结构预测堆积基序的模型,这将有助于有机化学家根据所需的堆积基序和性质对新分子的合成进行优先排序。”

新的LLNL工作使用了一种有效的优化算法,该算法可以避免以前提出的包装图案标签方法中发现的许多问题,从而在LLNL固化的数据集上进行测试时,可以得到最新的结果。

通过自动包装,研究人员已经能够为实验室感兴趣的一组充满活力和类似活力的分子生成近10,000个填充图案的数据集,这是以前不可能完成的任务。作为背景,由于手工标记的繁琐和耗时的性质,以前的文献一直限制在100个分子的数量级上。对该新数据集的早期分析提示了分子间相互作用,3-D分子构象和目前在该领域中尚未探索的采用的堆积图案之间的复杂趋势,从而为下一步晶体工程流水线提供了指导。

该代码可通过实验室的创新与合作关系办公室免费获得。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。