机器学习算法建模过程视频,机器学习 预测算法

首页 > 经验 > 作者:YD1662022-10-30 05:21:56

上课的学员至少要有一定的第一性原理计算 或 量子化学计算基础,或者曾经上过初级班的课程。本次培训通知是机器学习专题(6天)。由于课上所讲内容较多,为节省时间,本课程不会讲授基础的python语言使用,学员参加此课程前需要根据讲师发的讲义自行学习python基础。本课程中会带领学员实战演练18个机器学习案例,使学员能够熟练掌握多种机器学习算法模型的构建以及在材料性能预测中的实现方法,助力于自己的课题研究。

:此课程不包含DeepMD机器学习力场部分,DeepMD-kit程序的使用在 固体与表面中级班(固体方向3)- 锂电池专题 中已经开,可以随时购买,并且以后会单独开课。

课程内容

第一部分 机器学习导论

介绍机器学习的基本概念和背景,让学员对机器学习有大致了解。明确机器学习方法的适用性和优势,了解机器学习能做什么,怎么去做,同时也会讲解一些机器学习在材料与化学中的应用前沿。

主要内容:(1)机器学习概述;(2)机器学习的类型;(3)常见的机器学习方法;(4)机器学习的开发流程;(5)机器学习在材料领域的应用;(6)机器学习前沿介绍。

机器学习算法建模过程视频,机器学习 预测算法(1)

第二部分 深度学习——神经网络的从零实现

深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。这部分我们会带领学员从零开始手动实现一个深层神经网络,通过讲解原理和实操演练,让学员能更深刻地理解算法的原理及实现,有利于更快地掌握之后的机器学习方法。最后会通过实战教学让学员学会运用神经网络预测材料的各种性质。

主要内容:(1)神经网络原理;(2)神经网络分类;(3)神经网络回归;(4)梯度下降法;(5)计算图与导数;(6)非线性激活函数;(7)神经网络中的前向与反向传播;(8)深度学习框架——Pytorch的使用。

实战教学:(1)利用神经网络预测CO2电化学还原催化剂的性能;(2)基于深度学习的N2还原催化剂的高通量筛选;(3)基于神经网络的钙钛矿材料稳定性的预测。

机器学习算法建模过程视频,机器学习 预测算法(2)

第三部分 机器学习模型及应用

深度学习模型在学术界和工业界都处于绝对的垄断地位,但深度学习并非在所有场景下都好用。而一些近期开发出的机器学习模型(如GBDT,XGboost,LightGBM等)也有着亮眼的表现。尤其在材料领域中,获取数据集样本的成本非常昂贵导致样本过小,有些任务需要进一步解释模型来探究背后的理化含义,而小样本学习与可解释性恰恰是深度学习不擅长的。因此本部分我们会对材料领域中常使用的几种机器学习模型进行学习,通过动手实践让学员快速掌握这几种机器学习方法及应用。

主要内容:(1)线性模型;(2)逻辑回归;(3)朴素贝叶斯概率;(4)决策树;(5)随机森林;(6)支持向量机;(7)集成学习(GBDT,XGboost,LightGBM);(8)机器学习项目流程;(9)模型性能的评估方法;(10)Scikit-learn机器学习库的使用。

实战教学:(1)集成学习实现有机太阳能电池材料的高效筛选与性能预测;(2)基于机器学习搜寻潜在的钙钛矿材料及带隙预测;(3)机器学习预测钙钛矿结构的热力学稳定性;(4)机器学习加速发现新型钙钛矿材料;(5)多种机器学习模型对碳量子点白光二极管色温的预测;(6)多种机器学习模型对光催化过氧化氢非金属催化剂的效率预测;(7)机器学习预测双金属活性位点氧还原的催化活性。

机器学习算法建模过程视频,机器学习 预测算法(3)

第四部分 材料数据库与高通量计算

数据驱动的高通量筛选是当下流行的材料研究新范式,相较于传统试错方法,材料基因以大数据为基础,利用人工智能的方法从中提取出关键的构效关系,摆脱了对理化直觉的强依赖以及高昂的筛选成本,可以实现高效的高通量材料筛选。这一讲我们会从数据库出发,对材料领域常见的数据库的使用进行介绍,之后学习如何利用ASE,Pymatgen等软件包批量构建及处理数据集,以及对材料进行特征选择。讲解常见的材料结构表示方法及编码,以及机器学习模型的评估与利用,使学员能掌握材料基因组设计和基于数据驱动的功能材料开发。

主要内容:(1)材料基因组概述;(2)材料智能筛选的基本方法;(3)常见材料数据库简介;(4)QQMD、AFLOW数据库的数据获取;(5)MP(Materials Project)数据库与Pymatgen的使用;(6)CMR(Computational Materials Repository)数据库与ASE的使用;(7)材料数据挖掘软件——Matminer的使用;(8)自定义材料数据集的构建;(9)特征工程与特征选择;(10)模型评估和优化;(11)数据驱动方法SISSO及其应用。

实战教学:(1)利用CMR数据库、MP数据库构建自定义材料的数据集;(2)利用Pymatgen中的原子性质库和分析模块对材料进行特征分析;(3)利用ASE Dscribe向量化生成材料指纹和势函数(描述符);(4)利用Matminer进行材料数据挖掘和机器学习模型训练;(5)合金表面数据库的构建,利用机器学习搜索合金表面的活性位点并预测其催化活性;(6)SISSO在材料和化学领域的应用实战。

机器学习算法建模过程视频,机器学习 预测算法(4)

第五部分 图神经网络在材料中的应用

化学结构与图论有着天然的适配性,相较于其他模型,基于图论的图神经网络在材料化学领域更为擅长。因此图神经网络也成为了最近在科学领域最为火热的研究领域。结构决定性质,性质反映结构,在图神经网络中只需将材料的结构转化成图作为输入文件,直接基于结构预测性质,更能深入揭示材料的构效关系,同时避免了繁琐的特征工程。在这一部分我们会对图神经网络进行系统的讲解,学习两种经典的图神经网络架构(CGCNN与Schnet),学会使用图神经网络预测材料的性能。

主要内容:(1)图论与图神经网络概念介绍;(2)分子与晶体的图表示;(3)化学与材料领域中经典的图神经网络架构——CGCNN与Schnet;(4)图神经网络在材料中的应用。

实战教学:(1)利用图神经网络CGCNN预测无机材料的性能;(2)利用Schnet实现对分子理化性质的预测。

机器学习算法建模过程视频,机器学习 预测算法(5)

讲师介绍

刘博士,苏州大学博士,长期从事人工智能辅助新能源材料模拟与设计,对机器学习有四年的研究经验。熟悉XGBoots,LightGBM等多种机器学习算法和高通量计算框架,已在Angew. Chem. Int. Ed., WIREs Comput Mol Sci.等国际著名期刊发表人工智能与材料模拟论文12篇,获得国家软件著作权两项,在首届DeepModeling Hackathon中获AI赛道二等奖。

培训时间

2022年7月7-12日 每天晚7:00 - 10:00 上课,共6天

报名相关

报名流程:

● 首先请认真阅读课程内容介绍,如果需要咨询或者购买课程,请扫描下方二维码,添加工作人员微信(请注明「机器学习」)。节假日不能及时回复,请耐心等待工作日。

添加客服*18006413776(或电话) 咨询报名学习。

● 成功添加微信后,工作人员会告知具体缴费方式。缴费完成后,工作人员会把您添加到小鹅通在线课程中和微信交流群(每晚统一回复,请耐心等待)。

● 报名费:1800 元/人(可开发票),自费学员1500元/人费用包含6天约18小时的听课费和答疑、讲义、计算案例文件、视频回放。

● 优惠1:曾经报名过庚子计算其他课程的同学,凭之前的报名缴费记录找客服要100元优惠,仅可本人本次课程使用。

● 优惠2:同一单位3人及以上组团报名,且一起开发票公费学习者,每人100元优惠,仅可本人本次课程使用。

(以上优惠不能叠加,也就是最多优惠100元)

听课方式:小鹅通视频,完成后,学员可以在交流群内不限次观看和提问(视频内容不支持下载)。绑定微信和手机号。

培训须知

1. 培训结束后提供电子版盖有公章的会议通知函。若当前会议通知不方便报销,我们也可以按照报名者的要求进行调整,请通过微信联系我们。

2. 培训内容包含大量练习和演示,故强烈建议参加者自备电脑。

FAQ

1、课程通过什么平台观看,永久有效吗?课程通过小鹅通平台观看,缴费后,运营人员会拉你进入视频课程(绑定手机和微信),群内可以永久回看。另外,我们建有课程交流微信群,讲师会在群内与大家交流互动。

2、可以开票吗?可以开具发票。

声明

本视频仅限参加庚子计算培训班的学员个人学习使用。不得以任何方式擅自翻录、复制、传播、出售,或将其中内容挪作它用,否则将追究法律责任。如果有人发现盗版和侵权行为,请保留其聊天记录和收款转账记录等。经核实后,我们给予举报者免费报名听课机会和现金奖励。

关注庚子计算小程序,持续更新计算教程和课程:

机器学习算法建模过程视频,机器学习 预测算法(6)

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.