本课程带你从零基础入门,理论到项目实战,层层深入学习,步步进阶。具体会从高等数学必知必会、Python高级应用、Python项目、机器学习算法、机器学习项目、深度学习、推荐算法及数据挖掘、综合项目实战以及职业素养等全方位讲解,更加注重于实际操作以及开发经验的讲解。

1、数学基础
1)数据分析:熟练掌握常数e、导数、梯度、Taylor、gini系数、信息熵与组合数、梯度下降、牛顿法等知识点;
2)概率论:微积分与逼近论、极限、微分、积分基本概念、利用逼近的思想理解微分,利用积分的方式理解概率、概率论基础、古典模型、常见概率分布、大数定理和中心极限定理、协方差(矩阵)和相关系数、最大似然估计和最大后验估计等知识点;
3)线性代数及矩阵:线性空间及线性变换、矩阵的基本概念、状态转移矩阵、特征向量、矩阵的相关乘法、矩阵的QR分解、对称矩阵、正交矩阵、正定矩阵、矩阵的SVD分解、矩阵的求导、矩阵映射/投影等知识点;
4)凸显示:凸优化基本概念、凸集、凸函数、凸优化问题标准形式、凸优化之Lagerange对偶处、凸优化之牛顿法、梯度下降法求解

2、Python高级应用
1)机器学习概述
2)数据清洗和特征选择:实现特征抽取、特征转换、特征选择、降维、NLP特征工程
3)回归算法:Linear Regression算法、Lasso Regression算法、Ridge Regression/Classifier算法、Elastic Net算法、Logistic算法、K-邻近算法(KNN)
4)决策树、随机森林和提升算法:决策树算法: ID3、C4.5、CART、决策树优化、Bagging和Boosting算法、随机森林、Adaboost算法、GBDT算法、Xgboost、LightGBM
5)SVM:线性可分支持向量机、核函数理解、SMO算法、SVM回归SVR和分类SVC
6)聚类算法:各种相似度度量介绍及相关关系、K-means算法、K-means算法优缺点及变种算法、密度聚类、层、聚类、谱聚类
7)EM算法:最大似然估计、EM算法原理讲解、多元高斯分布的EM实现、主题模型pLSA及EM算法
8)贝叶斯算法:朴素贝叶斯、条件概率表达形式、贝叶斯网络的表达形式
9)隐马尔科夫模型:概率计算问题、前向/后向算法、HMM的参数学习、高斯混合模型HMM
10)LDA主题模型:LDA主题模型概述、共轭先验分布、Dirichlet分布、Laplace平滑、Gibbs采样详解、LDA与word2Vec效果比较。

3、Pyspark
1)Hadoop基础
2)Spark基础
3)Spark Mlib机器学习

二、人工智能之智能推荐技术

课程十二、Python开发高手推荐系统
1)推荐算法概述
2)推荐算法理论介绍(协同过滤、基于内存的推荐、基于知识的推荐等)
3) 数据挖掘相关算法(关联规则、Aprior算法)
4) 项目案例:音乐推荐、隐因子模型推荐

阶段五、人工智能之深度学习

课程十三、深度学习
1)Tensorflow基本应用:掌握Tensorflow环境配置、Tensorflow基本概念、Tensorflow函数式编程、Tensorflw执行流程、Tensorflw之上的工具库:Keras,以及基于Tensorflow实现回归算法实现。
2)深度学习概述
3)感知器神经网络
4)BP神经网络
5)RBF径向基神经网络
6)CNN卷积神经网络
7)RNN循环神经网络
8)生成对抗网络(GAN,WGAN,EBGAN,DCGAN等)

阶段六、人工智能之图像处理技术

课程十四、图像处理篇
1)图像基础:图像读,写,保存,画图(线,圆,多边形,添加文字)
2)图像操作及算数运算:图像像素读取,算数运算,ROI区域提取
3)图像颜色空间运算:图像颜色空间相互转化
4)图像几何变换:平移,旋转,仿射变换,透视变换等
5)图像形态学:腐蚀,膨胀,开/闭运算等
6)图像轮廓:长宽,面积,周长,外接圆,方向,平均颜色,层次轮廓等
7)图像统计学:图像直方图
8)图像滤波:高斯滤波,均值滤波,双边滤波,拉普拉斯滤波等

阶段七、人工智能之自然语言处理技术

课程十五、自然语言处理
1)词(分词,词性标注)代码实战
2)词(深度学习之词向量,字向量)代码实战
3)词(深度学习之实体识别和关系抽取)代码实战
4)词(关键词提取,无用词过滤)代码实战
5)句(句法分析,语义分析)代码实战
6)句(自然语言理解,一阶逻辑)代码实战
7)句(深度学习之文本相似度)代码实战

阶段八、人工智能之企业项目实战

实战型项目一、基于FaceNet、云平台的人脸识别及人脸检索系统
使用深度学习框架从零开始完成人脸检测的核心技术图像类别识别的操作,从数据预处理开始一步步构建网络模型并展开分析与评估,方便大家快速动手进行项目实践!识别上千种人脸,返回层次化结构的每个人的标签。

实战型项目二、基于GBDT、Randomforest实现千万级P2P金融系统反欺诈系统
目前比较火的互联网金融领域,实质是小额信贷,小额信贷风险管理,本质上是事前对风险的主动把控,尽可能预测和防范可能出现的风险。本项目应用GBDT、Randomforest等机器学习算法做信贷反欺诈模型,通过数据挖掘技术,机器学习模型对用户进行模型化综合度量,确定一个合理的风险范围,使风险和盈利达到一个平衡的状态。

实战型项目三、基于Seq2Seq的智能客服系统
聊天机器人/智能客服是一个用来模拟人类对话或者聊天的一个系统,利用深度学习和机器学习等NLP相关算法构建出问题和答案之间的匹配模型,然后可以将其应用到客服等需要在线服务的行业领域中,聊天机器人可以降低公司客服成本,还能够提高客户的体验友好性。 在一个完整的聊天机器人实现过程中,主要包含了一些核心技术,包括但不限于:爬虫技术、机器学习算法、深度学习算法、NLP领域相关算法。通过实现一个聊天机器人可以帮助我们队AI整体知识的一个掌握。

实战型项目四、基于NLP实现诗歌机器人
机器人写诗歌/小说是一种基于NLP自然语言相关技术的一种应用,在实现过程中可以基于机器学习相关算法或者深度学习相关算法来进行小说/诗歌构建过程。人工智能的一个终极目标就是让机器人能够像人类一样理解文字,并运用文字进行创作,而这个目标大致上主要分为两个部分,也就是自然语言理解和自然语言生成,其中现阶段的主要自然语言生成的运用,自然语言生成主要有两种不同的方式,分别为基于规则和基于统计,基于规则是指首先了解词性及语法等规则,再依据这样的规则写出文章;而基于统计的本质是根据先前的字句和统计的结果,进而判断下一个字的生成,例如马尔科夫模型就是一种常用的基于统计的方法。

实战型项目五、基于Adaboost的百度音乐系统文件分类系统
音乐推荐系统就是利用音乐网站上的音乐信息,向用户提供音乐信息或者建议,帮助用户决定应该听什么歌曲。而个人化推荐则是基于音乐信息及用户的兴趣特征、听歌历史行为,向用户推荐用户可能会感兴趣的音乐或者歌手。推荐算法主要分为以下几种:基于内容的推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐等;推荐系统常用于各个互联网行业中,比如音乐、电商、旅游、金融等。

实战型项目六、基于贝叶斯、CNN的邮件情感分析过滤系统
邮件主要可以分为有效邮件和垃圾邮件两大类,有效邮件指的邮件接收者有意义的邮件,而垃圾邮件转指那些没有任何意义的邮件,其内容主要包含赚钱信息、成人广告、商业或者个人网站广告、电子杂志等,其中垃圾邮件又可以发为良性垃圾邮件和恶性垃圾邮件,良性垃圾邮件指的就是对收件人影响不大的信息邮件,而恶性垃圾邮件指具有破坏性的电子邮件,比如包含病毒、木马等恶意程序的邮件。垃圾邮件过滤主要使用使用机器学习、深度学习等相关算法,比如贝叶斯算法、CNN等,识别出所接收到的邮件中那些是垃圾邮件。

实战型项目七、基于生物学神经网络实现手工数字识别
人认知世界的开始就是从认识数字开始的,深度学习也一样,数字识别是深度学习的一个很好的切入口,是一个非常经典的原型问题,通过对手写数字识别功能的实现,可以帮助我们后续对神经网络的理解和应用。选取手写数字识别的主要原因是手写数字具有一定的挑战性,要求对编程能力及神经网络思维能力有一定的要求,但同时手写数字问题的复杂度不高,不需要大量的运算,而且手写数字也可以作为其它技术的一个基础,所以以手写数字识别为基础,贯穿始终,从而理解深度学习相关的应用知识。

实战型项目八、基于logistic回归实现癌症筛选检测
技术可以改变癌症患者的命运吗,对于患有乳腺癌患者来说,复发还是痊愈影响这患者的生命,那么怎么来预测患者的患病结果呢,机器学习算法可以帮助我们解决这一难题,本项目应用机器学习logistic回归模型,来预测乳腺癌患者复发还是正常,有效的预测出医学难题。

实战型项目九、基于回归分析实现葡萄酒质量检测系统
随着信息科技的快速发展,计算机中的经典算法在葡萄酒产业中得到了广泛的研究与应用。其中机器学习算法的特点是运用了人工智能技术,在大量的样本集训练和学习后可以自动地找出运算所需要的参数和模型。

实战型项目十、基于协同推荐实现淘宝网购物篮分析推荐系统
购物篮分析(Market Basket Analysis)即非常有名的啤酒尿布故事的一个反应,是通过对购物篮中的商品信息进行分析研究,得出顾客的购买行为,主要目的是找出什么样的物品会经常出现在一起,也就是那些商品之间是有很大的关联性的。通过购物篮分析挖掘出来的信息可以用于指导交叉销售、追加销售、商品促销、顾客忠诚度管理、库存管理和折扣计划等业务;购物篮分析的最常用应用场景是电商行业,但除此之外,该算法还被应用于信用卡商城、电信与金融服务业、保险业以及医疗行业等。

实战型项目十一、基于Python纯源码手工实现梯度下降回归算法
梯度下降法(英语:Gradient descent)是一个一阶最优化算法,通常也称为最速下降法。 要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。如果相反地向梯度正方向迭代进行搜索,则会接近函数的局部极大值点;这个过程则被称为梯度上升法。

实战型项目十二、基于TensorFlow实现回归算法
回归算法是业界比较常用的一种机器学习算法,通过应用于各种不同的业务场景,是一种成熟而稳定的算法种类;TensorFlow是一种常用于深度学习相关领域的算法工具;随着深度学习热度的高涨,TensorFlow的使用也会越来越多,从而使用TensorFlow来实现一个不存在的算法,会加深对TensorFlow的理解和使用;基于TensorFlow的回归算法的实现有助于后续的TensorFlow框架的理解和应用,并可以促进深度学习相关知识的掌握。

实战型项目十三、基于ssd和yolo实现行人检测
行人检测是利用图像处理技术和深度学习技术对图像或者视频序列中是否存在行人并给予精确定位。学习完行人检测技术后,对类似的工业缺陷检测,外观检测和医疗影像检测等目标检测范畴类的项目可以一通百通。该技术可与行人跟踪,行人重识别等技术结合,应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。由于行人兼具刚性和柔性物体的特性 ,外观易受穿着、尺度、遮挡、姿态和视角等影响,使得行人检测成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。

实战型项目十四、基于PySpark大数据机器学习框架
Spark由AMPLab实验室开发,其本质是基于内存的快速迭代框架,“迭代”是机器学习最大的特点,因此非常适合做机器学习。得益于在数据科学中强大的表现,Python是一种解释型、面向对象、动态数据类型的高级程序设计语言,结合强大的分布式内存计算框架Spark,两个领域的强者走到一起,自然能碰出更加强大的火花(Spark可以翻译为火花)。
Spark的Python API几乎覆盖了所有Scala API所能提供的功能,只有极少数的一些特性和个别的API方法,暂时还不支持。但通常不影响我们使用Spark Python进行编程。

实战型项目十五、基于Python源码实现LSTM神经网络
LSTM(Long Short-Term Memory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。
LSTM 已经在科技领域有了多种应用。基于 LSTM 的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等等任务。

阶段九、人工智能篇之企业项目实战(选修)

通过python数据科学库numpy,pandas,matplot结合机器学习scikit-learn完成一些列的机器学习案例。算法课程注重于原理推导与流程解释,结合实例通俗讲解复杂的机器学习算法,并以实战为主。

课程十六、基于Python数据分析与机器学习案例实战教程
通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。算法课程注重于原理推导与流程解释,结合实例通俗讲解复杂的机器学习算法,并以实战为主,所有课时都结合代码演示。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习。旨在帮助同学们快速上手如何使用python库来完整机器学习案例。选择经典案例基于真实数据集,从数据预处理开始到建立机器学习模型以及效果评估,完整的讲解如何使用python及其常用库进行数据的分析和模型的建立。对于每一个面对的挑战,分析解决问题思路以及如何构造合适的模型并且给出合适评估方法。在每一个案例中,同学们可以快速掌握如何使用pandas进行数据的预处理和分析,使用matplotlib进行可视化的展示以及基于scikit-learn库的机器学习模型的建立。

课程十七、AI法律咨询大数据分析与服务智能推荐项目(第一季)
本项目主要研究法律资讯网站,依据海量数据,研究用户兴趣偏好,分析用户的需求和行为,发现用户兴趣点,从而引导用户发现自己的信息需求,准确推荐给所需用户。
项目的业务系统底层主要采用JAVA架构,大数据分析主要采用Hadoop框架,其中包括Kettle实现ETL、SQOOP、Hive、Kibana、HBASE、Spark以及人工智能算法等框架技术。

课程十八、电商大数据情感分析与AI推荐实战项目(第一季)
本项目从开发的角度以大数据、PHP技术栈为基础,使用真实商用表构和脱敏数据,分三步构建商用系统、真实大数据环境、进行推断分析以及呈现结果。
项目课程的完整性、商业性,可以使学者尽可能完整地体会真实的商业需求和业务逻辑。
完整的项目过程,以大数据为导向,使PHP技术栈的同学得以窥见和学到一个完整商业大数据平台项目的搭建方法。及数据挖掘和AI技术在数据工作中的实战应用。

课程十九、AI大数据互联网电影智能推荐(第一季)
本课程主要讲解针对用户进行智能推荐电影,依据海量数据,研究用户兴趣偏好,分析用户的需求和行为,发现用户兴趣点,从而引导用户发现自己的信息需求,准确推荐给所需用户。
项目的业务系统底层主要采用Python架构,大数据分析主要采用Hadoop框架,其中包括Kettle实现ElasticSearch、ETL、SQOOP、Hive、Flume、Kibana、HBASE、Spark以及人工智能算法等框架技术

课程二十、AI大数据基站定位智能推荐商圈分析项目实战(第一季)
随着当今个人手机终端的普及、出行人群中手机拥有率和使用率已达到相当高的比例,根据手机信号在真实地理空间的覆盖情况,将手机用户时间序列的手机定位数据,映射至现实地理位置空间位置,即可完整、客观地还原出手机用户的现实活动轨迹,从而挖掘出人口空间分布与活动联系特征信息。
商圈是现代市场中企业市场活动的空间,同时也是商品和服务享用者的区域。商圈划分为目的之一是研究潜在顾客分布,以制定适宜的商业对策。
本项目以实战为基础结合大数据技术Hadoop、.Net技术全栈为基础,采用真实商业数据,分不同环节构建商用系统、真实大数据环境、进行推断分析及呈现数据。

 

01、数学基础(1)
02、数学基础(2)
03、python基础(1)
04、python高级应用(2)
05、机器学习(1)
06、机器学习(2)
07、机器学习(3)
08、机器学习(4)
09、机器学习(5)
10、数据挖掘与项目实战(1)
11、数据挖掘与项目实战(2)
12、深度学习(1)
13、深度学习(2)
14、深度学习(3)
15、自然语言处理
16、图像处理(1)
17、图像处理(2)
18、企业项目实战

 

 

声明:数据资源网(www.shujuzy.com)提供的所有数据、资料、素材等资源全部来源于互联网,本站不对所涉及的版权问题负法律责任,本站收费仅用于对数据资源网的信息整理费、服务器带宽及网站运营等费用支出做支持,从本站下载资源,说明你已同意本条款。