请选择 进入手机版 | 继续访问电脑版
  • 关注官方微信 微信公众号 添加方式:
    1:搜索微信号(gogolinux
    2:扫描左侧二维码
  • 登录 注册
  • 一起学LINUX - GOGOLINUX

    查看: 896|回复: 0

    Python数据分析与挖掘学习路线图

    [复制链接]

    1

    主题

    1

    帖子

    24

    积分

    新手上路

    Rank: 1

    积分
    24
    发表于 2019-6-5 13:57:08 | 显示全部楼层 |阅读模式
    数据哥  微信号:sjfxjx  本文为大家分享python大数据学习的一个提纲,希望对想学Python或者正在学python的你有一些帮助。碍于版权问题,有些书本,请大家到网上去购买正版。当然想看电子版的童鞋,百度搜索“数据分析精选”,通过我们的官方网站(www.afenxi.com)加入我们的qq交流群,向我们索要。





    1、Python学习,语言的学习,真正掌握语言的方式,是交流与实践,所以,这三本书,是由浅入深的步骤。大家在学习过程中,可以到群里面去进行交流沟通。



    • Python初学教程:《简明Python教程》
    • 《Dive Into Python》
    • 《Learning Python 5th》


    另,python在线精品学习博客:


    • http://www.cnblogs.com/vamei/archive/2012/09/13/2682778.html
    • http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/


    2、数据分析课程学习。数据分析,现在已经成为大数据这一趋势中的重点。要想学好,并且能够在实际中灵活运用,那要求同学们有扎实的数据基础(包括高等代数,概率及统计分析),需要有一定的计算机算法基础,并且有极高的对数据分析这些知识的热情。



    • 《高等数学及数据分析基础课程》,请参考大学高等数学系列课本
    • 《Mastering Basic Algorithms in the Python Language》
    • 《利用Python进行数据分析》
    • 《NumPy学习指南》
    • 《NumPy攻略:Python科学计算与数据分析》


    3、NumPy和Scipy,Pandas,这是重要的python数据分析库。除了第2项中提到的课本,需要深入地学习,可以去官方学习相当文档和教程。


    网址:

    • http://www.numpy.org/
    • http://www.scipy.org/
    • http://pandas.pydata.org/


    numpy的处理能力包括:
    a powerful N-dimensional array object N维数组;
    advanced array slicing methods (to select array elements);N维数组的分片方法;
    convenient array reshaping methods;N维数组的变形方法;
    and it even contains 3 libraries with numerical routines:

    basic linear algebra functions;基本线性代数函数;
    basic Fourier transforms;基本傅立叶变换;
    sophisticated random number capabilities;精巧的随机数生成能力;

    scipy是科学和工程计算工具。包括处理多维数组,多维数组可以是向量、矩阵、图形(图形图像是像素的二维数组)、表格(一个表格是一个二维数组);目前能处理的对象有:
    statistics;统计学;
    numeric integration;数值积分;
    special functions;特殊函数;
    integration, ordinary differential equation (ODE) solvers;积分和解常微分方程;
    gradient optimization;梯度优化;
    genetic algorithms;遗传算法;
    parallel programming tools(an expression-to-C++ compiler for fast execution, and others);并行编程工具;

    在将来会增加下面的计算处理能力(现在已经部分地具备了这些能力):
    Circuit Analysis (wrapper around Spice?);电路分析;
    Micro-Electro Mechanical Systems simulators (MEMs);
    Medical image processing;医学图像处理;
    Neural networks;神经网络;
    3-D Visualization via VTK;3D可视化;
    Financial analysis;金融分析;
    Economic analysis;经济分析;
    Hidden Markov Models;隐藏马尔科夫模型;

    3、hadoop学习及python操作模块。
    hadoop资料,网上非常多,也可购买书本。
    hadoop的python操作模块较多,可以参考:


    • http://www.oschina.net/translate/a-guide-to-python-frameworks-for-hadoop?cmp&p=2


    4、数据可视化,是为了能直观地从图示中反应出数据的各项指标,情况;直观地展示对数据分析的研究成果。所以,有必要学习这些知识。
    matplotlib:


    • http://liam0205.me/2014/09/11/matplotlib-tutorial-zh-cn/




    来源:PPV课
    版权声明:本公众号的内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请联系我们。
    官方微信:数据分析精选(sjfxjx),关注后每天收货干货。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    分享到:
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    官方微博:

    官方头条号:

    官方微信

    手机访问:

    官方微信

    QQArchiver 手机版 小黑屋 一起学LINUX - GOGOLINUX 闽ICP备18025837号-1 Discuz! X3.4 Powered by © 2001-2013 Comsenz Inc. 

    本站资源均来自互联网或会员发布,如果侵犯了您的权益请与我们联系,我们将在24小时内删除!谢谢!

    快速回复 快速发帖 返回顶部 返回列表