极客时间:《数据分析40讲》

阅读感想

极客时间这门《数据分析40讲》,属于比较基础、入门级别的课程,内容的难度类似《写给程序员的数据挖掘指南》,比较适合初学者,我花了一早上过了一遍(大概四十多讲的样子)。

但整体来看,作者还是蛮用心的,譬如课程的模块划分、文章的配图、循序渐进的内容设计等。整体来说,课程的优缺点如下:

  • 优点:课程讲解细致,深入浅出,便于入门;
  • 缺点:算法篇介绍太少太少,原理基本忽略,整体难度偏低,没怎么深入。

对数据分析不太熟悉的小伙伴可以看看,有一定经验的小伙伴可以忽略啦。

阅读更多

《Python神经网络编程》读书笔记

《Python神经网络编程》这本书属于入门读物,小白到连微积分的基础你都不需要有就可以对神经网络有个大概的了解,推荐!我花了几个小时看完了这本书电子版的第一部分(共三部分),然后取消了在当当上这本书的订单 ︿( ̄︶ ̄)︿ 。

第二、三部分主要通过 Python 实现了一个简单的神经网络,用来来识别数字,训练集和测试集为标准的 MNIST 数据库,实测经过3分钟的训练后(样本数为60000个),识别准确率达到了97%。

神经网络如何工作

现代神经网络是一种非线性统计性数据建模工具,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,由大量的人工神经元联结进行计算。典型的神经网络具有以下三个部分:

  1. 结构(Architecture):结构指定了网络中的变量和它们的拓扑关系。
  2. 激励函数(Activity Rule):大部分神经网络模型具有一个短时间尺度的动力学规则,来定义神经元如何根据其他神经元的活动来改变自己的激励值。一般激励函数依赖于网络中的权重(即该网络的参数)。
  3. 学习规则(Learning Rule):学习规则指定了网络中的权重如何随着时间推进而调整。这一般被看做是一种长时间尺度的动力学规则
阅读更多

《大数据智能》读书笔记

诚如本书简介所述,《大数据智能:互联网时代的机器学习和自然语言处理技术》可视为一本科普书籍。

本书是一本介绍大数据智能分析的科普书籍,旨在让更多的人了解和学习互联网时代的机器学习和自然语言处理技术,以期让大数据技术更好地为我们的生产和生活服务。

全书并没有深入到具体的技术细节(但概率论的基础知识还是需要的),而是提纲挈领地讲了大数据和人工智能的相关领域知识,同时提供了若干论文以便读者进行拓展阅读(这一点非常赞)。整本书写的还是蛮有诚意的,譬如说最后的后记部分。但是需要注意的是,由于该书成书于2015年,因此近两三年机器学习、NLP等的发展成果在书中看不到。

阅读更多

:D 一言句子获取中...