炼数成金 大数据Python
订阅

Python

为什么有那么多人选择Python,真的有那么好吗?
为什么有那么多人选择Python,真的有那么好吗?
作为一个计算机初级爱好者,据超模君这些年敲过的代码所反馈(是的,我的代码是有灵魂的),他们还是比较喜欢Python,因为Python干净利索,简单直接。Python编写代码的速度非常的快,而且非常注重代码的可读性,非常 ...
如何把时间序列问题转化为监督学习问题?通俗易懂的 Python 教程
如何把时间序列问题转化为监督学习问题?通俗易懂的 Python 教程
机器学习方法,比如深度学习,是可以用来解决时间序列预测问题的。但在使用机器学习之前,时间序列问题需要被转化为监督学习问题。从仅仅是一个序列,变成成对的输入、输出序列。这篇教程里,你将学到如何把单变量、 ...
初学文本分析:用Python和scikit-learn实现垃圾邮件过滤器
初学文本分析:用Python和scikit-learn实现垃圾邮件过滤器
文本挖掘(text mining,从文本中导出信息)是一个广泛的领域,因为不断产生的巨量文本数据而已经得到了普及。情绪分析、文档分类、主题分类、文本概括、机器翻译等许多任务的自动化都已经通过机器学习得到了实现。 ...
pygit:500行Python代码实现的Git客户端
pygit:500行Python代码实现的Git客户端
Git因其具有非常简单的对象模型而着称。在学习git时,我发现本地对象数据库只是.git目录中的一堆普通文件。除了索引(.git/index)和打包文件(可有可无)外,这些文件的存放规则和格式相当的简单。受Mary Rose Cook ...
用Python开源机器人和5美元,我在Instagram上搞了2500个真粉儿
用Python开源机器人和5美元,我在Instagram上搞了2500个真粉儿
前不久,我开始同时学习python和Selenium WebDriver(自动化测试工具软件),想看看我能否在Instagram上获得一些粉丝,我惊讶的发现我的第一个试运行的脚本程序竟然很有效!只是通过对一些图片增加标签,我就得到了一 ...
15个排名最佳的数据科学Python包
15个排名最佳的数据科学Python包
Python 和 R 语言是数据科学中最常见、最受欢迎的工具之一。而且因为 Python 的简单易用,相对其他语言,我们可以使用更少的代码就能表达大多数概念。这也就正是为什么我们希望通过给出最受欢迎的 Python 包排名而帮 ...
Python 多进程并行编程实践: mpi4py 的使用
Python 多进程并行编程实践: mpi4py 的使用
在高性能计算的项目中我们通常都会使用效率更高的编译型的语言例如C、C++、Fortran等,但是由于Python的灵活性和易用性使得它在发展和验证算法方面备受人们的青睐于是在高性能计算领域也经常能看到Python的身影了。 ...
原创翻译 | 当使用python进行大数据分析时,开发人员最常犯的错误
原创翻译 | 当使用python进行大数据分析时,开发人员最常犯的错误
##1 介绍 Python 语言由于其缩短了开发时间而被普遍赞扬,但是要用它进行有效数据分析并非没有缺陷。这个特征使得开发在开始的时候很简单(动态,宽容型系统),却可能毁了大型系统 、造成库混乱,缓慢的运行时间 ...
用 sklearn 对 140W 个点进行 kmeans 基于密度聚类划分
用 sklearn 对 140W 个点进行 kmeans 基于密度聚类划分
任务需求:现有140w个某地区的ip和经纬度的对应表,根据每个ip的/24块进行初步划分,再在每个区域越100-200个点进行细致聚类划分由于k值未知,采用密度的Mean Shift聚类方式。0#目录:原理部分框架资源实践操作效果 ...
Python 实现一个火车票查询的工具
Python 实现一个火车票查询的工具
Python 实现一个火车票查询的工具主要功能:输入出发车站,到达车站,时间,然后返回所有的车次信息,和余票信息。支持输入附加选项查询不同的火车的类型,比如高铁,动车。使用正则表达式,将js 文件里面的车站名字 ...
Python 多进程并行编程实践 - multiprocessing 模块
Python 多进程并行编程实践 - multiprocessing 模块
并行计算是使用并行计算机来减少单个计算问题所需要的时间,我们可以通过利用编程语言显式的说明计算中的不同部分如何再不同的处理器上同时执行来设计我们的并行程序,最终达到大幅度提升程序效率的目的。众所周知, ...
Python 中 NaN 和 None 的详细比较
Python 中 NaN 和 None 的详细比较
python原生的None和pandas, numpy中的numpy.NaN尽管在功能上都是用来标示空缺数据。但它们的行为在很多场景下确有一些相当大的差异。由于不熟悉这些差异,曾经给我的工作带来过不少麻烦。 特此整理了一份详细的实验 ...
Python vs Ruby: 谁是最好的 web 开发语言?
Python vs Ruby: 谁是最好的 web 开发语言?
Python 和 Ruby 都是目前用来开发 websites、web-based apps 和 web services 的流行编程语言之一。这两种语言在许多方面有相似之处。它们都是高级的面向对象的编程语言,都是交互式脚本语言、都提供标准库且支持持 ...
改造Python中文拼音扩展库pypinyin补充自定义声母全过程
改造Python中文拼音扩展库pypinyin补充自定义声母全过程
问题要从昨天说起,应根球老师发给我一个代码问可能是啥原因,如下:该函数的第二个参数3含义为只保留声母,为啥“应”的声母丢了呢?因为当时正是课间休息,一会儿还要上课,没时间多想,感觉或许是lazy_pinyin()函 ...
Python 互联网数据处理模块介绍
Python 互联网数据处理模块介绍
互联网无处不在。即使是很小的,一次性使用的脚本都经常与远程服务进行交互以发送或接收数据。 Python有丰富的Web协议库,非常适合用于编程的基于Web服务的服务器和客户端编程。urllib和更新的urllib2可以访问web资 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-10-23 18:24 , Processed in 0.101948 second(s), 16 queries .