炼数成金 大数据Python
订阅

Python

正则表达式太慢?这里有一个提速100倍的方案
正则表达式太慢?这里有一个提速100倍的方案
“当遇到一个文本处理问题时,如果你在第一时间想到了正则表达式,那么恭喜你,你的问题从一个变成了俩!“如果你曾参与过文本数据分析,正则表达式(Regex)对你来说一定不陌生。词库索引、关键词替换……正则表达 ...
全国计算机等级考试二级Python考试大纲预测和分析
全国计算机等级考试二级Python考试大纲预测和分析
虽然已经确定2018年9月份在全国计算机等级考试科目中加入“二级Python”,但现在还没有出台完整详细的考试大纲,官方网站也仅仅是简单说明了考试时长(120分钟)、大概形式(网络环境、无纸化)和环境要求(Python 3 ...
Python 进入山东小学教材,还列入全国计算机等级考试
Python 进入山东小学教材,还列入全国计算机等级考试
在人工智能时代,该学习什么编程语言,Python 是不二之选。2017 年 9 月 Stack Overflow 发布的统计数据表明是 Python 是增长量最快的编程语言。10 月 GitHub 年度开发者报告中,Python 超过 Java,排在编程语言 Top ...
从小白到大神,一文掌握 Python 密集知识点
从小白到大神,一文掌握 Python 密集知识点
第一个问题,什么是 Python ?根据 Python 之父 Guido van Rossum 的话,Python 是:一种高级程序语言,其核心设计哲学是代码可读性和语法,能够让程序员用很少的代码来表达自己的想法。对于我来说,学习 Python 的 ...
Jupyter 常见可视化框架的选择
Jupyter 常见可视化框架的选择
对于以Python作为技术栈的数据科学工作者,Jupyter是不得不提的数据报告工具。可能对于R社区而言,鼎鼎大名的ggplot2是常见的可视化框架,而大家对于Python,以及Jupyter为核心的交互式报告的可个视化方案就并没有那 ...
Python 这么热,运维要不要追赶 Python 的热潮?
Python 这么热,运维要不要追赶 Python 的热潮?
现阶段,掌握一门开发语言已经成为高级运维工程师的必备计能,不会开发,你就不能充分理解你们系统的业务流程,你就不能帮助调试、优化开发人开发的程序,开发人员有的时候很少关注性能的问题,这些问题就得运维人员 ...
程序员如何优雅的处理杂乱的传感器数据?
程序员如何优雅的处理杂乱的传感器数据?
天气数据是现实世界中一类很好的杂乱数据集案例。其中包含了不同的内容,不规则的数据,以及各种各样的时区。前面说的这些点对于数据科学家来讲都是很致命的痛点。我会通过下面的例子来向你介绍如何处理这种混合的、 ...
Python 开发者的 6 个必备库
Python 开发者的 6 个必备库
无论你是正在使用 Python 进行快速开发,还是在为 Python 桌面应用制作原生 UI ,或者是在优化现有的 Python 代码,以下这些 Python 项目都是应该使用的。Python 凭借其易用的特点,已经被工业界和学术界广泛采用。 ...
Google Brain开源新的Python 库:Tangent
Google Brain开源新的Python 库:Tangent
神经网络(简称 NN)已经在图像、视频、音频以及文本类机器学习模型领域取得了巨大成功。而让我们得以训练出能够在此类任务中带来良好表现的神经网络的基本抽象思路,则源自 30 年前即已诞生的概念,即反向模式自动 ...
python 爬虫抓取了百万知乎,并做了分析
python 爬虫抓取了百万知乎,并做了分析
最近用 python 爬虫抓取了知乎用户个人资料(公开信息),去重之后有300+万条记录,为了得到这些数据,还不小心跑崩了一台服务器…… 当然主要是配置太低。手头有了数据也不能闲着,于是就有了这篇分析报告,这篇报 ...
如何编写一个拼写纠错器?
如何编写一个拼写纠错器?
2007年的某个星期,我的两个朋友(Dean和Bill)分别向我传达了他们对Google的拼写自动纠错能力的赞叹。例如输入”speling”,Google会立即显示”spelling”的检索结果。我原以为这两位才智卓越的工程师、数学家,会对 ...
Python的开源人脸识别库:离线识别率高达99.38%
Python的开源人脸识别库:离线识别率高达99.38%
以往的人脸识别主要是包括人脸图像采集、人脸识别预处理、身份确认、身份查找等技术和系统。现在人脸识别已经慢慢延伸到了ADAS中的驾驶员检测、行人跟踪、甚至到了动态物体的跟踪。由此可以看出,人脸识别系统已经由 ...
Python绘制时间序列数据的时序图、自相关图和偏自相关图
Python绘制时间序列数据的时序图、自相关图和偏自相关图
时序图、自相关图和偏相关图是判断时间序列数据是否平稳的重要依据。本文涉及的扩展库numpy、pandas、statsmodels一般可以使用pip进行在线安装,如果安装失败,可以到http://www.lfd.uci.edu/~gohlke/pythonlibs/下 ...
用Python对鹿晗、关晓彤微博进行情感分析
用Python对鹿晗、关晓彤微博进行情感分析
相信最近科技圈都在调侃一件事:10月8日中午的一条微博,引发了一场新浪微博用户们(尤其是女性用户)之间的轩然大波,导致新浪微博瘫痪。这条微博的始作俑者,就是全球超人气偶像明星鹿晗。程序员们纷纷开启了科♂学 ...
Python批量修改Excel文件格式:加粗、颜色交替、渐变背景色填充
Python批量修改Excel文件格式:加粗、颜色交替、渐变背景色填充
功能描述:首先生成几个测试用的Excel文件,然后批量修改这些文件的格式,把表头加粗并设置为黑体,其他行字体为宋体,设置奇偶行颜色不同,并设置偶数行为从红到蓝的渐变背景色填充。from random import sampleimpo ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

热门文章

    社区热帖

       

      GMT+8, 2021-10-25 03:35 , Processed in 0.072013 second(s), 16 queries .