Python教程《和我一起玩Python》
-
和我一起玩Python:51. Python网页爬虫BeautifulSoup库

大家好,我是赛博红兔。上一期我们聊了网页爬虫,它能自动帮我们上网、浏览网页、把有用的信息搬回来。我们学习了如何用Python的Requests库进行网页请求、图片下载、数据提交还有身份验证。那么等我们得到了网页响应之后,就需要对网页进行解析来提取想要的内容。为了展示这个过程,我们先来看看我们最终要实现的目标。今天,我们来试试爬取我的博客。(展示)大家看到在我主页上有很多不同的文章,每一篇文章都有一个标题,一个配图,还有一段文字简介。我们编写了一个爬虫来抓取这些内容,然后把这些信息整理到一个CSV表格中,方便查看。 Continue reading
-
和我一起玩Python:50. Python网页爬虫Requests库

大家好,我是赛博红兔。之前我在介绍Python异步编写——多线程并发的时候,给大伙展示过这么一个例子。Python采用多线程并发从图片网站上下载大量的高清照片。这里我们就用到了Requests这个模块对Unsplash网站上的图片进行自动爬取。那么今后两期我们就专门来讲讲网页爬虫。我当然会从最基础最常用的讲起,最好你有一些HTTP、HTML和一些网页开发基础。没有也没关系,我会顺带地介绍一下,没有什么大问题。说到网页爬虫,它能自动帮我们上网、浏览网页、把有用的信息搬回来。比如你想收集豆瓣电影Top 100的电影名字,知乎热门话题的标题,最新论文的汇总,还有某些网站的高清壁纸和视频,爬虫都能轻松搞定。 Continue reading
-
和我一起玩Python:49. Python处理Word文档的宝典docxtpl模块

大家好,我是赛博红兔。上一集聊了处理Excel的openpyxl库。今天我们再来看看Python里非常实用的办公自动化的库——docxtpl,它是专门用来将 Word 模板与Python数据结合,实现自动化生成Word文档的功能。适合批量生成简历、通知、合同、报告等等办公文档。首先,我们需要确保安装了第三方库docxtpl。在命令窗口用 pip安装即可:pip install docxtpl。 Continue reading
-
和我一起玩Python:48. Python处理Excel的好帮手openpyxl模块

大家好,我是赛博红兔。今天我们要聊聊Python实现Excel自动化的模块openpyxl。可能有人要问,一般处理excel或者csv数据的都是用pandas,为什么我们要学openpyxl呢?大家可以来看看这张两者区别对照表。pandas专注于数据分析和处理,适合大规模数据计算。而openpyxl专注于Excel文件本身的一些操作,适合单元格的格式化、插入图表、公式等等的Excel细节处理。所以在批量处理Excel文件本身的自动化操作时候,也就是平常的办公自动化,学会openpyxl就足够了。 Continue reading
-
和我一起玩Python:47. Python高级迭代工具itertools模块

大家好,我是赛博红兔。你有没有遇到过这样的情况:想要遍历多个列表的组合,却发现自己写的嵌套循环又长又复杂?或者想要高效地生成排列和组合,但写出的代码效率不太理想?今天,我们将深入探讨Python中的itertools模块。这个模块包含了一系列常用的迭代器,以及用于组合多个迭代器的函数,能帮我们轻松地生成排列、组合、无限序列还有批量分组等等。 Continue reading
-
和我一起玩Python:46. Python高级数据容器处理collections模块

大家好,我是赛博红兔。大伙有没有遇到过这样的问题:在日常开发中,需要用字典来统计数据频率,却发现自己写的代码太长而且效率很低?或者需要在列表前后快速插入和删除元素,但普通的列表性能不够理想?这个时候,collections 模块就可以派上用场了!collections 是 Python 提供的一个标准库模块,它扩展了内建容器数据类型(比如列表、字典、元组等)的功能,让我们更方便地解决许多实际问题。 Continue reading
-
和我一起玩Python:45. Python的正则表达式re模块

大家好,我是赛博红兔!上一集我们看一下有哪些元字符,然后来学习一下怎么写正则表达式。简单来说,正则表达式是一种用于模式匹配和文本处理的强大工具,广泛应用于字符串的搜索、匹配、替换和分割。今天,我们主要来介绍Python关于正则表达式处理的模块——re模块。同样,它提供了不少有用的利用正则表达来处理文本的方法。 Continue reading
-
和我一起玩Python:44. 浅谈正则表达式

大家好,我是赛博红兔!今天我们要学习 正则表达式(Regular Expression)。简单来说,正则表达式是一种用于 模式匹配和文本处理 的工具,广泛应用于字符串的搜索、匹配、替换和分割。例如,我们可以用一段元字符描述网站地址的结构(如 https://(www\.)?(\w+)(\.\w+)),而不需要逐一比对每个字符。正则表达式是跨语言平台的通用工具,大多数编程语言都支持它。 Continue reading
-
和我一起玩Python:43. Python随机数处理random模块

大家好,我是赛博红兔!今天我们要学习Python的另一个常用模块——random模块。在编写程序时,随机数有很多应用场景,比如生成验证码、随机抽样,或者实现简单的游戏逻辑。这些都离不开随机数的生成。今天我们一起来看看如何用Python标准库自带的random模块实现这些需求。首先,random模块的主要功能是生成伪随机数。注意这里的“伪”字,随机数是通过某种算法生成的,虽然看似随机。如果需要真正的随机数,可以使用secrets模块,它更适合生成高安全性的随机数,比如密码和令牌。回到random模块,它提供了多种生成随机数的方法,可以生成整数、浮点数,甚至随机打乱列表。接下来,让我们逐一介绍。 Continue reading
-
和我一起玩Python:42. Python时间日期处理datetime模块

大家好,我是赛博红兔。从这集开始,我们来介绍一些Python里最常用的库和模块。大家有没有遇到过这样的问题:在开发一个应用程序时,需要精确地计算两个时间点之间的时差?或者是,在制作一个活动提醒系统时,需要准确地处理不同的日期和时间,甚至还要考虑到不同的时区?这个时候,我们最先想到的就是Python标准库自带的datetime模块。它是一个处理日期和时间的标准模块,提供了很多实用的工具,可以用来解析、格式化、操作和计算日期和时间数据。 Continue reading
关于我
大家好,我是赛博红兔,是一个具有超过6年在Yaskawa Motoman机器人实验室和工业过程控制研究所的机器人及控制研究经验的创新且敬业的专业人士。主要关注机器学习、先进动态系统控制算法及其实现,精通C++、Python和MATLAB编程。
咨询互动邮箱:cyberhongtu@outlook.com
Bilibili视频请搜索:赛博红兔CyberHongTu
日志分类
- 生活琐事 (1)
- 生产力和技术 (1)
- 科技新闻评论 (1)
- Python教程《Python5分钟》 (14)
- Python教程《和我一起玩3A游戏》 (7)
- Python教程《和我一起玩Python》 (52)
- 播客《和大伙聊聊天》 (11)
- 书籍读后感 (3)






