Python网络爬虫:从入门到精通在线阅读

Python网络爬虫:从入门到精通

吕云翔主编
开会员,本书8折购 >

教材教辅研究生/本科/专科教材11.2万字

更新时间:2023-10-25 19:34:57 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

同类热门书

最新上架

  • 会员
    Spark?SQL是Spark用于处理结构化数据的一个模块。本书共8章内容,由浅入深地讲解Spark?SQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。通过本书的学习,读者能够掌握Spark?SQL核心技术。本书每章安排了习题和总结,以便使读者能更好地学习和更牢固地掌握Spark?SQL编程方法。此外,本书还提供了PPT教学课件、源代码等配套资源,供使用本书的读
    杨虹 谢显中 周前能 张安文编著教材教辅7.1万字
  • 本书严格遵循高等教育出版社出版的全国统编教材《中国近现代史纲要(2023版)》的基本观点,并努力借鉴、学习、包容、吸收了学术界最新观点和前人的研究成果。在体例上以专题内容呈现。每个专题由理论知识模块、实践教学模块、自主学习模块、训练考查模块构成。在内容上,本书以教材为依据,适当增加历史资料,并借鉴了历史学界的最新研究成果。希望本书能对进一步推动思想政治理论课的针对性、实效性起到积极作用,有助于学生
    陈园园 张岩竹 迟青峰主编教材教辅22.1万字
  • 会员
    本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、
    曾国荪 曹洁编著教材教辅9.7万字
  • 会员
    《新编英国文学史教程》的编写针对现行同类教材语言生涩、内容繁杂的现状,以知识性和易读性为宗旨,以我国英语专业本科教学大纲为指导,充分考虑我国英语专业本科学生的英语语言实际水平,兼顾部分高校英国文学课程开设时间较短的现实,把握英国文学史整体框架,以文学发展不同时期为单位,把历史背景、文学运动、文学流派和作家作品的介绍凝练化、条理化,利于学生在有限的时间里构建一个比较系统完整的英国文学知识体系。同时,
    水彩琴主编教材教辅23.3万字
  • 会员
    本书使用分学科、多指标综合评价,以及定量评价与定性评价相结合的研究方法,从我国正在出版的中文期刊中评选出1987种核心期刊,具有较高的学术水平和使用价值。
    陈建龙 张俊娥主编教材教辅63.3万字
  • 会员
    乡土是永远的文化母题,中国的20世纪则更是土地问题的世纪。作为学术专题,本书以“20世纪中国乡土文学”为研究对象,纵横结合,点面兼顾,较为系统地梳理、探究了“乡土文学”自身本质特征问题,乡土小说、乡土诗、乡土散文、乡土戏剧与影视等本体问题,20世纪中国乡土文学的精神脉络、典型实证、文本风格、地域文化影响、艺术表现成就等实际创作问题。作为课程教材,本书是中国现代文学史必修课程的有效拓展与合理延伸,是
    夏子科教材教辅22.9万字
  • 本书系统地讲解了统计学的基本原理和知识框架,主要特点包括:①理论联系实际。本书不仅讲解了理论知识,还注重将统计学的概念和方法应用于实际问题。书中提供了许多实例,有助于学生将统计理论与实际情境相结合。此外,本书还在部分操作环节介绍了如何使用Excel与SPSS等软件进行数据处理和分析,使学生具备操作技能。②图文并茂。为了更好地帮助学生理解概念和方法,本书配有详细而清晰的图表、数据和例题,以期让学生更
    傅毅 龚秀芳 汪传江编著教材教辅11.4万字
  • 会员
    本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言
    米洪 张鸰主编教材教辅6.2万字
  • 随着AI技术的飞速发展,AIGC已成为助力电商营销领域进一步发展的新引擎,推动着行业的创新与变革。本书深入剖析了AIGC如何以数据为驱动,以创意为核心,为电商营销实现精准化、高效化、个性化的转变赋能。本书共分为9章,分别为认识AIGC、AIGC高效使用技巧、AIGC+内容调研、AIGC+内容生成与传播、AIGC+短视频创作、AIGC+直播电商、AIGC+智能营销、AIGC+学习、工作与生活,以及A
    金佳林 任丹丹 梁蓓主编教材教辅19.7万字