作者:钱洋,姜元春
出版时间:2020-01
千 字 数:484
版次:01-01
页 数:380
开本:16开
I S B N :9787121376078
内容简介:这本以Java为开发语言的书系统介绍了爬虫在网络工作所必需的理论知识和基础工具,包含网络爬虫涉及到Java的基本知识,以及http协议基础知识和web抓包等、 web内容获取、网页内容分析与网络爬虫数据存储等多个方面有着不同的差异。书中选择了典型的网站使用案例讲解的方式来对互联网爬虫中所涉及的问题进行介绍,从而提升读者的动手能力和实践能力。同期,书中还介绍了3种开源的Java网路爬虫框架,即Crawler4j、WebCollector和WebMagic。 本书适合初学者和进阶Java网络爬虫开发技术人员;也可以作为网课教学的参考书籍进行爬虫学习,对于高等学院的文本挖掘、自然语言加工等、大学生和研究生在进行大数据业务分析及其他相关学科的考试,也可以作为企业网络爬虫的开发者的参考。
网络数据采集技术—Java网络爬虫实战
6098
复制