题名:
干净的数据   gan jing de shu ju / (美)斯夸尔著 , 任政委译
ISBN:
978-7-115-42047-3 价格: CNY49.00
语种:
chi
载体形态:
12,188页 图 23cm
出版发行:
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2016
内容提要:
本书主要内容包括:在数据科学领域数据清理工作的重要作用,文件格式、数据类型、解码的基本概念,表单的关键特性,组织和处理数据的文本编辑器,各种格式的数据转换方法,解析和清理网页上的HTML文件的三种不同策略,深入了解PDF文件并掌握从中拖出数据的方法,检测和清除RDBMS中的坏数据的解决方案,使用书中介绍的方法清理来自Twitter和Stack Overflow的数据。 
主题词:
数据处理  
中图分类法:
TP274 版次: 5
其它题名:
数据清洗入门与实践
主要责任者:
斯夸尔 si kua er 著
次要责任者:
任政委 ren zheng wei 译