Kettle只能从数据库中抽取数据( )。
pandas是一个用于数据分析和处理的Python库()。
pandas是一个用于数据分析和处理的Python库( )。
DataFrame中的列必须是相同数据类型( )。
DataFrame和Series之间的运算默认是按列进行广播运算( )。
当进行DataFrame和Series之间的运算时,如果Series的索引与DataFrame的列名不匹配,会自动进行索引对齐( )。
数据清洗的主要应用领域包括______、_____。
数据清洗按照实现方式,可以分为____和____。
对箱子的划分方法一般有两种,一种是____,另一种是____。
通过____方法可帮助发现异常数据,那些位于这些聚类集合之外的数据对象,则被认为是异常数据。
数据转换策略中,_____方法是对被转换数据进行一种线性转换。
假设属性的最大值和最小值分别是64000元和21000元,现在需要利用Min-Max规范化方法,将“顾客收入”属性的值映射到0~1 的范围内,则“顾客收入”属性的值为31400元时,对应的转换结果是_________。
Z-Score规范化的转换公式是_________。
JDK的安装完成后,输入____命令测试是否安装成功,如果安装成功,则会返回版本信息。
在安装JDK后,我们需要设置____环境变量来确保Java应用程序能够正常运行。