【CSV】-读取CSV

1 功能说明

读取CSV文件中的数据，并将读取到的内容进行返回。

注：组件使用的是pandas库的read_csv()方法，返回的是一个DataFrame数据集。

2 基本使用说明

1 点击“文件路径”参数后的文件图标，选择需要读取的CSV文件。

2 组件返回值即csv文件的内容，其类型为DataFrame数据集。

3 参数配置说明

注： CSV文件是以纯文本形式存储的表格数据，由任意数目的记录组成，记录间以某种换行符分隔开，最常见的就是逗号或制表符。

“delimiter”参数：备选分隔符,输入字符串，默认为None，如果指定该参数，则sep参数失效。
“delim_whitespace ”参数：指定空格是否作为分隔符使用，等效于设定sep='\s+'；默认为False，即不设置空格为分隔符，如果这个参数设定为Ture，那么“delimiter ”参数失效。
“header”参数：指定行作为表头，默认为'infer'，csv表格第一行作为表头；没有表头则可设置为None，也可输入整型数字或整型数字组成的列表。

1 默认为'infer'，设置数据第一行为表头。

2 输入整型数字，对应表格内行的下标（从0开始），设置指定行为表头，指定行之前的数据不读取。

3 输入整型数字的列表，指定列表内元素对应的行为表头，也就是说每一列有多个列名，且介于表头行中间的行数据被忽略不读取。

“Apikeys”参数：用以设置结果表格的列名，默认为None，不设置列名；传入类似数组的有序集合，如列表、字符串以及元组等，从最后列开始，数据内的元素倒序依次作为对应列的列名。

注：该数据内的元素默认出现重复时，即不同列设置同样的列名时，因为“mangle_dupe_cols”参数默认为True，会自动修改重复的列名（添加后缀信息），并附加一条提示信息。

1 输入列的整型数字下标或列名的字符串，指定该列为索引列。

2 输入列名或列下标为元素组成的序列（如列表、元组等），指定序列元素所对应的列作行索引，这样每行便有多个索引。例如，输入[0,'类型']，设置第一列和“类型”列为索引。

1 默认为None，获取所有列，即整个表格。

2 输入列名或列下标为元素组成的可迭代序列（如列表、元组等），获取序列元素对应表格中的列。

注：序列内的元素需统一，或均为列名，或均为列下标。

1 默认为False，文件只包含一列的情况下返回值依旧为Dataframe类型数据；

2 设置为True，返回一个Series类型的数据。

1 默认为None，不添加前缀；

2 输入字符串，在列下标前添加前缀作为列名。

“mangle_dupe_cols ”参数：出现重复的列名时，自动给重复的列名添加后缀，将相同的列名【...X...X...】修改为【...X...X.n...】，默认为True，且不支持False。

注：设置为False，会抛出异常。