用python获取.csv文件某一列或者某些列

MqtGhj

2024-01-19 帮助1人

1.把三个csv文件中的feature值整合到一个文件中，同时添加相应的label。

# -*-coding:utf-8 -*-
import csv;
label1 = '1'
label2 = '2'
label3 = '3'
a = "feature1,feature2,feature3,feature4,feature5,feature6,feature7,feature8,feature9,feature10,label" "\n"
with open("./dataset/dataTime2.csv", 'a') as rfile:
rfile.writelines(a)
with open("./dataset/f02.csv", 'rb') as file:
a = file.readline().strip()
while a:
a = a ',' label1 "\n"
#a = label1 ',' a "\n"
with open("./dataset/dataTime2.csv", 'a') as rfile:
rfile.writelines(a)
a = file.readline().strip()
with open("./dataset/g03.csv", 'rb') as file:
a = file.readline().strip()
while a:
a = a ',' label2 "\n"
#a = label2 ',' a "\n"
with open("./dataset/dataTime2.csv", 'a') as rfile:
rfile.writelines(a)
a = file.readline().strip()
with open("./dataset/normal05.csv", 'rb') as file:
a = file.readline().strip()
while a:
a = a ',' label3 "\n"
#a = label3 ',' a "\n"
with open("./dataset/dataTime2.csv", 'a') as rfile:
rfile.writelines(a)
a = file.readline().strip()

# -*-coding:utf-8 -*-
import tensorflow as tf
# 读取的时候需要跳过第一行
filename = tf.train.string_input_producer(["./dataset/dataTime.csv"])
reader = tf.TextLineReader(skip_header_lines=1)
key, value = reader.read(filename)
record_defaults = [[1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], tf.constant([], dtype=tf.int32)]
col1, col2, col3, col4, col5, col6, col7, col8, col9, col10, col11= tf.decode_csv(
value, record_defaults=record_defaults)
features = tf.stack([col1, col2, col3, col4, col5, col6, col7, col8, col9, col10])
with tf.Session() as sess:
# Start populating the filename queue.
coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(coord=coord)
trainx = []
trainy = []
for i in range(81000):
# Retrieve a single instance:
example, label = sess.run([features, col11])
trainx.append(example)
trainy.append(label)
coord.request_stop()
coord.join(threads)
#最后长度是81000，trainx是10个特征

这篇好文章是转载于：学新通技术网