过滤基于另一个csv文件在csv文件中行并将过滤后的数据保存到新文件中。

编程入门 行业动态 更新时间:2024-10-24 22:29:18
本文介绍了过滤基于另一个csv文件在csv文件中行并将过滤后的数据保存到新文件中。的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

大家好

所以我尝试基于file1来过滤file2,其中file1是file2的子集。但是File2有Description列,我需要该列才能分析File1中的数据。我正在尝试做的是去过滤文件2,并且只得到文件1中的标题和它们的描述。我试过了,但我不确定它是否完全正确,而且它正在工作,但我的计算机中没有保存任何文件

import re
import mmap
from pandas import DataFrame
output = []
with open('file2.csv', 'r') as f2:
    mm = mmap.mmap(f2.fileno(), 0, access=mmap.ACCESS_READ)
    for line in open('file1.csv', 'r'):
        Title = bytes("")
        nameMatch = re.search(Title, mm)
        if nameMatch:
            # output.append(str(""))
            fulltypes = [ 'O*NET-SOC Code', 'Title' , 'Discription' ]
            final = DataFrame(columns=fulltypes)
            final.to_csv(output.append(str("")))
    mm.close()

有什么想法吗?

csv

假设您的推荐答案文件不太大,您可以通过读取pandas和使用join方法来实现这一点。举个例子:

import pandas as pd

file1 = pd.DataFrame({'Title': ['file1.csv', 'file2.csv', 'file3.csv']})
file2 = pd.DataFrame({'Title': ['file1.csv', 'file2.csv', 'file4.csv'],
                      'Description': ['List of files', 'List of descriptions', 'Something unrelated']})

joined = pd.merge(file1, file2, left_on='Title', right_on='Title')

print joined

此打印:

       Title           Description
0  file1.csv         List of files
1  file2.csv  List of descriptions

即仅存在于两者中的文件。

ASpandas可以本机将CSV读取到数据帧中,在您的情况下,您可以这样做:

import pandas as pd

file1 = pd.DataFrame.from_csv('file1.csv')
file2 = pd.DataFrame.from_csv('file2.csv')

joined = pd.merge(file1, file2, left_on='Title', right_on='Title')

joined.to_csv('Output.csv', index=False)

这篇关于过滤基于另一个csv文件在csv文件中行并将过滤后的数据保存到新文件中。的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

更多推荐

[db:关键词]

本文发布于:2023-03-13 17:00:06,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/620786.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:文件   并将   中行   到新   数据

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!