本文介绍了Ruby如何合并两个具有略微不同标题的CSV文件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有两个CSV文件,其中包含一些常见的标题,而其他只显示在一个或另一个中的文件,例如:
I have two CSV files with some common headers and others that only appear in one or in the other, for example:
# csv_1.csv H1,H2,H3 V11,V22,V33 V14,V25,V35
# csv_2.csv H1,H4 V1a,V4b V1c,V4d
我想合并两个文件,并获取一个新的CSV文件,其中包含以前CSV文件的所有信息。在需要时注入新列,并为新单元格提供 null 值。
I would like to merge both and obtain a new CSV file that combines all the information for the previous CSV files. Injecting new columns when needed, and feeding the new cells with null values.
结果示例:
H1,H2,H3,H4 V11,V22,V33, V14,V25,V35, V1a,,,V4b V1c,,,V4d推荐答案
:)
require "csv" module MergeCsv def self.run(csv_1_path, csv_2_path) csv_1 = CSV.read(csv_1_path, headers: true) csv_2 = CSV.read(csv_2_path, headers: true) puts merge(csv_1, csv_2) end def self.merge(csv_1, csv_2) headers = (csv_1.headers + csv_2.headers).uniq.sort hash_array = [csv_1, csv_2].flat_map &method(:csv_to_hash_array) CSV.generate do |merged_csv| merged_csv << headers hash_array.each do |row| merged_csv << row.values_at(*headers) end end end def self.csv_to_hash_array(csv) csv.to_a[1..-1].map do |row| Hash[csv.headers.zip(row)] end end end if(ARGV.length != 2) puts "Use: ruby merge_csv.rb <file_path_csv_1> <file_path_csv_2>" exit 1 end puts MergeCsv.run(ARGV[0], ARGV[1])更多推荐
Ruby如何合并两个具有略微不同标题的CSV文件
发布评论