记事本++检查重复行复合体

编程入门行业动态更新时间:2024-10-09 00:42:55

本文介绍了记事本++检查重复行复合体的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

示例

40000多行GUID如下：

GUID: 0981723409871243

在所有GUID中搜索重复项

示例：

GUID: 124432408213
GUID: 08917234071423
GUID: 0189742381
GUID: 08917234071423
GUID: 0817423423
GUID: 124432408213

我有TextFX和Compare，但如何找到此部件有2个124432408213和2个08917234071423

在可能存在重复项的40,000行中，我无法轻松检测到它们，我需要一种方法来查找重复项。

应该类似于GUID："在GUID之后搜索文本"下一行，然后继续搜索每个GUID.我可以编写一个自定义程序来执行此操作，但是.尝试避免执行此操作TextFX功能相当强大，只是看不到这样做的方法.

我应该在这里添加更多信息示例：

[块1] GUID：？更多信息：？ [/块1]

每个挡路都是这样格式化的..

推荐答案

使用TextFx对输入行进行排序并保留副本。接下来执行正则表达式搜索，在标记选项卡中设置书签行。搜索文本应为^(GUID:s*d+ )1，然后单击标记全部**。然后使用MENU=>搜索=>书签=>删除未标记的行删除除重复项之外的所有内容，或使用MENU=>Search=>Bookmark=>复制已加书签的行并将行粘贴到需要的位置。如果有四个或更多相同的行，则上述操作可能以每对一个条目结束，另一个删除重复项的TextFX排序应该会删除多余的项。

对于[block1] guid: ???? more info: ??? [/block1]情况，正则表达式比较复杂，但^([block1] guid:s*d+ more info:s*d+ [/block1] )1在以下位置查找并标记重复项：

[block1] guid: 1234 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]

在Linux或类似系统上，像sort -c inputFileName | grep -v "^s*1s"、sort inputFileName | unic -c | grep -v "^s*1s"或sort inputFileName | uniq -d这样的命令应该可以工作，具体取决于可用的命令和选项。

这篇关于记事本++检查重复行复合体的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

更多推荐

[db:关键词]

本文发布于:2023-03-13 15:53:54，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/616551.html