问题描述
示例
40000多行GUID如下:
GUID: 0981723409871243
在所有GUID中搜索重复项
示例:
GUID: 124432408213
GUID: 08917234071423
GUID: 0189742381
GUID: 08917234071423
GUID: 0817423423
GUID: 124432408213
我有TextFX和Compare,但如何找到此部件有2个124432408213
和2个08917234071423
在可能存在重复项的40,000行中,我无法轻松检测到它们,我需要一种方法来查找重复项。
应该类似于GUID:"在GUID之后搜索文本"下一行,然后继续搜索每个GUID.我可以编写一个自定义程序来执行此操作,但是.尝试避免执行此操作TextFX功能相当强大,只是看不到这样做的方法.
我应该在这里添加更多信息示例:
[块1] GUID:? 更多信息:? [/块1]
每个挡路都是这样格式化的..
推荐答案
使用TextFx对输入行进行排序并保留副本。接下来执行正则表达式搜索,在标记选项卡中设置书签行。搜索文本应为^(GUID:s*d+
)1
,然后单击标记全部**。然后使用MENU=>搜索=>书签=>删除未标记的行删除除重复项之外的所有内容,或使用MENU=>Search=>Bookmark=>复制已加书签的行并将行粘贴到需要的位置。如果有四个或更多相同的行,则上述操作可能以每对一个条目结束,另一个删除重复项的TextFX排序应该会删除多余的项。
对于[block1] guid: ???? more info: ??? [/block1]
情况,正则表达式比较复杂,但^([block1] guid:s*d+ more info:s*d+ [/block1]
)1
在以下位置查找并标记重复项:
[block1] guid: 1234 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]
在Linux或类似系统上,像sort -c inputFileName | grep -v "^s*1s"
、sort inputFileName | unic -c | grep -v "^s*1s"
或sort inputFileName | uniq -d
这样的命令应该可以工作,具体取决于可用的命令和选项。
这篇关于记事本++检查重复行复合体的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
更多推荐
[db:关键词]
发布评论