文件ANSI和UTF"/>
txt文件ANSI和UTF
事情是这样的,我有几个超大的txt文件,文件内容是几年的英文文章,每篇文章前用横线隔开。每篇文章分为好几部分,每一部分都以中文标签打头后接正文部分。例如“正文:Today bejing ...”或者“出版日期: Dec 21, 2010”。要做的任务是1.把这些文章按照每篇且分开,然后2.按照出版日期里的日期命名。当切分开始出现了问题,切分出的文件有部分是以utf-8保存的,这就导致进行第二步操作时出现中文乱码,不能找到“出版日期”,不能忍!!!于是想将第一步获得的切分文件由utf-8转换为ANSI格式。
找了许多方法,终于找到个靠谱的,见代码
int fileNum=0;findFiles(argv[2],fileNames,fileNum);for(int i=0;i<fileNum;++i){system("cls");cout<<fileNames[i]<<endl;ifstream fin(fileNames[i]); string name=fileNames[i];name=name.substr(name.rfind("\\"));string line,comboLine="";while(getline(fin,line)){comboLine+=line+"\n";}char
更多推荐
txt文件ANSI和UTF
发布评论