标点符号转变"/>
python处理文本中英文标点符号转变
中英文标点符号转变
import osdef E_trans_to_C(string):E_pun = u',.!?[]()<>"\';:'C_pun = u',。!?【】()《》“‘;:'table= {ord(f):ord(t) for f,t in zip(E_pun,C_pun)}return string.translate(table)rootdir=r'D:\book\语料'
list1 = os.listdir(rootdir)
words = []for j in range(0,len(list1)):path = os.path.join(rootdir, list1[j])if os.path.isfile(path):f=open(path,'r',encoding='utf8')lines=f.readlines()string="".join(map(str, lines)).strip()string2=E_trans_to_C(string)f1=open(path,'w',encoding='utf8')f1.write(string2)print(path)
更多推荐
python处理文本中英文标点符号转变
发布评论