#字符串 字符串属于不可修改的数据类型,即str属于不可修改的数据类型)  而列表 list是可以更改的
#可以通过顺序索引 与列表类似
res = 'str1'+'str2'+'str3'  #合并
res = 'str1'*3         #重复
res = int('1')        #只能用int转换数字
res = str(1)
<class 'str'>
s = 'My Name'
res = s.split(' ')
res1 = s[1]
My Name ['My', 'Name'] y
<class 'str'> <class 'list'> <class 'str'>
#单引号 双引号不做区分;若需换行输入字符串,使用三引号,其也可用于注释
str = 'My name'
res = str.split(' ')   #打断 但是str字符串没有发生变化 (字符串属于不可修改的数据类型,即str属于不可修改的数据类型) #对字符串建立的副本进行的操作 而不是对字符串str进行操作 与列表要加以区分
print(str)li = [1,2,3]
['My', 'name']
My name
[1, 2, 3, 4]
# 键值成对出现
# 键不能重复
# 键不可更改,值可更改
# 键用来索引值
# 字典不能通过顺序索引#将单词作为键 将单词出现频率作为值,即可统计出每个单词出现的频次#字典的增删改查
dic = {1:11.003,'name':'hello',0:[2,4,6]}  #键的数据类型只能是不可修改的数据类型,列表就是不能作为键的
dic2 = {'a':1,'b':2,'c':3}dic['abc'] = 'abc'                         #增加键值对
dic.update({2.1:'E',5:'656'})              #字典更新
del dic[1]                                 #键值对的删除
res2 = sorted(dic2.items(),key=lambda x:x[1])   #字典对值进行排序 items是一个列表 即对列表元素进行排序#key用来指明排序的依据 lambda x[1]即表明选取第一个元素作为排序依据,即值为排序依据,并且为升序排列        print(dic) 
#print(dic[2])                             #字典的索引不能通过顺序索引 不同于有顺序的列表和字符串 只能通过键来索引
print(dic['name'])                         #字典的索引
print(dic.values())                        #索引字典所有的值
print(dic.keys())                          #索引字典中的键
print(dic.items())                         #索引字典中的键和值 items用法:返回可遍历的(键,值)元组数组,以列表形式存储。
{'name': 'hello', 0: [2, 4, 6], 'abc': 'abc', 2.1: 'E', 5: '656'}
dict_values(['hello', [2, 4, 6], 'abc', 'E', '656'])
dict_keys(['name', 0, 'abc', 2.1, 5])
dict_items([('name', 'hello'), (0, [2, 4, 6]), ('abc', 'abc'), (2.1, 'E'), (5, '656')])
<class 'dict'>
[('a', 1), ('b', 2), ('c', 3)]
#字典推导式res = {i:i**2 for i in range(1,11)}     #i**2表示i的平方 
{1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100}
# 思路:1.首先将字符串中的字母统一为大写或小写字母,再利用打断操作,将字符串打断为一个一个以列表形式存储的单词
# 并存在列表words内。然后将words内的单词转化为集合存于words_index中作为索引。最后创建一个以索引为键,以利用字典
# 推导式创建出来的词频数为值的字典来存储各个词的词频数
#    2.首先将字符串打断为单词存在列表内,然后利用列表推导式将单词的大小写字母统一。接下来的操作步骤见上述。lyric = 'The night begin to shine , the night begin to shine'#由于The和the是不同的对象 但是需要将它们视为同一个单词 因此需要进行大小写的转换
lyric=lyric.lower()              #直接将字符串转为小写字母导入  或者使用lyric.upper()转为大写字母
words=lyric.split()              #打断操作如果默认 不填入的话  会以空格或是换行符作为打断符号# #第二种大小写转换办法
# words = lyric.split()                    
# # words = words.lower()  #此种方法不适用 因为words是一个列表 并非字符串 。而lower函数是字符串的函数      
# words = [i.lower() for i in words]    #解决方法:使用列表推导式,利用i,将i转换为小写,再赋给words#设置单词的索引
words_index = set(words)              #将words转为集合 集合特点:元素不重复,不可修改,没有顺序#遍历创建的单词索引(集合),利用count函数计算单词出现的次数
dic={word:words.count(word) for word in words_index}print(words)
['the', 'night', 'begin', 'to', 'shine', ',', 'the', 'night', 'begin', 'to', 'shine']
{'the', 'shine', 'to', 'begin', ',', 'night'}
{'the': 2, 'shine': 2, 'to': 2, 'begin': 2, ',': 1, 'night': 2}
#格式:  open(文件名,访问模式)  w写 r读
f = open('E:/python学习/python 集训营/基础教程/Walden.txt','r')    #使用\\或者/
txt1 =
txt2 = f.readlines()   #按行读取字符串  
txt3 = f.readline()    #一次读一行 因为文章第一行为换行符,所以输出换行符
print(type(txt1))                #read函数返回字符串
print(type(txt2))                #readlines函数返回列表
print(type(txt3))    #写数据 write
# f = open('test.txt','w')
# f.write('hello world,\n')
# f.write('i an here\n')
# f.close()#读数据 read
# 使用read(num)可以从文件中读取数据,num表示要从文件中读取的数据的长度(单位是字节),如果没有           
# 传入num,那么就表示读取文件中所有的数据#其他访问模式
# r:以只读方式打开,文件指针放在文件的开头。默认模式
# w:打开一个文件只用于写入。若该文件存在则将其覆盖。若该文件不存在,创建新文件。
# a:打开一个文件用于追加。若文件存在,文件指针放在文件结尾。若文件不存在,则创建新文件写入
# rb:以二进制格式打开一个文件用于只读。。。。。
# wb:以二进制格式打开一个文件用于写入。。。。。
# ab:以二进制格式打开一个文件用于追加。。。。。#文件操作方法
# f.close():关闭文件,记住用open()打开文件后需要关闭它,否则会占用系统的可打开文件句柄数
# f.flush():刷新输出缓存
# f.readline():读出一行信息
# f.readlines():读出所有行,以列表形式储存
# f.write(string):把string字符串写入文件
# f.writelines():把list中的字符串一行一行地写入文件,是连续写入文件,没有换行。
<class 'str'>
<class 'list'>
<class 'str'>
import re
s = 'My,name.'
res = re.sub('[.,]','',s)    #对s操作:将,.替换为空字符
import re
with open('Walden.txt') as f:      #如果需要读取的文件就在当前工程目录下面,只需填写文件名称                                                      txt =                  #读取txt
txt = txt.lower()                   #将txt文件中的字母统一转为小写字母
txt = re.sub('[,.:?*"\';!()<>-]','',txt) #将txt中的标点符号替换为空
words = txt.split()                 #以空格或换行符为打断符号进行打断操作 以列表存储
words_index = set(words)            #生成集合,去除重复元素 以字典存储
dic = {word:words.count(word) for word in words_index}   #利用字典推导式,遍历集合中的元素,并利用count函数计算列表words中各个单词出现的个数
res = sorted( dic.items(),key=lambda x:x[1],reverse=True) #对字典的items进行排序,以第一个元素作为排序依据,reverse=True:降序排序print(res)
