数据导入与预处理

编程入门 行业动态 更新时间:2024-10-20 04:10:39

<a href=https://www.elefans.com/category/jswz/34/1771445.html style=数据导入与预处理"/>

数据导入与预处理

文章目录

  • 资源
  • json概述
  • json案例
    • dumps案例
    • dump案例
      • 中文编码问题
      • 格式化问题
    • loads案例
    • load案例

资源

参考:

json概述

什么是json

json是一种轻量级的文本数据
交换格式json独立于其他语言
json具有自我描述性,更好理解
json比xml更小、更快,更容易解析

json格式

{"name":"lhh","age":"20"
}

json标准库的作用

使用json字符串生成python对象(load)
由python对象格式成为json字符串(dump)

数据的类型转换

将数据从python转换到json格式,在数据类型上会有什么变化呢,如下表所示:

PythonJSON
dictobject
list,tuplearray
strstring
int,float,int-number
Truetrue
Falsefalse
Nonenull

使用方式

方法功能
json.dump(obj,fp)将python数据类型转换并保存到json格式的文件内
json.dumps(obj)将python数据类型转换为json格式的字符串
json.load(obj)将json格式的文件中读取数据并转换为python类型
json.loads(s)将json格式的字符串转换为python的类型

json案例

dumps案例

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)#转换为json字符串
jsonStr = json.dumps(person,)
print(jsonStr)#转换为json字符串 中文编码避免
jsonStr = json.dumps(person,ensure_ascii=False)
print(jsonStr)

输出为:

在python中定义json的时候,可以使用单引号,也可以使用双引号。但是最后在输出的时候,输出的是一个单引号,以字典的方式进行输出的。
我们进行json格式转换之后,我们就会变成一个标准的json格式的字符串,即双引号修饰的字符串
对于包含中文的内容,会被转码为\u开头,这时可以通过ensure_ascii=False完成中文输出。json_dumps(dict)时,如果dict包含有汉字,一定加上ensure_ascii=False。否则按参数默认值True,意思是保证dumps之后的结果里所有的字符都能够被ascii表示,汉字在ascii的字符集里面,因此经过dumps以后的str里,汉字会变成对应的unicode。

dump案例

中文编码问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)#转换为json文件
json.dump(person,open("data.json","w"))#转换为json文件,文件内容为中文  
json.dump(person,open("data1.json","w",encoding="utf-8"),ensure_ascii=False)

输出为:

格式化问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)#转换为json文件
json.dump(person,open("data.json","w"))#转换为json文件,文件内容为中文  
json.dump(person,open("data1.json","w",encoding="utf-8"),ensure_ascii=False,indent=4)

输出为:

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)#转换为json文件,文件内容为中文  
json.dump(person,open("data1.json","w",encoding="utf-8"),ensure_ascii=False,indent=4,sort_keys=True)

输出为:

loads案例

import jsondata = {'name':'张某某','gender':'man','age':18}
# 将Python对象编码成json字符串
# print(json.dumps(data))
# 将json字符串解码成Python对象
a = json.dumps(data)
print(json.loads(a))
print('+'*10)data = (1,2,3,4)
data_json = [1,2,3,4]
#将Python对象编码成json字符串
print(json.dumps(data))
print(json.dumps(data_json))
print('+'*10)#将Python对象编码成json字符串
a = json.dumps(data)
b = json.dumps(data_json)
print('+'*10)
#将json字符串编码成Python对象
print(json.loads(a))
print(json.loads(b))

输出为

load案例

更多推荐

数据导入与预处理

本文发布于:2023-12-05 21:18:19,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1665331.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:数据

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!