Python可变与不可变数据、深拷贝与浅拷贝

浅拷贝和深拷贝拷贝函数是专门为可变数据类型list、set、dict使用的一种函数。作用是，当一个值指向另一个值的时候，也不会影响指向的值，如果被指向的数据是可变数据，那么它一旦被修改，指向的数据也会随之改变。

什么是可变数据和不可变数据我们来举一个例子，整型是不可变的数据，那么为什么是不可变的数据呢？一个数据是不是可变的就要关系到python的缓存机制。

当一个数据发生变化，如果它的内存地址没有发生变化，就说明这是一个可变数据。

比如说，我们现在创建一个值是a的变量，它的值是100，然后让这个数值发生变化，观察者个变量的内存地址是否发生了变化。

a = 100
print(a, id(a)) # 100 1610845392
a += 100
print(a, id(a)) # 200 1610848592

我们发现数值发生了变化，变量的内存也跟着发生了变化，我们再创建一个变量b，值也是整型100

b = 100
print(b, id(b))    # 100 1610845392

发现b的内存地址和a的内存地址是一样的，也就是说，像整型这样的数据类型，一个数字就独占一个内存地址，当某个指向这个值的变量，发生了变化的时候，不是这个变量的值要改变，而是这个变量要寻找改变后的值的内存地址，然后重新的指向它。只要你的硬件不重新启动，那么这个内存地址就永远也不会发生变化了，这样的数据就是不可变数据。

那么，反之就是可变数据，指的就是当变量指向的值发生变化之后，在这个内存地址上的值实打实的发生变化的值，就是可变数据类型。

比如列表，列表发生改变之后，是在原有的基础上发生变化的，所以内存地址是不会改变的，这就是可变数据类型，可变数据类型没有内存缓存机制，不能节省内存，所以一模一样的数据，他们的内存地址可能是不相同的。

a = [1, 2]
print(a, id(a)) # [1, 2] 1528536069896
a.append(3)
print(a, id(a)) # [1, 2, 3] 1528536069896
# b 和 a的值相同，但是内存地址不相同
b = [1, 2, 3]
print(b, id(b)) # [1, 2, 3] 1528536069832

那么拷贝函数是干什么的？在我们的实际工作当中，经常会使用的一种操作就是定义一个变量，它的值直接就赋给了一个原有的变量之上。可是变量定义之后我们绝不是用来作为一个摆设的，而是要做运算、或者是做一个临时的存储，那么原有的变量的值是要改变的，问题就来了，如果是一个不可变的数据还好，如果是可变的数据，直接的赋值他们的内存地址是相同的，如果一个变量的值发生变化，同内存地址的的值就都发生改变了，我们的向要临时存储的值也就不再是我们想要的那个值了，这是绝大多数的时候我们不想看到的结果。

我们拿整型为例，变量a直接赋值给变量b，这个时候的变量a b 的值是相同的，但是如果变量a的值发生了变化，是丝毫不影响变量b的值的。

a = 100
print(a, id(a))  # 100 1610845392
b = a
print(b, id(b))  # 100 1610845392
a += 100
print(a, id(a))  # 200 1610848592
print(b, id(b))  # 100 1610845392

但是如果是可变数据就不是这样的情况了

a = [1, 2]
print(a, id(a))  # [1, 2] 2077688035080
b = a
print(b, id(b))  # [1, 2] 2077688035080
a.append(3)
print(a, id(a))  # [1, 2, 3] 2077688035080
print(b, id(b))  # [1, 2, 3] 2077688035080

不可变数据的这个特性既是一个优点也是一个缺点，缺点就是如果我们想要保存a变量发生变化之前的的一个状况的时候，是保存不下来的，这个时候就出现了拷贝函数，它可以将可变数据变成不可变数据那样的效果。

浅拷贝使用拷贝函数，将a变量放入作为参数放入函数中，使用b变量接受函数的返回值，就成功的拷贝了变量a，变量b的内存地址和变量a的不一样，这样当它们其中一方发生变化之后，不会影响到另一方的数据。

# 拷贝函数不能直接使用，需要使用import导入copy模块，copy模块的copy函数就是浅拷贝
import copy
a = [1, 2, 3]
# 变量b不在直接是变量a的直接赋值了，而是通过copy函数的返回值
b = copy.copy(a)
# 他们的数值一样，但是内存地址不同，所以他们之间的任意一方发生变化都不会影响到第二方。
print(a, id(a))  # [1, 2, 3] 2343743813320
print(b, id(b))  # [1, 2, 3] 2343743813192
a.append(4)
print(a, id(a))  # [1, 2, 3, 4] 2343743813320
print(b, id(b))  # [1, 2, 3] 2343743813192

但是如果变量a是一个二级容器或者是一个更多级容器，浅拷贝无法拷贝第二级容器或者更多级的容器，所以当第二级容器或者是更多级的容器发生变化的时候，还是会发生变化，因为浅拷贝只能拷贝一级容器，所以多级容器的内存地址还是相同的。

import copy
a = [[66,88], 2, 3]
b = copy.copy(a)
print(a, id(a))  # [[66, 88], 2, 3] 2431683163720
print(b, id(b))  # [[66, 88], 2, 3] 2431683162184
# 改变二级容器
a[0].append(100)
print(a, id(a))  # [[66, 88, 100], 2, 3] 2431683163720
print(b, id(b))  # [[66, 88, 100], 2, 3] 2431683162184
# 浅拷贝不能拷贝二级及以上的容器
print(id(a[0]))  # 1582481372872
print(id(b[0]))  # 1582481372872

深拷贝浅拷贝只能拷贝一级容器

所以诞生了深拷贝，深拷贝可以拷贝所有级别的容器。

import copy
a = [[66,88], 2, 3]
# 深拷贝使用deepcopy函数
b = copy.deepcopy(a)
print(a, id(a))  # [[66, 88], 2, 3] 2168411158088
print(b, id(b))  # [[66, 88], 2, 3] 2168411156552
a[0].append(100)
print(a, id(a))  # [[66, 88, 100], 2, 3] 2168411158088
print(b, id(b))  # [[66, 88], 2, 3] 2168411156552
# 深拷贝所有级别的容器
print(id(a[0]))  # 2168411158216
print(id(b[0]))  # 2168411122760

总结使用深浅拷贝需要导入copy模块；

浅拷贝使用copy函数，只能拷贝一级容器的所有元素；

深拷贝使用deepcopy函数，可以拷贝所有级别容器的所有元素；

标准库copy中只有copy和deepcopy两个函数对外开放使用；

因为深拷贝要拷贝的元素跟多，所以速度会远不如浅拷贝，在编程的过程中要注意避免造成多余的系统负担；

python中的不可变数据是Number、string、tuple，可变数据是list、set、dict；而拷贝就是专门为可变数据提供的，所以深浅拷贝只适用于list、set、dict，当然，可变数据使用拷贝函数也不会出错，但是没有意义。

以上就是全部内容，希望对大家有所帮助，