DeepMind弹性权重巩固算法让AI拥有“记忆”

神经科学家已经能区分大脑中两种类型的巩固方式：系统巩固（systems consolidation ）与突触巩固（synaptic consolidation）。系统巩固的过程中，人类大脑将快速学习部分获得的记忆转印进了缓慢学习的部分。这一转印过程有有意识的回忆参与，也有无意识回忆的参与，人类做梦时就能完成这一转印过程。而在突触巩固中，如果一种技能在此前的学习中非常重要，神经元之间连接就不会被覆盖。DeepMind 的算法就是沾了突触巩固的光，成功解决了“灾难性忘却”的问题。
神经网络中神经元的连接与大脑非常相似，在学习完一个技巧后，DeepMind 会计算出在神经网络中的哪个连接对已学到的任务最为重要。随后在学习新技巧时，这些重要的连接就会被保护起来不被覆盖。这样一来，在计算成本没有显著升高的情况下，“左耳进，右耳出”的问题就解决了。
如果用数学术语来解释，可理解为在一个新任务中把每个连接所附加的保护比作弹簧，弹簧的强度与其连接的重要性成比例。因此，DeepMind 将这种算法称之为“弹性权重巩固”（Elastic Weight Consolidation，EWC）。