前言

不论你是生活在哪里、工作学习于什么领域,可能都已经发现人工智能的时代已经飞快地向人们走来,这种感受就像是浪潮不断涨起,它将过去的一些传统的工作方式革新甚至取代。比如说,人工智能在图像识别、图像生成、自然语言翻译、自动驾驶领域的进步,使得传统的安保、插画、翻译、驾驶等工作受到前所未有的挑战。未来它也将不断改变现代人的生活,并且变革人们的工作内容。

这背后的技术进步正是由于深度学习的人工智能第三次科技浪潮的兴起,它顺应着数据的大爆发与芯片技术的高度发展,孕育了当今时代新的发展机遇,值得年轻的学生与技术工作者去努力学习。然而现有的教材通常侧重理论基础,与实践结合不够,或者实践的讲解不够深入、详细。同时有些国外经典教材是英文撰写,不利于国内英语基础不好的读者学习。

我深入了解到工业界学习者和在校学生的这些学习需求,所以编写了本书。深度学习自身是一个实践性要求极高的领域,需要借助实例去讲解,所以本书参考了吴恩达教授的课程,在编写中详细地介绍了各种深度学习模型的数学运算原理,对各种发展成熟的神经网络都有深入分析,为此阅读本书需要高等数学、线性代数的基础知识,并且会使用Python编程语言进行简单的操作与数据分析。本书主要涉及以下内容:

第1部分是神经网络的基础,学习如何建立神经网络,以及如何在数据上面训练它们。接下来在第2部分进行深度学习方面的实践,学习如何构建神经网络与超参数调试、正则化以及一些高级优化算法。第3部分学习卷积神经网络(CNN),以及如何搭建模型、有哪些经典模型。它经常被用于图像领域,此外目标检测、风格迁移等应用也将涉及。最后在第4部分学习序列模型,以及如何将它们应用于自然语言处理等任务。序列模型讲到的算法有循环神经网络(RNN)、长短期记忆网络(LSTM)、注意力机制。通过以上内容的学习,读者可以入门深度学习领域并打下扎实基础,为后续了解和探索人工智能前沿科技做知识储备。

我开始有写一本深度学习教材的想法源于2020年开始在东北大学秦皇岛分校讲机器学习与深度学习相关课程,在实践中积累教学经验,梳理了该领域的知识,虽然内容繁多还有些杂乱,但是对读者应该有用。这个时候正好学院的郭院长组织编写自动化系列教材,能与机械工业出版社合作,我就开始编写本书。这期间科研工作也极为忙碌,所以经历了落笔、停滞、继续重启、再停滞,如此重复。中间想过放弃,但是罗编辑的耐心解答、郭院长的悉心鼓励以及吕同学的大力帮忙,最终还是让这本书得以成形,也圆了我编著书籍的梦想。同时也要感谢我的家人在这期间对我的关怀和帮助,他们一直支持着我,无论我是在国外留学还是回国工作。

最后,本人能力水平有限,希望读者不吝赐教。

王舒禹

2022年12月