▽人工智能基础书籍
“科研书山”的基础是永远打不完的。以我相对熟悉的人工智能方向为例。如果要先打基础,学生应该选择一些经典的教科书来学习和入门。比如早期大家都爱看的、Duda等撰写的《模式分类》(Pattern Classification)[1],曾经被视为红宝书的、很多人喜欢做书后习题的Bishop撰写的《模式识别与机器学习》(Pattern Recognition and Machine Learning)[2]。再比如在亚马逊平台机器学习领域长期销售量第一的,由三位斯坦福大学统计系的著名教授(Trevor Hastie、Robert Tibshirani 和Jerome Friedman)合作撰写的《统计学习要素》(第二版)(The Elements of Statistical Learning,2nd )[3],“统计味”和“干货”十足,是一本对人工智能中的机器学习有着不同视角但非常有价值的书。该书中文版也已经于2021年1月面世,由清华大学出版社出版,是我翻译的。还有近年来,国内绝对畅销的、知识点全面且精炼的,由机器学习专家南京大学周志华教授撰写的《机器学习》(因封面和样例常用西瓜,俗称“西瓜书”)[4]。而最近这几年特别受大家追捧的、提出生成对抗网的Ian Goodfellow与2019年图灵奖得主Yoshua Bengio等合写的《深度学习》(Deep Learning)[5]也是近年来研究人工智能深度学习网络模型的重要参考资料。
图2-2 作者翻译的《统计学习要素》
如果觉得自己统计和数学基础好,还可以看看Devroye等写的《模式识别的概率理论》(A Probabilistic Theory of Pattern Recognition)[6],这本书通篇是从模型预测未知样本能力的泛化上界的角度来理解人工智能核心技术的。也可以读从博弈论角度切入的,Nicolò Cesa-Bianchi等写的《预测,学习和博弈》(Prediction,Learning and Games)[7],该书在学习假设上,抛弃了常规机器学习里的独立同分布假设,即采样的数据与未知的分布具有相同分布且独立采样。要想了解小样本下的变量间推断机制或具有可解释性的机器学习方法,还得看曾与人工智能领域著名教授吴恩达共同办过在线教育网站Coursera的斯坦福大学教授Daphone Koller用她很有特色的数学表达写出来的上千页巨著《概率图模型》(Probabilistic Graphical Model)[8]。她也曾以此书为基础,精心制作过一套完整的在线视频讲解课程,有很好的参考价值,非常值得看看,有兴趣的读者可以搜索观看。