读《认识AI》
1、最近 ChatGPT 越来越热,都已经到了马斯克等千人签署公开信,呼吁暂停开发更强大的 AI 系统,担心人工智能开发危及「文明控制权」,而我这个 AI 小白决定要系统性的学习下 AI 相关知识了。
2、我之前说过,看书是系统化学习比较有效的一种方式,于是我找到了《认识 AI》这本书,这本书非常适合入门,整本书只有 200 页,涉及了 AI 的方方面面,很多地方都以生活中实际的例子进行类比,即便是非技术人员也能很好理解。
3、AI 是 Artificial Intelligence 的缩写,中文名是人工智能,这个现在耳熟能详的名字,居然在 1955 就被创造了,1956 年的达特茅斯会议上由约翰·麦卡锡提出,讨论了要让计算机能像人一样具有智能。约翰·麦卡锡也被称为人工智能之父。
4、人工智能的一个分支是符号和模式匹配,通过符号和模式匹配的方式对信息进行处理然后输出结果,当不能匹配时就没有结果返回,这种方式适合垂直领域,像客户机器人、天猫精灵等都属于这种。
5、另一个分支就是机器学习,就是让机器能像人一样进行学习,这就突破了符号模式匹配的限制。例如在符号系统中,数据中有 10 个小狗的照片,如果你提供的的照片在这个范围内,就能识别,否则就不能匹配,而在机器学习中,可以提取海量小狗照片进行特征提取,当提供一个范围外的小狗照片,只要特征符合,就能识别。
6、机器学习分为有监督和无监督,就像小朋友学习一样,找一个好的老师带着学,这就是有监督;让小朋友自己不断试错和观察,找到规律的学习方式就是无监督。对应到机器学习中,有监督就需要对数据足够了解,知道什么样的输入能产生什么样的输出,就像老师对所有知识都了如指掌一样;无监督我们只需要提供数据和算法,让机器自己去寻找内在联系和规律,数据量越大,结果越好。2015 年名震一时的 AlphaGo 就是通过无监督来进行学习的。
7、思考:我们现在做的低代码产品,在项目实施过程中,不同经验的人达到同样的业务目的,采用的方式可能完全不同,那是否能将这些经验让机器进行学习,通过自然语言进行场景描述,就能给出一个最优解呢?而对于相对确定的内容,比如特定故障的处理方式,就可以使用模式匹配的方式给出明确答案。
8、上面提到的有监督、无监督是学习的方式,在具体学习时还是需要根据不同场景使用不同的算法,常见的算法有下面这些:
- 决策树:是一系列指引帮助你做决定的流程,如游戏中的选项。例如:外出玩要穿什么衣服?如果天气热就穿T恤短裤,如果下雨就穿雨衣雨鞋,天气凉快就穿件夹克。这就是一个简单的决策树。常用于数据挖掘、机器学习中的分类和回归问题。
- k最近邻:找到最相似的 k 个同伴,然后看看他们的决定,你也做同样的决定。例如:不知道周末去玩什么,找 k 个最好的朋友问问他们周末的计划,然后你也去做类似的活动。主要用于分类问题。
- k均值聚类:把相似的项划分到同一个组中。例如:小朋友有 10 个糖果,可以通过观察糖果的颜色、形状等属性,将相似的糖果放在一组中,最终将10个糖果分成多组。它用于无监督学习的聚类问题。
- 回归分析:找到两件事之间的对应关系。例如:通过测量小学生的身高和年龄:建立年龄与身高的对应模型,可以预测某个年龄的孩子大概的身高。它适用于回归和预测问题。
- 朴素贝叶斯:通过统计学计算,对未知事物进行概率预测。例如,对于一篇文章,如果出现了与体育相关的单词,那么朴素贝叶斯算法就会认为这篇文章属于体育类别的概率更高。
9、书中还提到一个重要的机器学习算法:人工神经网络,它模拟了人类神经系统的结构和工作原理,能够学习和处理复杂的数据。人工神经网络分为三层,下面用一个例子来解释下这三个层级:
假设我们要训练一个人工神经网络来识别手写数字。
- 输入层:将数字图片输入到神经网络的输入层,输入层会将每个像素的值作为输入,传递给下一层隐藏层。
- 隐藏层:在隐藏层中,每个神经元都会对输入的像素进行各种处理和计算,提取特征。通过调整权重和偏置,隐藏层可以学习如何提取数字图片的特征,比如边缘、线条、圆弧等。
- 输出层:最后,神经网络会将隐藏层的输出传递到输出层,输出层会计算每个数字的概率,并输出概率最高的数字作为识别结果。
10、机器能够通过学习解决很多的问题,但要让人可以方便地和机器进行沟通,这就需要用到自然语言处理技术(NLP),NLP 是自然语言理解(NLU)和自然语言生成(NLG)的结合,一个输入,一个输出,结合起来就是 NLP 了。关于 NLP 书中提到了很多的挑战,现在 ChatGPT 都解决得很好,ChatGPT 可以很轻松地理解我们要表达的意思。
11、总的来说,这本书可以让我们了解到很多人工智能相关的很多概念,通俗易懂,也不需要有很强的背景知识,可以为后面进一步学习打下基础。