这文章记录一些关于计算机的知识,我觉得程序员应该可以看看,大部分都是抽象,我们在写代码或者在做程序的时候,不用在乎底层知识,我们只需要写,编译器会帮我们处理成想要的样子,我觉得硬件底层是很复杂的一个东西,它不仅仅是编程的逻辑判断,还有物理知识,电的知识,这篇文章是一个个抽象来理解计算机,所以我们不用关心底层什么 ALU,或者 计算等等。

视频

这篇文章不只是记录,也写包括我的理解,可能不是很对,有错误请给提 issues。

感谢CrashCourse 字幕组 以及 Crash Course 你们很棒.

计算机很擅长存放,整理,获取和处理大量数据,很适合上百万的商品的电商网站,或是存几十亿条健康记录,方便医生看。

想根据数据做决定呢?这是机器学习的本质

机器学习算法让计算机可以从数据中学习,然后自行做出预测和决定。

能自我学习的程序很有用,比如判断是不是垃圾邮件。

大多数计算机科学家会说,机器学习是为了实现人工智能这个更宏大目标的技术之一,人工智能简称 AI

机器学习和人工智能算法一般都很复杂。

概念

判断飞蛾是 “月蛾” 还是 “帝蛾” 。这叫 “分类” 。做分类的算法叫 “分类器”。

虽然我们可以用 照片和声音 来训练算法,很多算法会减少复杂性,把数据简化成 “特征” 。特征 是用来帮助 分类 的值。


对比之前的飞蛾分类例子,我们用两个特征:“翼展” 和 ”重量“,为了训练 ”分类器“ 做出好的预测,我们需要 ”训练数据“,为了得到数据,我们派昆虫学家到森林里收集 ”月蛾“ 和 “帝蛾”的数据,专家可以认出不同飞蛾,所以专家不只记录特征值,还会把种类也写上。

标记数据,因为只有两个特征,很容易用散点图把数据视觉化。

2023-05-19-16-45-12-182353a0-80e2-4d8b-84d7-4de975532754

但是散点图想完全区分两个组比较困难,所以机器学习算法登场,找出最佳区分。臂展小于45毫米的,很可能是帝蛾,可以再加一个条件,重量必须小于 .75 才算是帝蛾,这里我们预测是 “月蛾”

这个把决策空间,切成几个盒子的简单方法,可以用 决策树 来表示。

生成决策树的 机器学习算法

“决策树” 只是机器学习的一个简单例子,如今有数百种算法,而且新算法不断出现。一些算法甚至用多个 “决策树” 来预测。

也有不用树的方法,比如 “支持向量机” 本质上是用任意线段来切分 “决策空间” 。

2023-05-19-17-19-24-61d5ead0-cb2b-4fed-b68b-22748f78b9b6

不一定是直线,可以是多项式或其他数学函数,就像之前,机器学习算法负责,找出最好的线,最准的决策边界

2023-05-19-17-26-10-1c7028d7-cd6b-4910-b248-638bddf9aa38

如果加第3个特征,比如 “触角长度”,那么 2D 线段,会变成 3D平面,

2023-05-19-17-25-39-e96e4c54-e467-429e-a51c-bf22460b2aae-1684638298975

在三个维度上做决策边界。

这些平面不必是直的,真正有用的分类器会有很多飞蛾种类

2023-05-19-17-34-32-cc931a69-f5f5-49de-9ab6-e5eeb7a8a4b3

成百上千的特征,但这正是机器学习要面临的问题,

在上千维度的决策空间,给超平面(Hyperplane)找出一个方程吗?但机器学习算法可以做到。
2023-05-19-17-36-33-f3b84446-3751-40b8-8031-a1b532a78974

谷歌,facebook,微软,和亚马逊的计算机里,整天都在跑这些算法。

决策树 和 支持向量机 这样的技术发源自统计学

一大类机器学习算法用了统计学,但也有不用统计学的算法,其中值得注意的是 人工神经网络 灵感来自大脑的神经元。


训练更复杂的网络,需要更多的计算量和数据。

谷歌,facebook,展示了深度神经网络,在照片识别人脸的准确率,和人一样高。

这是个巨大的里程碑

现在有深层神经网络开车,翻译,诊断医疗状况等,这些算法非常复杂,但还不够“聪明”

它们只能做一件事,分类飞蛾,找人脸,翻译。

这种 AI 叫 “弱AI” 或 “窄AI” ,只能做特定任务


强AI

像人一样聪明的 AI,目前没人能做出来,接近人类智能的 AI

ChatGPT 我希望在有生之年能有 强AI 的出现,解决人类的问题。