书中自有黄金屋的时代正在到来

Author: 挨踢的牛魔王 | Origin link: wechat link

题图由AI生成

书中自有黄金屋的时代正在到来

一、AI解决的核心问题

随着chatGPT爆火以来,AI已经由一个科技话题变成了全民话题。

到现在为止,其实还不到 2年 时间,一会midjourney火了,一会Pika火了,一会Sora火了,一会作曲的AI火了,一会Kimi火了。

这个就把群众搞的很疑惑,到底AI解决了什么问题,能干啥,不能干啥,对我的工作生活有什么帮助,有什么威胁?

这波AI到底解决了什么问题呢?

下面短短几句话,就可以帮你搞明白,不需要你懂什么机器学习,计算机算法,数学理论。

AI并不神秘。

这波AI,简单的说,就是解决了 经验类问题

我们的生活中,有很多种问题需要解决,有两大类,是非常明确的。

一类,就是可以套公式的,有套路的,就是公理类的。

这类问题,人类已经搞清楚了,比如 勾股定理,火炮的轨迹,行星的运动,甚至量子力学 等等。

谁来,都是这一套固定的公式,固定的步骤下来,都能得出同样的结论。

小到自动售货机、洗衣机、冰箱,大到工厂的自动化,复杂的操作系统,深奥的数学计算软件,都是这么工作的。

就算是原子弹爆炸,一样是可以算出来的。

此图由AI生成

这一类的问题早就解决了,不就是我们现在用的计算机系统么?

现代电子计算机的起源,最初就是用来计算炮弹的运行轨迹的。

简单的说,就是让程序员把这些固定的套路输入到计算机中,以后就可以长期用了,自动的系统。

再复杂的系统,都是由程序员一行一行代码写出来的。

我们可以把以前传统的编程解决问题的方式叫做: 自动化。

但是,还有一类问题,长期无法得到解决,就是 经验类的 问题。

而现在AI解决这类经验类的问题的方式,我们可以叫: 智能化。

那么什么是 经验类 问题呢?

二、经验类问题

说到经验,这个并不能用几个公式总结,很难说清楚。

比如说写作,你一个新手,你写出来的就是不行。

但是经验丰富的写手,上来给你调整一下段落,增删几个词,感觉马上就不一样了。

你让他说出来,应该一步一步怎么做,就能做到他那样?

他说不出来,就是三个字:“ 凭感觉 ”。

你再问,他无非就说,要看天赋, 要练,唯手熟尔。

再比如说,认人,不管这个人穿什么衣服,什么发型,做什么动作,千变万化,你都能一样一眼能认出来。

尤其一些女生,这方面能力就过分的强了,别人明星在电影里面化妆成那样,完全看不出原来的样子。

她们都能一眼认出来,你们是孙悟空啊,火眼金睛。

但是,你说让她们总结一些公式、套路,她们也是总结不出来的。

再比如说,搞房子,哪里的房子能涨?

能不能给出一个城市,一个区域,一个小区,楼层,户型,就能算出来,这套房子就能涨?

你做梦。

这个都是要靠你看很多房子,经验丰富,然后到现场去看,前后走一下,就有个基本判断了。

这一类问题,就叫 经验类问题

没有公式的。

这个问题怎么解决呢?

当然是靠大量的数据,然后从数据中提取规律。

这个就是当前大语言模型做的事情。

所以,大语言模型,根本就解决不了我们上次说的, 计算三角形面积的问题。

比如说,你用通义千问,它最后算出来了。

其实它还是调用了程序员编写的一个计算程序来算的。

从这个角度,你就知道这波AI能做什么,不能做什么。

比如说,很多人在讨论,AI出现之后,程序员会不会失业?

程序员当然不会失业。

原因很简单啊,原来传统编程那个活,还是得程序员干。

现在又增加了一个活,就是AI,活更多了,程序员怎么会失业呢?

长期来看,不但不会失业,还要多招程序员。

为什么原来传统编程的活,还是程序员干呢?

因为两个字: 成本。

人类已经搞清规律的,你让程序员编写成程序不就完了,而且准确度是可以达到 100% 的。

这是多简单的解决方案。

你让AI去做,是很难达到 100%准确度 的,甚至有些根本就做不了。

你堆 几万张卡 的算力,再加一堆数据收集清洗的工作,花了 几个亿

就不如招几个程序员写写代码就搞定了。

各有各的擅长,何必舍近求远?

但是干经验类的活,AI就非常擅长,你就给它数据就可以了。

三、书中自有黄金屋

说到数据,那么问题就来了。

大家看这张图,这是群友画的,你看这幅图有什么问题?

其实并不是他的画法有问题,而是 AI的问题

你发现,这个AI画的人,根本就不像中国人,而是老外刻板印象中的中国人,眯眯眼,塌鼻梁、蜡黄的肤色;服饰,也不知道是哪个朝代的。

问题出在哪里呢?

因为在AI大模型中,中国的数据太少了,仅仅就占 1.3%左右

大量的都是老外的数据,那么当然会出现大量老外刻板印象中的中国人形象。

既然数据来源都是这样,你让AI画出一个地道的中国人形象,AI当然是画的不行的。

另外,就算中国的数据非常多,但是如果是让老外来 打标

他根本分不清中国人、韩国人、日本人的区别,他就瞎打标。

最后AI画出来的中国人,就看起来像韩国人。

什么叫打标呢?

就是打标签,比如给一张图片打上标签,AI才能理解,你这幅图到底描述的是什么。

比如,上面这幅“ 火之女 ”的图,标签是这样的。

打标打得不对,你AI是不可能画对的。

一说到打标,很多人可能就觉得AI不够智能,还需要人工来打标签。

其实早就有自动化的打标工具了,只是不能全部做对,还是需要人工进行细微的调整。

这个其实是人类和人工智能的概念对齐的工作。

比如说,如果这个世界上全是AI、机器人,它们可能并不管苹果叫苹果,或者apple。

AI骑士团群友用AI绘制


它们可能就是给一个编号,比如叫 00031E52AUY ,AI之间彼此沟通的时候一样用,完全不影响。

但是人类说苹果的时候,AI并不知道是什么,只有人类说这个编号 00031E52AUY 的时候,它才能给你画一个苹果。

你既然要让人工智能接受人类的概念,你当然就要告诉它,苹果和图片的对应关系了。

很多人想学人工智能模型的训练,其实最难的并不是操作的那部分。

操作的那部分,完全是一个技术问题,自然有理工科来解决。

尤其图像那部分,已经非常成熟了。

要保证正确性,难度其实就是在 打标

比如,你要做一个古代服饰的模型,请问,明朝的服饰和宋朝的服饰有什么区别,隋朝和唐朝的服饰有什么区别?

你自己都不知道有什么区别,那你训练出来的模型就是大垃圾,根本就不能用。

很多人都有一些不赚钱的爱好,比如说摄影、画画、历史、小说等等。

还有人喜欢研究历朝历代的甲胄,兵器,比如陌刀等等。

以前也是没用,但是在智能时代,那可是有大用了。

你能辨别出来各种图片里面细微的区别,文字里面的各种区别,那你训练出来的模型才会更准确。

那些搞人工智能的公司,现在还是在做比较简单的打标。

以后,肯定是要找一些精通这行的人过来帮忙看的。

有个群友说,自己是玩单反的,我第一反应是,这个技能将来对于搞模型训练,那是有极大帮助的。

你训练自己的图片模型,就是需要好的照片啊,而且不止一张,是要远景,中景,近景,各个角度,才能把图片模型训练出来。

你摄影技术越好,模型就训练的越好。

中国目前的数据在世界上的数据集中,只占区区 1.3% ,这块是大有所有为的。

这个不是未来的事情,而是现在正在发生的事情。

比如你要做一组敦煌的大模型,你要么花钱去敦煌拍,要么就去花钱买。

以前没人搞数据,那是没人付钱,智能时代,这些就都值钱了。

书中自有黄金屋。

文化是巨大的壁垒,中国的东西,只有中国人才能真正做好。

四、结语

科举,本质是一种权力分配制度,而不是一种教育制度。

正是因为科举的这个属性,所以,才有“书中自有黄金屋”的说法。

本质上,不是“书”值钱,而是官位值钱。

但是,现在,数据是真的变得越来越值钱了。

那才是真正的“书中自有黄金屋”。


这就是我以前讲的“算力是新的石油,数据是新的金矿”。

--------------------

通知一下,最近AI实操课程更新了,这两周AI绘画就要更新完了。

前面报名的一定要加小助理的微信号进群: nymeria0

因为进群了,才会给你发我们赠送的 新手福利包 ,比如 绘画次数 等等。

对,我们抽取了一些研发的力量,专门做了一个大家练习AI的平台。

无论是线上还是线下,见过的都觉得不错,极度适合入门。

报名二维码在此,价格还是 365元 ,没涨价。

欢迎加入AI骑士团。

如果对你有启发,请点个关注或者“在看”吧。

老读者建议“星标”,没有任何互动,系统可能不会在第一时间推送给你