AI的“智商”咋算?别拿人类标准瞎比(1/2)

咱们平时总说“这人智商高”“那人智商120”,那你有没有想过,ai这玩意儿到底有没有“智商”?要是有的话,又该咋算呢?能不能跟说人一样,说“这个ai智商120,比人还聪明”?其实啊,ai的“智商”跟咱们人类的智商压根不是一回事,真没法这么比。这一章就用大白话跟你掰扯掰扯,ai的“智商”到底是怎么回事。

一、先搞懂核心疑问:ai的“智商”能跟人比吗?

生活里,咱们判断一个人聪明不聪明,常常用“智商(iq)”这个词。比如考试成绩好,大家可能会说“这孩子智商高”;遇到复杂问题能快速解决,也会觉得“这人智商在线”。而且人类的智商有统一的衡量方式,最后能得出一个具体的分数,像100左右是平均水平,120就算比较优秀了。

那ai呢?现在ai到处都是,语音助手能跟你聊天,推荐算法能给你推喜欢的视频,图像识别能认出照片里的人。这么看来,ai好像也挺“聪明”的,那它的“智商”该咋定义、咋计算?是不是也能整个分数,比如给chatgpt打个130,给计算器打个60?

答案很明确:不能。ai的“智商”和人类的智商完全是两套逻辑,根本没法放在一起比。人类的智商是一种综合能力,能应对各种不同的事儿;但ai的“智商”特别“偏科”,只在特定领域有用。所以千万别再问“ai智商多少,比人聪明吗”这种问题了,问出口就说明还没搞懂ai“智商”的本质。

二、ai“智商”咋衡量?看任务,不看分数

人类智商靠考试得分数,ai“智商”可没这一套。它的衡量标准特别实在,就看它能不能把该干的活儿干好,而且不同任务有不同的评判办法,没有统一的“ai智商分数表”。具体来说,主要看三个方面,每个方面都有实实在在的例子,一看就懂。

(一)核心标准:能不能完成任务

对ai来说,“聪明”的第一标准就是“能把活儿干完、干明白”。不管是语音识别、推荐商品,还是识别图片,只要能顺利完成对应的任务,那它的“智商”在这个领域就算过关;要是任务都完不成,再吹得天花乱坠也没用。

例子1:语音识别ai的“智商”——看准确率

咱们平时用的语音转文字功能,比如微信发语音时的“转文字”,或者输入法里的语音输入,背后都是语音识别ai在工作。衡量这个ai“智商”高不高,不用搞复杂测试,就看它转文字的准确率。

比如你说一段话,ai能把95%的内容准确转成文字,只有个别词出错;另一个ai只能转对90%,还经常把“吃饭”转成“吃放”、“上班”转成“上斑”。那很明显,准确率95%的ai,在语音识别这件事上“智商更高”。

为啥看准确率?因为语音识别的核心任务就是“把声音变成正确的文字”,准确率越高,说明它越能理解人类的语音,越能完成核心任务。要是准确率低,你说十句话它错五句,那这个ai基本没法用,自然算不上“聪明”。

例子2:推荐算法的“智商”——看点击率

你刷短视频时,平台总给你推你喜欢的内容;逛购物app时,首页总出现你可能想买的东西,这些都是推荐算法在“发力”。衡量推荐算法的“智商”,关键就看它推荐的东西你愿不愿意点、愿不愿意买。

比如有两个推荐算法a和b。算法a给你推的视频,你十有八九会点进去看,甚至看完还想刷下一个;推的商品,你看着觉得“正好需要”,时不时就会下单。算法b呢?推的视频要么是你不感兴趣的领域,要么是画质差的内容,你划两下就跳过;推的商品要么太贵,要么根本不是你需要的,看都不想看。

这时候,算法a的“点击率”(用户点击推荐内容的比例)肯定比算法b高,那算法a的“智商”就更高。因为推荐算法的核心任务是“找到用户喜欢的内容或商品”,点击率高,说明它更懂你的需求,完成任务的能力更强。

(二)重要标准:能不能适应变化

光能完成固定任务还不够,要是遇到一点变化就“懵圈”,那ai的“智商”也不算高。真正“聪明”的ai,在任务场景变了之后,还能准确完成工作,也就是能“适应变化”。

最典型的例子就是图像识别里的“识别猫”。假设一个ai平时训练时,看的都是“正常的猫”——比如不戴任何装饰、成年的家猫,它能准确认出来。但现实里的猫千奇百怪:有的猫戴了小帽子,有的猫是刚出生的小猫崽,有的猫还穿了小衣服,还有的猫毛发颜色特别罕见。

要是这个ai遇到“戴帽子的猫”就认不出来,说“这不是猫”;看到小猫崽也犹豫,说“这可能是别的小动物”,那它的“智商”就不行。反之,要是不管猫戴不戴帽子、是大是小、穿不穿衣服,它都能准确说“这是猫”,那就说明它能适应不同场景下的变化,“智商”更高。

为啥这个标准重要?因为现实世界里没有“一成不变的任务”。比如语音识别,你平时说话可能很清楚,但感冒时声音沙哑,或者在嘈杂的菜市场说话,ai要是只能识别你清晰的声音,一遇到杂音或声音变化就出错,那它在实际生活里根本不好用。能适应变化,才说明ai的能力更“抗打”。

(三)基础标准:能不能少犯错

不管干啥活儿,犯错少的肯定比犯错多的“靠谱”,ai也一样。“少犯错”是衡量ai“智商”的基础标准,尤其是在那些对准确性要求高的任务里,比如写文章、做数据分析、识别危险品等。

就说ai写文章吧。现在有很多ai能帮人写文案、写报告、写小说。衡量这些ai“智商”的一个简单办法,就是看它写出来的内容里有没有错。比如有没有错别字?“的、地、得”用得对不对?句子是不是通顺?逻辑有没有问题?

比如ai a写的文章,从头到尾没一个错别字,句子通顺,逻辑也清晰——说“夏天适合去海边”,后面能接着说“海边能吹海风、踩沙滩,还能游泳”,前后能对上。ai b写的文章,时不时出现“夏夫”“海宾”这种错别字,句子还经常不通顺,比如“夏天适合去海边,因为冬天很冷”,逻辑完全混乱。那很明显,ai a犯错少,“智商”更高。

本章未完,点击下一页继续阅读。